• Статьи

    Почему шестиугольники?

    Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы…

  • Статьи

    Подсчет количества файлов в папке в Linux

    Вот несколько способов подсчитать количество файлов в каталоге в командной строке Linux. Мы предполагаем, что вы знаете о команде wc для подсчета количества строк. Мы можем использовать ту же команду wc с командой…

  • Статьи

    История науки о данных

    Существует много разных дат и временных рамок, которые можно использовать для отслеживания медленного роста науки о данных и ее текущего влияния на индустрию управления данными, некоторые из наиболее важных из них описаны ниже.…

  • Статьи

    Джон Тьюки

    Более 50 лет назад Джон Тьюки призвал к реформированию академической статистики. В «Будущем анализа данных» он указал на существование пока еще непризнанной науки, предметом интереса которой было обучение на основе данных или «анализ…

  • Кейсы

    Датасеты

    В мире, когда появилось множетсво данных, больше времени занимает поиск и обработка необходимой для бизнеса информации. До сих пор существовала проблема поиска датасетов в Рунете. Вы можете предложить новый источник данных в каталог…

  • Кейсы

    Поиск похожих изображений в PostgreSQL  через ImgSmlr

    Ссылка на GitHub репотизорий ImgSmlr — это расширение PostgreSQL, которое реализует функцию поиска похожих изображений. Метод ImgSmlr основан на вейвлет-преобразовании Хаара. Цель ImgSmlr не в том, чтобы предоставить самые современные методы поиска похожих изображений. ImgSmlr…

  • Кейсы

    Гиперпараметры в машинном обучении

    Выбор архитектуры нейронной сети заключается в подборе гиперпараметров. Cбор большего количества данных и разработка функций обычно дает наибольшую отдачу с точки зрения затраченного времени по сравнению с улучшением производительности, но когда уже все…

  • Статьи

    Что такое Random Forest?

    При выборе модели машинного обучения нет доминирующего алгоритма. Некоторые лучше работают с большими наборами данных, а некоторые лучше работают с данными большого размера. Таким образом, важно оценить эффективность модели для вашего конкретного набора…

  • Статьи

    Что такое глубокое обучение?

    Глубокое обучение относится к определенным типам машинного обучения, но точное определение найти сложно. Этот термин был придуман примерно в 2006 году, но различные формы изучались с тех пор, как машинное обучение возникло как…