-
Установка Debian сервера: Nginx, Python, PostgreSQL, PHP
Эта статья нужна мне самому, чтобы не забывать что нужно поставить и вообще что делать. Ниже простой список команд после того как вы попали в root Обновление пакетов apt updateapt upgrade Установка пакетов…
-
Почему шестиугольники?
Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы…
-
Подсчет количества файлов в папке в Linux
Вот несколько способов подсчитать количество файлов в каталоге в командной строке Linux. Мы предполагаем, что вы знаете о команде wc для подсчета количества строк. Мы можем использовать ту же команду wc с командой…
-
История науки о данных
Существует много разных дат и временных рамок, которые можно использовать для отслеживания медленного роста науки о данных и ее текущего влияния на индустрию управления данными, некоторые из наиболее важных из них описаны ниже.…
-
Джон Тьюки
Более 50 лет назад Джон Тьюки призвал к реформированию академической статистики. В «Будущем анализа данных» он указал на существование пока еще непризнанной науки, предметом интереса которой было обучение на основе данных или «анализ…
-
Датасеты
В мире, когда появилось множетсво данных, больше времени занимает поиск и обработка необходимой для бизнеса информации. До сих пор существовала проблема поиска датасетов в Рунете. Вы можете предложить новый источник данных в каталог…
-
Поиск похожих изображений в PostgreSQL через ImgSmlr
Ссылка на GitHub репотизорий ImgSmlr — это расширение PostgreSQL, которое реализует функцию поиска похожих изображений. Метод ImgSmlr основан на вейвлет-преобразовании Хаара. Цель ImgSmlr не в том, чтобы предоставить самые современные методы поиска похожих изображений. ImgSmlr…
-
Гиперпараметры в машинном обучении
Выбор архитектуры нейронной сети заключается в подборе гиперпараметров. Cбор большего количества данных и разработка функций обычно дает наибольшую отдачу с точки зрения затраченного времени по сравнению с улучшением производительности, но когда уже все…
-
Что такое Random Forest?
При выборе модели машинного обучения нет доминирующего алгоритма. Некоторые лучше работают с большими наборами данных, а некоторые лучше работают с данными большого размера. Таким образом, важно оценить эффективность модели для вашего конкретного набора…
-
Что такое глубокое обучение?
Глубокое обучение относится к определенным типам машинного обучения, но точное определение найти сложно. Этот термин был придуман примерно в 2006 году, но различные формы изучались с тех пор, как машинное обучение возникло как…