Установка Debian сервера: Nginx, Python, PostgreSQL, PHP
Кейсы

Установка Debian сервера: Nginx, Python, PostgreSQL, PHP

13.07.2022

Эта статья нужна мне самому, чтобы не забывать что нужно поставить и вообще что делать. Ниже простой список команд после того как вы попали в root Обновление пакетов apt updateapt upgrade Установка пакетов apt install zsh git wget curl tmux sudo python3 nginx htop sudo nginx apt install python3-pip...

Читать далее
Почему шестиугольники?
Статьи

Почему шестиугольники?

27.06.2022

Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы избирательных округов или...

Читать далее
Подсчет количества файлов в папке в Linux
Статьи

Подсчет количества файлов в папке в Linux

17.05.2022

Вот несколько способов подсчитать количество файлов в каталоге в командной строке Linux. Мы предполагаем, что вы знаете о команде wc для подсчета количества строк. Мы можем использовать ту же команду wc с командой ls для подсчета количества файлов в каталоге. Эта задача кажется простой, но вскоре...

Читать далее
История науки о данных
Статьи

История науки о данных

29.04.2022

Существует много разных дат и временных рамок, которые можно использовать для отслеживания медленного роста науки о данных и ее текущего влияния на индустрию управления данными, некоторые из наиболее важных из них описаны ниже. В 1974 году Питер Наур написал «Краткий обзор компьютерных методов»,...

Читать далее
Статьи

Джон Тьюки

29.04.2022

Более 50 лет назад Джон Тьюки призвал к реформированию академической статистики. В «Будущем анализа данных» он указал на существование пока еще непризнанной науки, предметом интереса которой было обучение на основе данных или «анализ данных». Десять-двадцать лет назад Джон Чемберс, Билл Кливленд и...

Читать далее
Датасеты
Кейсы

Датасеты

01.02.2022

В мире, когда появилось множетсво данных, больше времени занимает поиск и обработка необходимой для бизнеса информации. До сих пор существовала проблема поиска датасетов в Рунете. Каталог каталогов открытых данных DataCatalogs.ru (создан на базе https://github.com/infoculture/awesome-opendata-rus)...

Читать далее
Поиск похожих изображений в PostgreSQL через ImgSmlr
Кейсы

Поиск похожих изображений в PostgreSQL через ImgSmlr

13.12.2021

Ссылка на GitHub репотизорий ImgSmlr - это расширение PostgreSQL, которое реализует функцию поиска похожих изображений. Метод ImgSmlr основан на вейвлет-преобразовании Хаара. Цель ImgSmlr не в том, чтобы предоставить самые современные методы поиска похожих изображений. ImgSmlr был написан как...

Читать далее
Что такое Random Forest?
Статьи

Что такое Random Forest?

13.10.2021

При выборе модели машинного обучения нет доминирующего алгоритма. Некоторые лучше работают с большими наборами данных, а некоторые лучше работают с данными большого размера. Таким образом, важно оценить эффективность модели для вашего конкретного набора данных. В этом подразделе рассматривается...

Читать далее
Гиперпараметры в машинном обучении
Кейсы

Гиперпараметры в машинном обучении

13.10.2021

Выбор архитектуры нейронной сети заключается в подборе гиперпараметров. Cбор большего количества данных и разработка функций обычно дает наибольшую отдачу с точки зрения затраченного времени по сравнению с улучшением производительности, но когда уже все источники данных переработаны по-максимуму,...

Читать далее
Что такое глубокое обучение?
Статьи

Что такое глубокое обучение?

13.10.2021

Глубокое обучение относится к определенным типам машинного обучения, но точное определение найти сложно. Этот термин был придуман примерно в 2006 году, но различные формы изучались с тех пор, как машинное обучение возникло как область исследований [1]. Это часто связано с нейронными сетями, в...

Читать далее