Daniilak - Личный блог

Промпт:

29.01.2023

Промпт: icon of all holy engineers and scientific researchers, together with their scientific instruments

Украли ссылку на тг канал, с боем вернул

29.01.2023

Украли ссылку на тг канал, с боем вернул

Кейсы

Установка Debian сервера: Nginx, Python, PostgreSQL, PHP

13.07.2022

Эта статья нужна мне самому, чтобы не забывать что нужно поставить и вообще что делать. Ниже простой список команд после того как вы попали в root Обновление пакетов apt updateapt upgrade Установка пакетов apt install zsh git wget curl tmux sudo python3 nginx htop sudo nginx apt install python3-pip...

Статьи

Почему шестиугольники?

27.06.2022

Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы избирательных округов или...

Статьи

Подсчет количества файлов в папке в Linux

17.05.2022

Вот несколько способов подсчитать количество файлов в каталоге в командной строке Linux. Мы предполагаем, что вы знаете о команде wc для подсчета количества строк. Мы можем использовать ту же команду wc с командой ls для подсчета количества файлов в каталоге. Эта задача кажется простой, но вскоре...

Статьи

История науки о данных

29.04.2022

Существует много разных дат и временных рамок, которые можно использовать для отслеживания медленного роста науки о данных и ее текущего влияния на индустрию управления данными, некоторые из наиболее важных из них описаны ниже. В 1974 году Питер Наур написал «Краткий обзор компьютерных методов»,...

Статьи

Джон Тьюки

29.04.2022

Более 50 лет назад Джон Тьюки призвал к реформированию академической статистики. В «Будущем анализа данных» он указал на существование пока еще непризнанной науки, предметом интереса которой было обучение на основе данных или «анализ данных». Десять-двадцать лет назад Джон Чемберс, Билл Кливленд и...

Кейсы

Датасеты

01.02.2022

В мире, когда появилось множетсво данных, больше времени занимает поиск и обработка необходимой для бизнеса информации. До сих пор существовала проблема поиска датасетов в Рунете. Каталог каталогов открытых данных DataCatalogs.ru (создан на базе https://github.com/infoculture/awesome-opendata-rus)...

Кейсы

Поиск похожих изображений в PostgreSQL через ImgSmlr

13.12.2021

Ссылка на GitHub репотизорий ImgSmlr - это расширение PostgreSQL, которое реализует функцию поиска похожих изображений. Метод ImgSmlr основан на вейвлет-преобразовании Хаара. Цель ImgSmlr не в том, чтобы предоставить самые современные методы поиска похожих изображений. ImgSmlr был написан как...

Статьи

Что такое Random Forest?

13.10.2021

При выборе модели машинного обучения нет доминирующего алгоритма. Некоторые лучше работают с большими наборами данных, а некоторые лучше работают с данными большого размера. Таким образом, важно оценить эффективность модели для вашего конкретного набора данных. В этом подразделе рассматривается...

Кейсы

Гиперпараметры в машинном обучении

13.10.2021

Выбор архитектуры нейронной сети заключается в подборе гиперпараметров. Cбор большего количества данных и разработка функций обычно дает наибольшую отдачу с точки зрения затраченного времени по сравнению с улучшением производительности, но когда уже все источники данных переработаны по-максимуму,...

Статьи

Что такое глубокое обучение?

13.10.2021

Глубокое обучение относится к определенным типам машинного обучения, но точное определение найти сложно. Этот термин был придуман примерно в 2006 году, но различные формы изучались с тех пор, как машинное обучение возникло как область исследований [1]. Это часто связано с нейронными сетями, в...

← Назад

1...132 133134135 136...138

Вперед →