Статьи

Отравление данных (data poisoning)

07.08.2024

Отравление данных (data poisoning) — это атака на машинное обучение, во время которой злоумышленник вводит вредоносные данные в обучающий набор для нарушения работы алгоритма обучения и снижения его эффективности. Некоторые примеры таких атак: — Внесение шума (Noise Injection): добавление случайных...

Читать далее
Сравнение обработки данных на Python
Статьи

Сравнение обработки данных на Python

07.08.2024

Симпатичный бенчмарк сравнений обработки данных на Python с использованием чистого Python и разных библиотек. Безоговорочный лидер Duckdb и близкий к нему по скорости Polars, но всё равно отстающий. Вполне ожидаемо, от Duckdb многие в восторге именно из-за комбинаций скорости и функций. Причём в...

Читать далее
Статьи

Карпатый готовит большой курс по LLM – LLM101n: Let's build a Storyteller

07.08.2024

Андрей будет учить с нуля и буквально всему - архитектуре, подготовке датасетов, тюнингу, оптимизации, фреймворкам (PyTorch+Jax), CUDA. На выходе у студентов получится что-то похожее на ChatGPT, только написанное абсолютно с нуля. Такое ему не в первой, он вместе со своим профом Ли Фей-Фей создал и...

Читать далее
Статьи

ИИ в юридическом деле

07.08.2024

нейронка выстрелит в хоть в каком кринжовом деле. И дело нашлось - А67-150/2024- о защите деловой репутации. С помощью нейронки наклепали статьи, разместили на сайте, истец оскорбился и пошел судиться, а точнее устанавливать факт, имеющий юридическое значение. Почему? Потому что идентифицировать...

Читать далее
Статьи

Почему краткие сообщения не указывают на неграмотность

07.08.2024

Если человек пишет несколько коротких и обрывистых сообщений подряд, это вовсе не означает, что он неграмотен. Такая тенденция обусловлена множеством причин, связанных как с техническими аспектами, так и с современными привычками общения: Психологически тяжело воспринимать большой объем текста....

Читать далее
Статьи

Восемь принципов открытых данных

07.08.2024

В 2007 году произошло важное событие, связанное с открытыми данными. На конференции в Себастополе, в штате Калифорния, группа экспертов по данным сформулировала восемь принципов открытых данных, вот они сверху вниз: Полнота: данные должны быть представлены в максимально полном виде, за исключением...

Читать далее
Статьи

uv — очень быстрый pip на стероидах с большими абмициями

07.08.2024

Пост будет особенно полезным, если раньше не сталкивались с pip-tools uv — это новый и полезный уже сейчас инструмент от компании Astral, которая раньше сделала Ruff (https://github.com/astral-sh/ruff). Долгосрочная цель авторов очень амбициозная -- сделать uv единым инструментом для работы с...

Читать далее
Статьи

Как правильно проектировать видеокамеры для систем видеонаблюдения

07.08.2024

Правильное проектирование системы видеонаблюдения- 80% успеха в проведение расследований с ее использованием. Ведь важно понимать, в каких местах будет уместна обзорная камера, показывающая общую картину происходящего, в каких видеокамера для идентификации лиц или номеров автомобилей, а в каких...

Читать далее
Статьи

Сравнение авторизации через ВКонтакте и через Телеграм

07.08.2024

Добавление авторизации на сайте через Telegram Widget не очень удобно для пользователей по сравнению с авторизацией через ВКонтакте Дело в том, что пользователи Telegram в основном используют приложение, и им приходится заново авторизовываться по номеру телефона в браузере. Это может показаться...

Читать далее
Telegram — лонгриды

Публикую сравнительную статистику на 03 августа 2024 года относительно предыдущих данных (март 2024...

04.08.2024

Публикую сравнительную статистику на 03 августа 2024 года относительно предыдущих данных (март 2024 года) по справочной информации Росреестра по Чебоксарам: - 94456 кадастровых объектов. - Новых кадастровых объектов относительно предыдущей выгрузки — 1626 штук. Некоторые поля у кадастровых адресов...

Читать далее