Статьи

Почему объявления об аренде недвижимости на популярных площадках - это фейк?

07.08.2024

Большинство объявлений об аренде недвижимости на популярных площадках, таких как Avito, ЦИАН и других, являются фейковыми. Создание таких объявлений обусловлено потребностью в лидогенерации для риелторов. При этом, данные сливаются сразу тысячам риелторам, а иногда и больше. Когда пользователь...

Читать далее
«гарантия трудоустройства» в рекламе курсов по программированию — это фейк и обман
Статьи

«гарантия трудоустройства» в рекламе курсов по программированию — это фейк и обман

07.08.2024

Никто не может гарантировать трудоустройство, а в случае его отсутствия — возврат денежных средств в полном объеме. Привожу отрывки из договоров платных образовательных курсов, где указаны специальные условия, согласно которым вы, даже не найдя работу, будете считаться трудоустроенным Письменное...

Читать далее
Статьи

Отравление данных (data poisoning)

07.08.2024

Отравление данных (data poisoning) — это атака на машинное обучение, во время которой злоумышленник вводит вредоносные данные в обучающий набор для нарушения работы алгоритма обучения и снижения его эффективности. Некоторые примеры таких атак: — Внесение шума (Noise Injection): добавление случайных...

Читать далее
Сравнение обработки данных на Python
Статьи

Сравнение обработки данных на Python

07.08.2024

Симпатичный бенчмарк сравнений обработки данных на Python с использованием чистого Python и разных библиотек. Безоговорочный лидер Duckdb и близкий к нему по скорости Polars, но всё равно отстающий. Вполне ожидаемо, от Duckdb многие в восторге именно из-за комбинаций скорости и функций. Причём в...

Читать далее
Статьи

Карпатый готовит большой курс по LLM – LLM101n: Let's build a Storyteller

07.08.2024

Андрей будет учить с нуля и буквально всему - архитектуре, подготовке датасетов, тюнингу, оптимизации, фреймворкам (PyTorch+Jax), CUDA. На выходе у студентов получится что-то похожее на ChatGPT, только написанное абсолютно с нуля. Такое ему не в первой, он вместе со своим профом Ли Фей-Фей создал и...

Читать далее
Статьи

ИИ в юридическом деле

07.08.2024

нейронка выстрелит в хоть в каком кринжовом деле. И дело нашлось - А67-150/2024- о защите деловой репутации. С помощью нейронки наклепали статьи, разместили на сайте, истец оскорбился и пошел судиться, а точнее устанавливать факт, имеющий юридическое значение. Почему? Потому что идентифицировать...

Читать далее
Статьи

Почему краткие сообщения не указывают на неграмотность

07.08.2024

Если человек пишет несколько коротких и обрывистых сообщений подряд, это вовсе не означает, что он неграмотен. Такая тенденция обусловлена множеством причин, связанных как с техническими аспектами, так и с современными привычками общения: Психологически тяжело воспринимать большой объем текста....

Читать далее
Статьи

Восемь принципов открытых данных

07.08.2024

В 2007 году произошло важное событие, связанное с открытыми данными. На конференции в Себастополе, в штате Калифорния, группа экспертов по данным сформулировала восемь принципов открытых данных, вот они сверху вниз: Полнота: данные должны быть представлены в максимально полном виде, за исключением...

Читать далее
Статьи

uv — очень быстрый pip на стероидах с большими абмициями

07.08.2024

Пост будет особенно полезным, если раньше не сталкивались с pip-tools uv — это новый и полезный уже сейчас инструмент от компании Astral, которая раньше сделала Ruff (https://github.com/astral-sh/ruff). Долгосрочная цель авторов очень амбициозная -- сделать uv единым инструментом для работы с...

Читать далее
Статьи

Как правильно проектировать видеокамеры для систем видеонаблюдения

07.08.2024

Правильное проектирование системы видеонаблюдения- 80% успеха в проведение расследований с ее использованием. Ведь важно понимать, в каких местах будет уместна обзорная камера, показывающая общую картину происходящего, в каких видеокамера для идентификации лиц или номеров автомобилей, а в каких...

Читать далее
Статьи

Сравнение авторизации через ВКонтакте и через Телеграм

07.08.2024

Добавление авторизации на сайте через Telegram Widget не очень удобно для пользователей по сравнению с авторизацией через ВКонтакте Дело в том, что пользователи Telegram в основном используют приложение, и им приходится заново авторизовываться по номеру телефона в браузере. Это может показаться...

Читать далее
Почему шестиугольники?
Статьи

Почему шестиугольники?

27.06.2022

Агрегация случайных точечных данных в регулярные сетки используется по многим причинам, в частности для нормирования географии для нанесения на карту или для уменьшения неоднородности при использовании полигонов неправильной формы, созданных произвольно (например, границы избирательных округов или...

Читать далее
Подсчет количества файлов в папке в Linux
Статьи

Подсчет количества файлов в папке в Linux

17.05.2022

Вот несколько способов подсчитать количество файлов в каталоге в командной строке Linux. Мы предполагаем, что вы знаете о команде wc для подсчета количества строк. Мы можем использовать ту же команду wc с командой ls для подсчета количества файлов в каталоге. Эта задача кажется простой, но вскоре...

Читать далее
История науки о данных
Статьи

История науки о данных

29.04.2022

Существует много разных дат и временных рамок, которые можно использовать для отслеживания медленного роста науки о данных и ее текущего влияния на индустрию управления данными, некоторые из наиболее важных из них описаны ниже. В 1974 году Питер Наур написал «Краткий обзор компьютерных методов»,...

Читать далее
Статьи

Джон Тьюки

29.04.2022

Более 50 лет назад Джон Тьюки призвал к реформированию академической статистики. В «Будущем анализа данных» он указал на существование пока еще непризнанной науки, предметом интереса которой было обучение на основе данных или «анализ данных». Десять-двадцать лет назад Джон Чемберс, Билл Кливленд и...

Читать далее
Что такое Random Forest?
Статьи

Что такое Random Forest?

13.10.2021

При выборе модели машинного обучения нет доминирующего алгоритма. Некоторые лучше работают с большими наборами данных, а некоторые лучше работают с данными большого размера. Таким образом, важно оценить эффективность модели для вашего конкретного набора данных. В этом подразделе рассматривается...

Читать далее
Что такое глубокое обучение?
Статьи

Что такое глубокое обучение?

13.10.2021

Глубокое обучение относится к определенным типам машинного обучения, но точное определение найти сложно. Этот термин был придуман примерно в 2006 году, но различные формы изучались с тех пор, как машинное обучение возникло как область исследований [1]. Это часто связано с нейронными сетями, в...

Читать далее
Основные критерии подходов к машинному обучению
Статьи

Основные критерии подходов к машинному обучению

13.10.2021

Существует несколько основных категорий подходов к машинному обучению: Обучение с учителем: в обучении с учителем алгоритмы описывают взаимосвязь между входными переменными или векторами входных данных и наблюдаемыми результатами и применяют их к новым входным данным для прогнозирования результата....

Читать далее
Различия в методологиях моделирования машинного обучения
Статьи

Различия в методологиях моделирования машинного обучения

13.10.2021

Машинное обучение (ML) - это тип искусственного интеллекта, который упрощенно можно определить как: системы учатся на основе прошлого, чтобы предсказывать будущее [1]. Алгоритмы используются для «изучения» взаимосвязи между переменными данных. Другое определение гласит: «Алгоритм машинного обучения...

Читать далее
Список тем по дисциплине "Как надо работать над диссертацией"
Статьи

Список тем по дисциплине "Как надо работать над диссертацией"

08.10.2021

Методы работы с научной литературойОбщая композиция текста.Движение глаз при чтении.Условия успешности чтения.Приемы концентрированного вниманияПриемы овладения техникой чтенияТри вида просмотра научной литературыНедостатки традиционных методов чтенияСемь золотых правил быстрого чтенияВиды...

Читать далее
tmux команды и читы
Статьи

tmux команды и читы

07.10.2021

tmux shortcuts & cheatsheet Создать новый tmux: tmux Создать новую сессию tmux с названием: tmux new -s myname Присоединиться к сессии: tmux a # (или at, или attach) Присоединиться по имени: tmux a -t myname Показать список сессий: tmux ls Убить сессию: tmux kill-session -t myname Убить все сессии:...

Читать далее
Удаление неудаляемых программ
Статьи

Удаление неудаляемых программ

01.10.2021

Бывает не удаётся удалить программы через "Установку и удаление программ". Помогают uninstaller'ы, можно воспльзоваться geekuninstaller - программа для удаления неудаляемых программ, есть бесплатная лицензия для личного использования. Удаляет как классические программы, так и приложения из Windows...

Читать далее
Что такое data driven design?
Статьи

Что такое data driven design?

01.10.2021

Data-Driven Design (англ. "Дизайн, управляемый данными") - разработка продукта на основе результатов аналитических исследований. Во главу ставится достижение определенных метрик. Дизайн-решения принимается не из опыта, вкуса или интуиции дизайнера, а основывается на результаты тестов и проверок...

Читать далее
Проектирование URL + REST
Статьи

Проектирование URL + REST

01.10.2021

URL (англ. Uniform Resource Locator) - единообразный определитель местонахождения ресурса Структура URL :[//[:@][:]][/][?][#]схемасхема обращения к ресурсу; в большинстве случаев имеется в виду сетевой протоколлогинимя пользователя, используемое для доступа к ресурсупарольпароль указанного...

Читать далее
Статьи

Требования к паролям

01.10.2021

Установите минимальную длину пароля в Юникоде больше 10 символовСверяйтесь со списком самых распространенных паролейу 1.6% пользователей пароль из числа 10 самых популярных;у 4.4% пользователей пароль из числа 100 самых популярных;у 9.7% пользователей пароль из числа 500 самых популярных;у 13.2%...

Читать далее
Законы UX
Статьи

Законы UX

01.10.2021

https://lawsofux.com Эффект эстетической пользы Пользователи часто воспринимают эстетически привлекательный дизайн как более удобный дизайн Эстетически приятный дизайн может сделать пользователей более терпимыми к незначительным проблемам юзабилитиЭстетически приятный дизайн может маскировать...

Читать далее
Оптимальная длина строки
Статьи

Оптимальная длина строки

01.10.2021

Оптимальная длина строки зависит от ситуации; например от отступов, размера и типа шрифта. Для глаза читателя, длинные или короткие строки утомительны. Длинные разрушают ритм, так как читателю трудно найти следующую строку текста. Единственная ситуация, в которой приемлемы короткие строки — малое...

Читать далее
Статьи

Про светодиодные лампочки

01.10.2021

https://habr.com/ru/company/lamptest/blog/441610/ На 25 февраля 2019 года автором протестировано уже 2500 моделей светодиодных ламп и зафиксированы следующие максимальные мощности и световые потоки ламп разных типов (больше не получается сделать по техническим причинам). Тип лампыMax мощность,...

Читать далее
Статьи

Системный шрифт

01.10.2021

Лучший шрифт — тот, который вы не подключили htmacademy body { font-family: -apple-system,BlinkMacSystemFont,Segoe UI,Roboto,Oxygen,Ubuntu,Cantarell,Fira Sans,Droid Sans,Helvetica Neue,sans-serif; } vk body { background: #edeef0; color: #000; margin: 0; padding: 0; direction: ltr; font-size: 13px;...

Читать далее
Статьи

О шрифтах

01.10.2021

У Юрия Ветрова вышла интересная статья на vc.ru В двух словах о шрифтах, часть первая. Вместе с мастер-классом "Почему Стив Джобс любил шрифты" от Алексея Каптерева ликвидирует безграмотность о шрифтах. https://www.youtube.com/watch?v=vRzaPvm3nhY

Читать далее
Статьи

Linux. Команда sed

01.10.2021

Команда sed - это потоковый редактор текста. Вставляет/изменяет/добавляет текст не открывая файл визуально. Обычно используется в скриптах. Online песочница sed Пара важных параметров: -r расширенная поддержка синтаксиса регулярных выражений-i редактирование "на месте" Общие примеры Замените первое...

Читать далее
Статьи

Крутость программиста

01.10.2021

Комментарии с vc.ru Крутость программиста - это не написать идеальную архитектуру по книжкам теоретиков, не покрыть 100% кода тестам, не придумать идеальные названия и понятные комментария функциям и переменным. То что я сейчас перечислил - это долбоебизм. Крутость - это сделать качественный...

Читать далее
99% людей не понимают что им надо
Статьи

99% людей не понимают что им надо

26.02.2020

Получается так, что реальное образование оно на 1% состоит из знаний, 10% состоит из получения навыков, домашних заданий. А вот остальные 90% - это когда тебя пинают (именно кто-то, а не ты сам себя), чтобы вы достигли результатов.Ключевой вопрос в том, чтобы вы были эффективны - это в том, чтобы...

Читать далее
Одного лайка достаточно
Статьи

Одного лайка достаточно

26.02.2020

Несколько недель назад я с ребятками-администраторами сообществ (здесь реклама телеграм-чата) занялся, на первый взгляд, обычными лайками во ВКонтакте. Лайк — это условное выражение одобрения материалу, пользователю, фотографии, выражающиеся нажатием одной кнопки В основном, чтобы поставить лайк к...

Читать далее
Выжимай из телефона максимум
Статьи

Выжимай из телефона максимум

26.02.2020

Смартфон — это штука, которую можно и нужно использовать на полную катушку. Нужно что-то купить? Записал в список покупок Запланировать встречу? Открывай календарь и/или напоминания. Использовать телефон только для серфинга в интернете, а также стандартных звонков — грозит простоями мощностей....

Читать далее