Статьи

Карпатый готовит большой курс по LLM – LLM101n: Let’s build a Storyteller

Андрей будет учить с нуля и буквально всему — архитектуре, подготовке датасетов, тюнингу, оптимизации, фреймворкам (PyTorch+Jax), CUDA. На выходе у студентов получится что-то похожее на ChatGPT, только написанное абсолютно с нуля.

Такое ему не в первой, он вместе со своим профом Ли Фей-Фей создал и вёл легендарный курс CS231 по глубокому обучению (https://cs231n.stanford.edu/) в Стенфорде (имхо этот курс – база, всем советую), да и обучающие видео у него выходят отличные.

В публичном доступе есть репа (https://github.com/karpathy/LLM101n) с содержанием курса, но самих лекций пока нету

Список туториалов Карпатого про LLM:

  • Строим GPT с нуля, с разбором кода в ноутбуке (https://youtu.be/kCc8FmEb1nY) (2ч)
  • Как тренировали ChatGPT (large scale) (https://t.me/ai_newz/1949)
  • Интро в большие языковые модели (LLM), тоже от Карпатого. (https://t.me/ai_newz/2320) (1ч)
  • Токенизация в GPT и как ее закодить (https://t.me/ai_newz/2429) (2ч)
  • Как воспроизвести и натренировать GPT-2 (124M) с нуля (https://t.me/ai_newz/2796)(4ч)