Обучение нейросети
Читать
Журнал Gerwin
Журнал Gerwin

LLM101n: Андрей Карпаты анонсировал курс по созданию LLM с нуля

Один из основателей OpenAI Андрей Карпаты анонсировал курс по созданию с нуля большой языковой модели — LLM
LLM101n: Андрей Карпаты анонсировал курс по созданию LLM с нуля LLM101n: Андрей Карпаты анонсировал курс по созданию LLM с нуля

LLM — большие языковые модели, использующие алгоритмы машинного обучения для генерации и прогнозирования человеческих языков. Они обучаются на массивах данных. Примечательно, что происходит процесс без особого наблюдения. Модель LLM должна уметь определить следующее слово на основе текста, данного на входе.

Один из основателей OpenAI Андрей Карпаты недавно представил анонс уникального курса по созданию с нуля LLM. По словам Андрея, на курсе ученики смогут тесно взаимодействовать с ИИ, совершенствовать и иллюстрировать небольшие истории, построить полноценно функционирующее приложение. К концу курса каждый будет глубоко знаком и с LLM, и с ИИ. 

Также анонсирован план учебы и обозначены основные темы, которые будут затронуты и изучены в рамках курса. Ученикам предстоит столкнуться с изучением моделирования языка, понятием токенизации, набора данных и множеством других терминов и функций сферы IT.

Мне нравится обучать глубокие нейронные сети на больших наборах данных 🧠🤖💥

Андрей Карпаты
karpathy.ai

Учебный план курса:

  1. Биграммная языковая модель (языковое моделирование)
  2. Micrograd (машинное обучение, метод обратного распространения ошибки)
  3. N-граммная модель (многослойный перцептрон, матричное умножение, функция активации GELU)
  4. Механизм внимания (внимание, softmax, позиционное кодирование)
  5. Трансформер (трансформер, residual connections, layer normalization, GPT-2)
  6. Токенизация (minBPE, байт-парное кодирование)
  7. Оптимизация (инициализация, оптимизация, AdamW)
  8. В погоне за скоростью I: Устройства (устройства, CPU, GPU, ...)
  9. В погоне за скоростью II: Точность (смешанная точность, fp16, bf16, fp8, ...)
  10. В погоне за скоростью III: Распределенность (распределённая оптимизация, DDP, ZeRO)
  11. Наборы данных (наборы данных, загрузка данных, генерация синтетических данных)
  12. Вывод I: kv-кэш (kv-кэш)
  13. Вывод II: Квантование (квантование)
  14. Дообучение I: SFT (контролируемое дообучение SFT, PEFT, LoRA, чат)
  15. Дообучение II: RL (обучение с подкреплением, RLHF, PPO, DPO)
  16. Развёртывание (API, веб-приложение)
  17. Мультимодальность (VQVAE, диффузионный трансформер)

Проще говоря, курсы будут обучать и архитектуре, и подготовке датасетов, оптимизации и фреймворкам. На выходе ученики смогут получить что-то похожее на легендарный ChatGPT, создав уникальную модель с нуля. В дальнейшем эти навыки могут пригодиться для развития в области технологий и развития собственных проектов.

Кто такой Андрей Карпаты?

Сам Андрей Карпаты имеет степень бакалавра наук в Университете Торонто с двойной специализацией по информатике и физике, а также дополнительной — по математике. 

Написание Андрей Карпатый — является неверной интерпретацией перевода имени Andrej Karpathy на русский язык. — Прим. ред.

Именно там он, посещая лекции великого Джеффа Хинтона, всерьез столкнулся с глубоким обучением. Джефф Хинтон стоял у истоков становления нового ИИ и глубокого машинного обучения, он создал свой подход, сочетающий теории по психологии с компьютерным научными доводами. Его еще называют «крестным отцом» ИИ. Андрей Карпаты также имеет и степень магистра в Университете Британской Колумбии, где он работал над машинным обучением для робототехники.

Будучи преподавателем по глубокому обучению в Стэнфорде и исследователем, он настолько смог заинтересовать студентов своим предметом, что за год число его учеников выросло более чем в два раза. На этой странице вы можете подробнее изучить его авторские работы и избранные доклады по теме технологий, глубокого обучения и развития ИИ, его становления.

Андрей Карпаты
Андрей Карпаты

Уроженец Словакии Андрей Карпаты стоял у истоков компании OpenAI в 2015 году и имеет самое прямое отношение к созданию ChatGPT. Покинув компанию и перейдя в Tesla в 2017, он вновь возвращается в OpenAI в 2023 году, откуда увольняется в 2024 с целью начать развивать уже собственные проекты.

В компании Tesla Карпаты был экспертом по глубокому обучению и машинному зрению и возглавлял команду разработки автопилота. 

Было приятно помочь Tesla в достижении ее целей в последние пять лет, и трудно принять решение расстаться. За это время автопилот прошел путь от попыток удержаться на нужной полосе к движению по городским улицам, и я с нетерпением жду, когда исключительно сильная команда продолжит этот импульс,— заявил перед увольнением Карпаты.

Он смог сделать автопилот электромобилей одним из самых передовых и получил звание «отца автопилота». С его помощью компания смогла повысить безопасность и удобство вождения на электрокаре.

Еще нет аккаунта в Gerwin AI?

Пора исправлять ситуацию

Где можно следить за Андреем Карпаты?

На своем YouTube-канале Карпаты говорит о создании искусственных нейросетей и знакомит зрителей с инструментами эффективной оценки нейросети.

Например, в одном из видеоуроков на канале он разбирает общую структуру языкового моделирования (обучение, выборка, оценка потерь и т. д.) Вместе со своими слушателями и зрителями он реализует языковые модели на уровне символов, которые усложняет от видео к видео. На его личном канале можно посмотреть ролик-знакомство с языковыми моделями, на основе которых работает тот же ChatGPT, например. 

Андрей Карпаты рассказывает о происхождении, безопасности, проводит сравнения и аналогии с современными операционными системами. Эксперт в одном из роликов рассматривает типичные инструменты диагностики и визуализации, которые могут быть полезны для исследования глубокой сети.

В своем личном аккаунте X (Твиттер) — Карпаты выкладывает интересные результаты исследований и экспериментов, проводимых с ИИ. Например, один из последних постов демонстрирует нам полученное видео, которое создано по первым предложениям романа «Гордость и предубеждение» писательницы Джейн Остин.  Карпаты признается, что эти инструменты пока сыроваты и не могут создать что-то глобальное, достойное восхищения, ко всему прочему, это отнимает много времени. 

x.com
x.com

Возможно, исследователь захочет продолжать экспериментировать в подобном направлении и станет отцом еще многих направлений ИИ. Прочитать новейшие исследования,  узнать о популярных новинках в мире технологий и просто понять, какие мысли в умной голове исследователя и человека, стоявшего у истоков OpenAI, можно в его аккаунте X*. Всегда интересно, о чем грезят гении.