Брат Тук
Брат Тук

Брат Тук

Редактор
badge 2 года с нами! badge Награда за 5000 очков репутации badge За 500 сообщений!
Регистрация
18/04/2023
Сообщения
14.943
Репутация
30.695
Автор: Stepik, Вячеслав Колосков
Название: Разработка LLM с нуля (2025)

[Stepik, Вячеслав Колосков] Разработка LLM с нуля (2025)

Описание:

Этот практический курс погрузит студентов в создание современных языковых моделей (LLM) на примере GPT-архитектуры. Участники с нуля реализуют все основные компоненты Трансформера: от токенизации (BPE) до механизмов Внимания и генерации текста. Для разработки будем использовать только Python и низкоуровневый PyTorch, не полагаясь на какие-либо сторонние библиотеки.

Чему вы научитесь

Научитесь читать схемы архитектур основанных на Трансформерах.

Изучите принципы проектирования современных LLM.

Понимать алгоритм токенизации текста.

Реализовывать ключевые компоненты GPT.

Управлять креативностью модели.

Собирать и подготавливать данные для обучения.

Настраивать Pre-train цикл обучения LLM.

Для кого этот курс

Курс предназначен для разработчиков, инженеров машинного обучения и исследователей, желающих глубоко разобраться в архитектуре современных языковых моделей (LLM).

Начальные требования

Базовые знания Python, минимальный ООП (классы, функции).

Понимание основ машинного обучения (train/test, таргет, фичи, градиент, функции потерь, метрики и т.д.).

Базовые знания по PyTorch: линейные слои, активации, нормализация, дропаут, обратное распространение ошибки.

Желателен опыт реализации простой полносвязнной сети для задачи много-классовой классификации.

Преподаватель: Вячеслав Колосков

Machine Learning Engineer (в телекоме)

В IT работаю более 15 лет. Последние 5 лет работаю Machine Learning Engineer (в телекоме). Много занимался большими табличками (Spark, Hadoop и пр.). В последнее время в основном работаю с NLP и в частности разрабатываю RAG-систему на работе.

Программа курса

Введение

Инструкция

Что такое LLM?

Архитектура LLM

Токены и эмбединги

Byte-Pair Encoding

Эмбединги

Transformer

«‎Внимание»‎

Feed-Forward Network

Decoder

LLM

Собираем GPT

Сэмплирование

Обучение

Датасет

Train/Eval

Применение

Другие модели

GPT-2

LLama

Mistral

Mixtral

Gemma

Подробнее:
Авторизуйтесь, чтобы посмотреть скрытый контент.

Скачать:
Авторизуйтесь, чтобы посмотреть скрытый контент.
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Последние темы автора

Брат Тук
Ответы
1
Просмотры
501
Qwerty86
Qwerty86
Брат Тук
Ответы
0
Просмотры
401
Брат Тук
Брат Тук
Брат Тук
Ответы
0
Просмотры
420
Брат Тук
Брат Тук
Брат Тук
Ответы
0
Просмотры
388
Брат Тук
Брат Тук
Брат Тук
Ответы
0
Просмотры
389
Брат Тук
Брат Тук

Похожие темы

Брат Тук
Ответы
2
Просмотры
821
k_vladimir
k_vladimir
Брат Тук
Ответы
0
Просмотры
380
Брат Тук
Брат Тук
Брат Тук
Ответы
0
Просмотры
835
Брат Тук
Брат Тук
Малыш Джон
Ответы
2
Просмотры
2K
Уилл Скарлет
Уилл Скарлет
Малыш Джон
Ответы
0
Просмотры
2K
Малыш Джон
Малыш Джон
Малыш Джон
Программирование [CBS] XML (2014)
Ответы
1
Просмотры
2K
RottenGood
RottenGood
Arsenn32
Ответы
0
Просмотры
2K
Arsenn32
Arsenn32
Роджерc
Ответы
7
Просмотры
3K
MrSome
Сверху Снизу