en
Feedback
DeepSchool

DeepSchool

Open in Telegram

Это канал школы deepschool.ru. Здесь мы будем: - напоминать вам теорию ML/DL в виде коротких постов, - задавать вопросы с собеседований, - рассказывать про полезные фреймворки - и делиться советами, которые помогут вам в работе. @deepschool_support

Show more

📈 Analytical overview of Telegram channel DeepSchool

Channel DeepSchool (@deep_school) in the Russian language segment is an active participant. Currently, the community unites 10 563 subscribers, ranking 11 741 in the Technologies & Applications category and 62 168 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 10 563 subscribers.

According to the latest data from 05 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 14 over the last 30 days and by -2 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 28.40%. Within the first 24 hours after publication, content typically collects 12.32% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 3 000 views. Within the first day, a publication typically gains 1 301 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 32.
  • Thematic interests: Content is focused on key topics such as llm, ускорение, deepschool, lora, домен.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Это канал школы deepschool.ru. Здесь мы будем: - напоминать вам теорию ML/DL в виде коротких постов, - задавать вопросы с собеседований, - рассказывать про полезные фреймворки - и делиться советами, которые помогут вам в работе. @deepschool_support

Thanks to the high frequency of updates (latest data received on 07 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

10 563
Subscribers
-224 hours
-157 days
+1430 days
Posts Archive
Как собрать хорошие траектории для обучения LLM-агента LLM-агенту недостаточно просто отвечать текстом: важно научить его выбирать действия и работать с инструментами. Сегодня разбираем, какие данные здесь нужны, и почему одного SFT обычно мало. В новой статье рассказываем: - что такое траектория в агентских задачах - чем SFT-данные отличаются от alignment-данных - как работают пары chosen/rejected и зачем нужен DPO - что такое hard negatives и каким образом собирать их полезные примеры - и как выстроить конвейер проверки, покрытия и обновления датасета Читайте статью по ссылке! 👈🏼
Если хотите не только собирать датасеты, но и понимать, как дообучать, оценивать и запускать LLM-агентов на практике, эта тема напрямую продолжается на курсе LLM. Курс стартует 4 июня, а до 3 июня включительно вы можете присоединиться со скидкой 5%!

Как создавать и деплоить DL-сервисы Напоминаем, что 4 июня стартует курс DLOps, на котором вы научитесь превращать модели в сервисы и доводить их до пользователей. На курсе вы научитесь: • писать код для обучения моделей «по фэншую» • конвертировать модели в JIT и ONNX • версионировать данные, эксперименты и модели • автоматизировать рутину и быть уверенным в своём коде • писать веб-сервисы на FastAPI • собирать приложения с помощью Docker • сервить модели с NVIDIA Triton • тестировать веб-сервисы и подменять зависимости при помощи DI • настраивать CI/CD и деплоить веб-сервисы на удалённые машины «по кнопке» при помощи ansible и k8s • мониторить веб-приложения при помощи Prometheus и Grafana После каждой лекции вас ждет домашнее задание, а в конце курса — проект, где можно применить все полученные навыки. На протяжении всего обучения вас будут поддерживать опытные инженеры: ревьюить ваш код, отвечать на вопросы во время лекций, на Q&A-сессиях и в чате. 🚀 Курс стартует 4 июня, а до 3 июня включительно вы можете записаться со скидкой 5%! Изучайте подробности о программе и спикерах и присоединяйтесь к обучению. Если возникают вопросы, пишите нам в поддержку в Телеграм!

Data Version Control DVC - инструмент для версионирования данных, моделей и ML-экспериментов, который помогает управлять данными так же, как Git управляет кодом. Новая статья познакомит вас с концепцией версионирования данных в DVC, расскажет, как хранить большие объёмы файлов в удалённых хранилищах, поможет внедрить и использовать DVC в своей команде. Читайте статью по ссылке! 👈🏼
А если хотите научиться превращать модели в сервисы и доводить их до пользователей, то приходите на курс DLOps. Оставьте заявку до 31 мая, чтобы получить скидки до 15% 🔥

Спроси DeepSchool Мы запускаем новую рубрику, в которой будем отвечать на вопросы не только наших студентов, но и всех подписчиков канала. Начинаем с вопроса, который нам задали на QA-сессии курса DLOps. ❓«Сделали модель — как её задеплоить?» 💬 Отвечает Константин Носорев — Senior Backend-разработчик в Яндекс, спикер курса DLOps. На самом деле в этом вопросе скрывается несколько разных вопросов. Разберём каждый. 1. Как запустить модель?
Есть два основных подхода: а) FastAPI / Flask (и др.) обёртка. Файл модели загружается в HTTP / gRPC-сервис. Минимальные накладные расходы на старте, но проблемы с масштабированием / батчингом придётся решать самостоятельно. б) Специализированные inference-серверы. Например,Triton Inference Server, TorchServe, vLLM. Поддерживают батчинг, управление памятью и обслуживание нескольких моделей одновременно. Оправданы при высоких требованиях к latency и throughput.
2. Как обеспечить доступность?
Если у вас большие требования к доступности — нужно несколько реплик на разных серверах (а лучше — ДЦ). Иначе сбой на одном сервере — и к вашей модели
«
не достучаться
»
. В случае с несколькими репликами важно, чтобы при падении одной из них трафик перераспределялся между остальными. Здесь тоже есть несколько вариантов, например: а) Kubernetes. Автоматически поддерживает заданное число реплик, проверяет доступность / работоспособность и перераспределяет трафик. б) Bare Metal. Прямой запуск на серверах. Максимальный контроль над ресурсами, логику перезапуска и балансировки нужно делать самостоятельно. Например, через systemd и nginx / HAProxy.
3. Как выстроить архитектуру сервиса?
Есть несколько подходов: а) Бизнес-логика и модель в одном сервисе. Минимальная сложность при запуске, но при росте нагрузки возникают проблемы. Бизнес-логика и инференс потребляют ресурсы совместно и разделить их невозможно: если модель перегружена, масштабируется весь сервис целиком, включая логику, которая в этом не нуждается. Обратная ситуация аналогична. Это приводит к избыточному расходу памяти и GPU, а также к сложностям при горизонтальном масштабировании. б) Отдельно микросервис с моделью и отдельно сервис с бизнес-логикой. Например, Triton или vLLM обслуживают модель, а «основной» сервис обращается к ним по HTTP/gRPC. Компоненты обновляются и масштабируются независимо: можно добавить реплики только на сторону модели или логики.
✍️ Будем продолжать этот формат — на ваши вопросы будут отвечать такие же опытные практикующие инженеры, как Константин: наши спикеры, авторы статей и друзья школы. Задавайте вопросы на ask.deepschool.ru, а мы ответим на них в канале!

От ML-инженеров хотят всё больше. Раньше можно было просто обучить модель и перекинуть ноутбук бэкендеру «через стенку». Сейчас где-то нужно завернуть модель в Docker/сделать минимальное демо и довести его до пользователя. Где-то самому встроить модель в сложную систему. А где-то эту систему ещё и спроектировать. Код-агенты, конечно, сильно упростили жизнь: собрать демку или MVP теперь проще некуда. Но они не сняли с нас главного: ответственности за полученное решение. По шапке будет получать не Claude:) А отвечать за систему, в которой не знаешь, как устроены «кубики» — сомнительное удовольствие. Ты вроде что-то собрал и оно работает. Но почему именно так? — 🤷‍♂️. Что делать, когда сломается? — 🤷‍♂️. Остаётся верить сетке на слово, что «так правильно». Спойлер: очень часто нет. Чтобы «кубики» были не чёрными ящиками, а понятным набором инструментов, мы запускаем курс DLOps. За 4 месяца проходим всю цепочку: от сериализации модели и небольшого сервиса на FastAPI до Nvidia Triton, k8s и мониторинга. Учим создавать полноценные сервисы и доводить их до пользователя. В этом потоке добавили лекцию про LLM observability. Наш DLOps построен вокруг «обычных» DL-моделей. Но чем дальше, тем меньше сервисов не ходит в LLM хотя бы просто по API. А за ними нужен глаз да глаз 😉 Обучение начинается 4 июня, а до 24 мая действует скидка 20% 🔥 Переходите на сайт, изучайте подробности и оставляйте заявку на курс! Если возникают вопросы, пишите нам в поддержку в Телеграм!

Разбираемся с тестированием Подготовили карточки с вопросами по тестированию: - пишем smoke-тесты на обучение модели - разбираемся, зачем изобрели столько разных скоупов у фикстур - боремся с долгой установкой в CI - пишем регрессионный тест на метрики и много других. Формат тот же: вопрос на лицевой стороне, развёрнутый ответ с примерами — на обратной. Готовьтесь к собеседованию здесь!
А если хотите подготовиться не только к вопросам по тестированию, но и разобраться во всём цикле разработки DL-сервисов, то приходите на курс DLOps, который стартует 4 июня!

HNSW: строим маленькие миры для быстрого поиска Поиск схожих объектов базовая задач в машинном обучении. Рекомендательные системы, семантический поиск, дедупликация, retrieval в RAG — везде нужно уметь быстро находить ближайшие векторы. Но делать это «в лоб» — почти всегда довольно длительное занятие, поэтому зачастую используются приближенные методы. В этой статье мы разберём один из таких методов — HNSW, и узнаем: - как он работает - почему гарантирует высокую скорость без сильной потери качества - за счёт каких особенностей он настолько эффективен - и как его параметры влияют на качество и скорость поиска Читайте новую статью по ссылке: https://clck.ru/3TdhnE 🤩

Что под капотом у видеокодеков, генеративных моделей и тимлидов? | Подкаст с Ильдаром Идрисовым В этом выпуске мы с Ильдаром Идрисовым, Head of ML Vinteo.ai, разбираемся, как устроены видеокодеки, почему лучшие модели не могут сгенерировать нам план квартиры и почему, став тимлидом, нужно ещё научиться им быть. Смотрите по ссылке: https://youtu.be/stCi1eQSEYY 👈🏼

GENets: Neural Architecture Design For GPU-Efficienet Networks Для многих GPU — основной девайс для инференса. А значит, получать высокие метрики при низком latency на нём — критически важно. Исследователи из Alibaba утверждают, что текущие быстрые решения не используют весь потенциал GPU. В работе «Neural Architecture Design for GPU-Efficient Networks» они показывают, как проектировать сети для быстрого инференса на GPU и презентуют семейство backbones GENet. О принципах построения свёрточных сетей для эффективного инференса на GPU и результатах авторов мы рассказали в новой статье! Читайте материал по ссылке! 👈🏼 🪔 DeepSchool
Приходите на курс «Ускорение нейросетей», чтобы разобраться в эффективных архитектурах и подходах к ускорению

YOLO history. Part 9 А мы возвращаемся с разбором моделей семейства YOLO! 😎  В прошлой статье обсудили YOLOv8 и YOLOv11 — а значит, подобрались уже к самым передовым моделям. Сегодня рассмотрим все оставшиеся модели в одном посте 🤓 Итак, в новой статье: - узнаем, как избавиться от NMS на примере YOLOv10 - поговорим об оптимизации attention для ускорения детекции из YOLOv12 - познакомимся с концепцией гиперграфа с помощью YOLOv13 Скорее читайте по ссылке! 👈🏼

Встречаемся через 3 часа на воркшопе по 3D CV Сегодня разберём, из каких этапов состоит пайплайн обработки 3D-данных и какие
Встречаемся через 3 часа на воркшопе по 3D CV Сегодня разберём, из каких этапов состоит пайплайн обработки 3D-данных и какие применения он находит в частных задачах. А потом вы самостоятельно построите ключевые элементы пайплайна 3D-зрения для ориентации робота в комнате. Вы узнаете: • как и откуда получать 3D-данные • как их правильно выравнивать и предобрабатывать • как работать с библиотекой Open3D • какие 3D DL-модели существуют и для каких представлений данных они подходят • как оценивать полученный результат • в каких практических задачах применяется 3D и как именно Во второй части воркшопа мы разделим вас на группы, и вы реализуете агрегацию и фильтрацию 3D-данных для построения модели комнаты, обработку данных нейросетью и извлечение информации для навигации робота. У вас будет эмулятор робота в пространстве, к которому вы допишете фрагменты обработки 3D-сцены. Чтобы не терять времени на воркшопе, заранее установите Conda и настройте среду, используя этот environment.yml, с помощью команды: conda env create -f environment.yml 📅 9 апреля, четверг, в 19:00 МСК Регистрируйтесь по ссылке и приходите сегодня вечером!

Love, 3DCV & Robots В этот четверг мы проведём воркшоп по использованию трёхмерных данных в CV-системах. На нём вы узнаете, как гуманоидные роботы собирают и обрабатывают 3D-информацию и что роднит их с аппаратом МРТ. Мы разберём, из каких этапов состоит пайплайн обработки 3D-данных и какие применения он находит в частных задачах. Вы узнаете: • как и откуда получать 3D-данные • как их правильно выравнивать и предобрабатывать • как работать с библиотекой Open3D • какие 3D DL-модели существуют и для каких представлений данных они подходят • как оценивать полученный результат • в каких практических задачах применяется 3D и как именно Во второй части воркшопа вы самостоятельно построите ключевые элементы пайплайна 3D-зрения для ориентации робота в комнате. Мы разделим вас на группы по 2-3 человека, и вы реализуете агрегацию и фильтрацию 3D-данных для построения модели комнаты, обработку данных нейросетью и извлечение информации для навигации робота. У вас будет эмулятор робота в пространстве, к которому вы допишете фрагменты обработки 3D-сцены. Чтобы не терять времени на воркшопе, заранее установите Conda и настройте среду, используя этот environment.yml, с помощью команды: conda env create -f environment.yml 🙋‍♂️Спикер воркшопа — Давид Свитов, к.т.н., IIT, ex Researcher Samsung AI Center. Давид расскажет про обработку 3D-данных и поможет вам с выполнением задания. 📅 9 апреля, четверг, в 19:00 МСК Регистрируйтесь по ссылке и приходите в четверг!

Flash Attention-2 FlashAttention-2 — реализация алгоритма attention, которая значительно ускоряет вычисления в сравнении с первой версией и работает заметно быстрее стандартной реализации в PyTorch. В статье простыми словами разбираем, за счёт чего это происходит 👨🏼‍💻 Из нового материала вы узнаете: - какие проблемы были у FlashAttention-1 - как удалось лучше загрузить GPU - что изменилось в распределении вычислений - и какую роль играет параллельный softmax Читайте статью по ссылке! 👇
Про ускорение LLM, дообучение и их деплой рассказываем на курсе LLM. Запишитесь в лист ожидания, чтобы первыми занять место и получить скидки до 20% 🔥
Автор: Антон Наумов 🪔 DeepSchool

Продолжаем разбираться с LLM! Подготовили 20 новых карточек с вопросами: - зачем нужен GQA - как scaling laws влияют на выбор модели - FSDP vs DDP - как изображения попадают в LLM и много других. Готовьтесь к собеседованию здесь! Теперь можно предложить вопрос со своего собеседования и мы его опубликуем. Для этого нажимайте «предложить вопрос» у коллекции «от сообщества 💚»

Как собирать NLP-системы, которые работают под нагрузкой Обучить модель, построить эмбеддер или воспользоваться API — не значит запустить рабочую систему. RAG галлюцинирует, агент ломается на реальных сценариях, эмбеддинги не работают на специфичном домене. С этими и другими проблемами мы разберёмся на курсе LLM Pro, который стартует 26 марта! На курсе вы научитесь: • проектировать и запускать NLP-системы под реальные продуктовые задачи • адаптировать LLM и эмбеддинги под специфичный домен и «живые» данные • собирать и размечать датасеты — даже если данных изначально почти нет • решать задачи классификации, поиска, кластеризации и NER — с ограничениями продакшн-среды • собирать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества • строить AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой Приходите, чтобы узнать про best practices от опытных инженеров из продуктовых команд и применять похожие подходы в своих проектах 🤖 До 25 марта вы можете присоединиться к обучению со скидкой 5%! Изучайте программу и отзывы на сайте и записывайтесь на ближайший поток 🎓

Встречаемся через 3 часа на лекции по RAG Сегодня Дмитрий Калашников расскажет, как правильно выстроить пайплайн и превратить RAG из хаотичного набора компонентов в надёжный инструмент. На лекции вы узнаете: - почему ванильная схема «ретривер + генератор» почти никогда не даёт нужного качества - с чего начинать улучшения: эмбеддер, поиск, реранкер, генератор, данные или что-то ещё - какие задачи приходится решать, чтобы RAG действительно работал - как из разрозненных компонент собрать надежный RAG-продукт 🔥 А также всем участникам подарим скидку 15% на курс LLM Pro — продвинутую программу, на которой вы научитесь строить системы, которые работают в реальном мире! ⏰ Начинаем сегодня, 19 марта, в 19:00 МСК Регистрируйтесь по ссылке и приходите сегодня вечером!

Токенизация и эмбеддинги в NLP: что спрашивают на собеседованиях Ранее мы разобрали популярные вопросы про attention и трансформеры с NLP-собеседований, а сегодня расскажем, что происходит с текстом до модели — обсудим токенизацию и построение эмбеддингов. Формат новой статьи тот же: вопросы с собеседований разбиты на модули, а ответы спрятаны под спойлерами. Cначала попробуйте ответить сами, а потом загляните в разбор и примеры 😉 Читайте новую статью по ссылке! 🪔 DeepSchool
Уже профессионально работаете с LLM? Соберите полноценные LLM-системы с учётом требований к качеству и нагрузке, разберите сложные кейсы и дизайны NLP-решений у нас на курсе LLM Pro. Старт — 26 марта. Читайте подробнее на сайте и присоединяйтесь к обучению ⚡️

Ванильный RAG не работает. Как исправить? RAG — один из самых популярных сценариев для интеграции LLM в продукты. При этом большинство RAG-систем в реальных условиях ломаются уже на старте: галлюцинации, нерелевантные ответы, потерянный контекст. Проблема не в идее, а в деталях. Ванильная схема «ретривер + генератор» — это только скелет. Без правильно настроенного эмбеддера, качественных данных, реранкера и дообученного генератора она не работает. А когда что-то идёт не так, то непонятно, за что взяться. В этот четверг Дмитрий Калашников, NLP team lead в Яндексе, проведёт открытую лекцию и разложит систему по частям: где обычно ломается, как диагностировать проблему и что конкретно делать на каждом уровне пайплайна. Мы разберём: • типичные точки отказа: эмбеддер, поиск, реранкер, генератор, данные • как локализовать проблему, прежде чем что-то чинить • какие техники реально улучшают качество на каждом этапе • как собрать из компонентов систему, которая держит нагрузку На лекции также представим курс LLM Pro — для тех, кто хочет научиться строить полноценные NLP-системы с учётом требований к качеству и нагрузке. Участникам лекции подарим скидку в 15% на обучение! 🎁 📅 Лекция пройдёт 19 марта в 19:00 МСК Регистрируйтесь по ссылке и до встречи в четверг!

Как повысить квалификацию в Computer Vision Приходите на ближайший поток CV Rocket, который стартует 17 марта! Это курс для практикующих CV-инженеров, которые хотят закрыть пробелы в знаниях и узнать про подходы и лучшие практики от senior-инженеров. Вы научитесь: - готовить данные: собирать, устранять ошибки в разметке, мониторить качество - отлаживать обучение, находить аномалии и интерпретировать результаты модели - работать с metric learning и векторным поиском - работать с видео: трекинг и action-recognition - предобучать без разметки: от pretext-задач до современных SSL-алгоритмов - адаптировать модели детекции, сегментации и OCR под сложные кейсы Обучение длится 4 месяца и состоит из 13 лекций и 13 заданий. Лекции проходят онлайн в Zoom, поэтому вы сможете задавать вопросы по ходу занятия. 🔥 До 16 марта вы можете записаться со скидкой 5%! Переходите на сайт, изучайте подробности, читайте отзывы выпускников и записывайтесь на обучение!  До встречи на курсе! 🎓

Осталось 3 часа до воркшопа по BentoML Сегодня с Анастасией Старобыховской разберёмся как упаковать модель в BentoML, поднять инференс-сервер и организовать к нему доступ. На воркшопе вы узнаете: — как передать готовую модель без погружения в репозитории backend-команды — как упаковать модель с помощью BentoML и поднять инференс-сервер — как обращаться к модели из внешнего кода — когда BentoML не подходит и что использовать вместо него У вас будет возможность упаковать модель самостоятельно в режиме реального времени! А также всем участникам подарим скидки на курс CV Rocket! 🎁 🕕 Регистрируйтесь и приходите сегодня в 19:00 МСК