MLinside - школа ML

Відкрити в Telegram

Предзапись на курс "ML System Design с Валерием Бабушкиным": https://forms.yandex.ru/u/6a0436bd90290214acb9d542/ Наши курсы: https://taplink.cc/mlinside Чат коммьюнити: @ml_insidechat По вопросам: @marinagartm

Росія134 822 Технології та додатки21 725

3 958

Підписники

+724 години

+457 днів

+22630 день

1 866

Перегляди допису

~ 63324 години

~ 72048 годин

47.16%

Коефіцієнт залучення

Немає даних

Дописів на день

Ads index

beta

Архів дописів

3 958

Валерий Бабушкин и тот самый курс по ML System Design в MLinside Если вы давно хотели разобраться, как проектируют ML-системы в реальных продуктах – это то, что вам нужно. Курс посвящён проектированию ML-систем для реальных продуктов: работе с архитектурой, пайплайнами обучения, deployment-процессами, мониторингом моделей, оптимизацией инференса и поддержкой ML под нагрузкой. Также на курсе разберём подходы к проектированию современных агентских AI-систем и интеграции LLM в production-инфраструктуру. На курсе вы научитесь: ▪️проектировать ML-системы под реальные ограничения ▪️строить ML design docs ▪️выбирать метрики и функции потерь ▪️выстраивать пайплайны обучения ▪️анализировать ошибки моделей ▪️внедрять ML в продукт ▪️мониторить качество моделей в продакшене ▪️оптимизировать инференс под нагрузку Курс подойдёт ML-инженерам, тимлидам ML-команд и начинающим специалистам, которым нужен системный взгляд на ML. Преподаватель – Валерий Бабушкин, наверняка он не нуждается в представлении, но всё же: ▪️Senior Director по Data & AI в BP ▪️грандмастер Kaggle ▪️автор книги Machine Learning System Design. Курс будет идти 4 месяца и вас ждут 60 занятий, реальные кейсы, разбор design docs, архитектурные решения из production ML, а главное – live-обсуждения и ревью с Валерием. Посмотреть сайт можно тут. Это курс для тех, кто хочет перейти от “умею обучать модели” к “умею строить ML-системы”. Стартуем 1 июня, количество мест ограничено. Записаться можно по ссылке.

3 958

Учимся на практике: решаем реальные ML-задачки Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Двенадцатая задача Что нужно сделать: по информации о разных приложениях нужно понять какое приложение лучше всего сделать: для большего охвата, для лучшего рейтинга, для того чтобы заработать больше денег и тд Как можно сделать: ▪️Визуализировать данные для разных классов: платные/бесплатные, разные категории, количество установок и т.д.; ▪️Применить K-Means или DBSCAN; ▪️Обучить различные классификаторы и сравнить их качество. Данные можно взять на Kaggle: https://www.kaggle.com/datasets/lava18/google-play-store-apps Пример ноутбука (с случайными пропусками строк): https://colab.research.google.com/drive/1szMUL7MLxQVH9ZubsyP-LDbyCZ7rKBLF?usp=sharing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside

3 958

Мифы о машинном обучении, в которые все верят Машинное обучение окружено мифами: кто-то думает, что модели всё делают сами, кто-то – что нейросети всегда лучше, а кто-то ждёт от ML точных предсказаний будущего. На YouTube, в ВК и Дзен у нас вышло видео, где Александр Дубейковский (ML-Engineer Авито, ex-Yandex, эксперт MLinside) разбирает самые распространённые заблуждения про ML и объясняет, как всё работает на самом деле. На реальных примерах вы увидете, почему качество данных важнее алгоритма, где нейросети действительно дают преимущество, а где уступают более простым моделям, и почему ML это всегда про вероятности, а не точные прогнозы. В конце видео разбор того, как на самом деле устроены ML-проекты и почему за каждой моделью стоит целая команда. Кому будет полезно это видео: • Новичкам в ML: чтобы сразу понять, как всё устроено на практике и не строить нереалистичных ожиданий • Тем, кто думает войти в AI/ML: чтобы увидеть реальную картину индустрии, а не маркетинговый образ • Junior ML-инженерам: чтобы систематизировать базовые принципы и избежать типичных ошибок • Продактам и аналитикам: чтобы понимать ограничения ML и корректно ставить задачи • Разработчикам из других областей: чтобы разобраться, как ML встраивается в реальные продукты Если нашли себя в этом списке, велком на удобную площадку: https://youtu.be/43lRV_c-7KY https://vkvideo.ru/video-228219607_456239209 https://dzen.ru/video/watch/69fc717bef3f37622de46128 P.S. 18 мая у нас запускается второй поток курса по Математике для машинного обучения. Посмотреть программу можно на сайте. Или заполните форму и менеджер свяжется с вами, ответит на все вопросы и подарит промокод на скидку: https://forms.yandex.ru/cloud/68ca97e8f47e7311c69c807f

3 958

Мы начинаем вебинар "Формула Байеса в ML", подключайтесь: https://mlinside.getcourse.ru/pl/webinar/show?id=3283658

3 958

Байес в ML всплывает не тогда, когда вы «изучаете математику», а когда модель начинает принимать решения, которые сложно объяснить интуитивно И именно в этот момент обычно возникает вопрос: что вообще происходит внутри? 14 мая в 19:00 МСК именно это и разберём на вебинаре «Почему без формулы Байеса вы не понимаете, как работает ML». Это не будет разговор про «математику ради математики», а скорее про то, как модели на самом деле пересчитывают вероятности, почему они меняют свои предсказания при появлении новых данных и как это связано с базовой логикой вероятностного вывода. Спикер – Сергей Жестков, преподаватель с 10+ летним опытом, работавший с курсами для Сбера, Тинькофф, Otus и Skillbox, дважды «Преподаватель года» МФТИ. Он разберёт формулу Байеса через прикладные примеры, чтобы стало понятно, где именно она «живёт» в машинном обучении. Также в обсуждении примет участие Виктор Кантор — как дополнительный участник, который поможет связать тему с более широким контекстом математики в ML и обучением в целом. Обоим спикерам можно будет задать вопросы по ходу вебинара. Если еще не регистрировались, ссылка тут: https://t.me/ml_insideBot?start=web140526

3 958

Вероятность выпадения орла равна:

Anonymous voting

3 958

Продолжаем нашу рубрику с математическими задачками Если хотите прокачать прикладное математическое мышление, рубрика как раз для вас. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса. Вторая задачка: Симметричную монету бросают до первого выпадения орла. С какой вероятностью орел выпадет в попытке с четным номером? #math_MLinside

3 958

Топ-5 ошибок при изучении математики для ML Многие начинают изучать машинное обучение через библиотеки вроде sklearn или PyTorch и уверены, что всё понимают, пока модель не начинает вести себя непредсказуемо. В этот момент становится ясно: проблема не в коде, а в математике, которая за ним стоит. И у нас на YouTube, в ВК и Дзен вышло видео, где Александр Дубейковский (ML-Engineer Авито, ex-Yandex, эксперт MLinside) подробно объясняет, какие подходы к изучению математики не работают. Он разбирает, почему университетский стиль обучения часто не подходит для ML, зачем нужна интуиция вместо заучивания формул, как связать математику с кодом и почему попытка сразу идти в deep learning без базы приводит к поверхностному пониманию. В конце вас ждет практический ориентир: какой уровень математики вам реально нужен и как его достичь. Кому будет полезно видео и почему: ▪️Новичкам в ML чтобы не тратить месяцы на изучение математики “впустую” и сразу выстроить правильный подход ▪️Тем, кто уже пишет модели, но не чувствует уверенности: чтобы понять, что именно происходит внутри алгоритмов ▪️Тем, кто готовится к ML-собеседованиям: чтобы закрыть пробелы, которые часто проверяют на интервью ▪️Практикующим специалистам: чтобы перестать воспринимать модели как “чёрный ящик” и лучше контролировать их поведение ▪️Тем, кто застрял в обучении: чтобы понять, какие ошибки тормозят прогресс и как их исправить Если нашли себя в этом списке, обязательно посмотрите видео, оно будет вам полезно: https://youtu.be/56lmuMYBDyw https://vk.com/video-228219607_456239220 https://dzen.ru/video/watch/69fc4a5a66544869fb85a1ba P.S. 14 мая в 19:00 МСК пройдет бесплатный вебинар "Формула Байеса в ML" с Сергеем Жестковым. На вебинаре мы подарим скидку на курс и чек-лист с самопроверкой вашего уровня математики для ML, регистрация по ссылке: https://t.me/ml_insideBot?start=web140526 А 18 мая у нас запускается второй поток курса по Математике для машинного обучения. Посмотреть программу можно на сайте: https://mlinside.ru/math-for-ml/?utm_source=youtube&utm_medium=social&utm_campaign=video_08_05_26 Или заполните форму и менеджер свяжется с вами, ответит на все вопросы и подарит промокод на скидку: https://forms.yandex.ru/cloud/68ca97e8f47e7311c69c807f

3 958

Почему без формулы Байеса вы не понимаете, как работает ML Многие заходят в ML через код и модели, обучают, получают метрики и на этом этапе всё кажется понятным. Но, как только нужно пойти чуть глубже – улучшить модель или разобраться в ошибках, обязательено возникает вопрос: «Почему модель принимает именно такие решения?» ▪️Можно посмотреть на метрики. ▪️Можно попробовать перебрать параметры. ▪️Можно визуализировать данные. Но ответ на вышеозвученный вопрос это не даст. Наверняка вы знаете, что внутри модели скрывается вполне конкретная логика работы с вероятностями. Модель постоянно пересчитывает, насколько одно событие вероятно с учётом новых данных и делает это по строгим математическим правилам. Одно из базовых – формула Байеса. Но при этом для большинства это остаётся просто формулой из учебника, без понимания, как она реально применяется в ML. Именно поэтому мы решили взять эту тему на вебинар, который проведем 14 мая в 19:00 МСК. Спикер вебинара Сергей Жестков (10+ лет преподавания, курсы для Сбера, Тинькофф, Otus и Skillbox, дважды «Преподаватель года» МФТИ), он же преподаватель курса «Математика для ML». На вебинаре мы разберём формулу Байеса на конкретных примерах, чтобы у вас не осталось вопросов, как модель: ▪️оценивает вероятность; ▪️учитывает новые данные; ▪️и меняет своё решение. Кому будет полезен вебинар: — тем, кто хочет войти в ML, но откладывает из-за математики; — тем, кто уже пробовал обучать модели, но не до конца понимает, что происходит внутри; — тем, кто готовится к собеседованиям. 14 мая в 19:00 МСК Вебинар бесплатный, с вас только регистрация: https://t.me/ml_insideBot?start=web140526 P.S. А всем, кто придёт на вебинар, мы подарим скидку на курс и чек-лист с самопроверкой вашего уровня математики для ML

3 958

Математика по-прежнему остаётся главным стоп-фактором в ML

«Я не понимаю производные», «Матрицы – это сложно», «Вероятность – вообще мимо меня»

Это если сделать выжимку того, что нам писали в комментариях под математическими видео, говорили на кастдевах и писали менеджерам, когда мы запускали первый поток курса “Математика для ML” И наш главный вывод после первого потока:

Математику можно объяснить понятно, если давать только то, что реально нужно в ML. Без перегруза и «академической воды», а с упором на применение в реальной работе.

И сейчас мы открываем второй поток курса. Спикер прежний – Сергей Жестков (10+ лет преподавания, курсы для Сбера, Тинькофф, Otus и Skillbox, дважды «Преподаватель года» МФТИ) Что изменилось во втором потоке: Мы переработали программу на основе обратной связи с первого запуска: ▪️упростили сложные блоки; ▪️усилили практическую часть; ▪️убрали лишнее и добавили больше примеров из ML. И у нас получился не совсем “курс по математике” в классическом смысле, а скорее база, которая нужна, чтобы: ▪️понимать, как работают модели ▪️не теряться на собеседованиях ▪️спокойно идти в ML дальше (курс особенно актуален, если вы планируете идти на поток «База ML») Посмотреть программу и стоимость можно на сайте. А предзапись на второй поток уже открыта, заполните форму и менеджер свяжется с вами и расскажет детали: https://forms.yandex.ru/cloud/68ca97e8f47e7311c69c807f/

3 958

Как и обещали, публикуем объяснение верного ответа: Компьютеры хранят числа с плавающей точкой в двоичной системе (по стандарту IEEE 754), то есть 0.5 = ½, полностью представимо в двоичной системе, а 0.1 точно непредставима в двоичной системе, если немного округлить, то получится 0.100000000000000001. В первом примере получилось так что сумма дала отличное от 0.3 битовое число, во втором и третьем тоже отличные числа, но так совпало что они представлены одним и тем же битовым адресом

3 958

Что выведут 3 примера из поста выше?

Anonymous voting

3 958

Всем стоят, работают Code Detectives Да, это та самая рубрика, где мы публикуем часть кода, а вам нужно сказать, что он выведет. Варианты будут в опросе ниже, а объяснение мы опубликуем позже. Не забывайте, что если рубрика вам нравится, мы будем благодарны, если поставите реакцию, а другие посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside Итак, вот сама задачка: Что выведут следующие 3 примера?

x = 0.1 + 0.2 if x == 0.3: print(True) else: print(False) x = 0.5 + 0.2 if x == 0.7: print(True) else: print(False) x = 0.1 + 0.25 if x == 0.35: print(True) else: print(False)

#CodeDetective_MLinside

3 958

Машинное обучение меняется быстрее, чем кажется Подходы, которые ещё недавно считались стандартом, сегодня уже теряют актуальность и на эту тему у нас на YouTube, в ВК и Дзен вышло видео, где Александр Дубейковский (ML-Engineer Авито, ex-Yandex, эксперт MLinside) разбирает, какие знания по ML устаревают быстрее всего в 2026 году: от классических алгоритмов и старых NLP-подходов до инструментов и библиотек, которые постепенно уходят из продакшна. Видео будет полезно: • Новичкам в ML: чтобы не тратить время на устаревшие подходы и сразу учить актуальный стек • Junior ML-инженерам: чтобы понять, какие знания реально востребованы на практике • Тем, кто готовится к собеседованиям: чтобы не фокусироваться на том, что почти не спрашивают и не используют • Data Scientists: чтобы переоценить свой стек и актуализировать навыки • Backend/Data инженерам, переходящим в ML: чтобы быстрее понять, как изменилась индустрия • Практикующим специалистам: чтобы не отставать от трендов и понимать, куда движется рынок Видео вышло на всех площадках: https://youtu.be/ML1Df2_e9xA https://vkvideo.ru/video-228219607_456239208 https://dzen.ru/video/watch/69f34789cda828524c42f444

3 958

Через 5 минут начинаем прямой эфир с Виктором Кантором! Подключайтесь к трансляции на Youtube

3 958

Послезавтра, 29 апреля в 19:00 выходим в прямой эфир с Виктором Кантором на YouTube В эфире можно будет задать вопрос напрямую Виктору и пообщаться с ним на тему ML или AI. Также, Виктор расскажет про курс специализация «Искусственный интеллект и анализ данных». Задать вопрос Виктору заранее: https://forms.yandex.ru/u/69e884fe6d2d736b9b087371 Зарегистрируйтесь на трансляцию, чтобы не пропустить начало: https://t.me/ml_insideBot?start=web290426

3 958

В какой из точек производная функции y=f(x) принимает наибольшее значение?

Anonymous voting

3 958

Запускаем новую рубрику с математическими задачками Эта рубрика поможет прокачать прикладное математическое мышление. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса. Сегодня первая задачка и мы проверим, насколько хорошо вы чувствуете производные. Формат простой: посмотрите на график и ответьте на вопрос:

В какой из точек производная функции y=f(x) принимает наибольшее значение?

#math_MLinside

3 958

В какой из точек производная функции y=f(x) принимает наибольшее значение?

Anonymous voting

3 958

Python для ML: что нужно знать на старте? Python – основной язык в машинном обучении, но для старта не нужно знать его целиком. На YouTube, в ВК и Дзен у нас вышло видео с Александром Дубейковским, где он разбирает, какая часть Python действительно используется в ML, какие библиотеки важны и как выглядит реальная работа ML-инженера. Вы поймёте, почему Python, это в первую очередь инструмент для работы с данными и экспериментами, а не язык для сложной разработки. Видео будет полезно новичкам в ML (чтобы не тратить время на изучение лишнего и сразу сфокусироваться на нужных навыках), разработчикам, переходящим в ML (чтобы понять разницу между Python в backend и Python в машинном обучении), студентам и самоучкам (чтобы выстроить правильную траекторию обучения без перегруза) и тем, кто готовится к ML-собеседованию (чтобы понять, какой уровень Python реально ожидается). Если нашли себя в этом списке, welcome к нам, на любую из удобных площадок: https://youtu.be/_yAuLFKZZhk https://vkvideo.ru/video-228219607_456239206 https://dzen.ru/video/watch/69eb4b55a0b5d51d0ac7700c