Время Валеры
Мне платят за то, что я говорю другим людям что им делать. Автор книги https://www.manning.com/books/machine-learning-system-design https://venheads.io https://www.linkedin.com/in/venheads
Show more📈 Analytical overview of Telegram channel Время Валеры
Channel Время Валеры (@cryptovalerii) in the Russian language segment is an active participant. Currently, the community unites 30 163 subscribers, ranking 4 556 in the Technologies & Applications category and 21 809 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 30 163 subscribers.
According to the latest data from 16 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 32 over the last 30 days and by 0 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 65.04%. Within the first 24 hours after publication, content typically collects 27.23% reactions from the total number of subscribers.
- Post reach: On average, each post receives 19 618 views. Within the first day, a publication typically gains 8 213 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 204.
- Thematic interests: Content is focused on key topics such as engineer, claude, стартап, архитектура, many.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Мне платят за то, что я говорю другим людям что им делать.
Автор книги https://www.manning.com/books/machine-learning-system-design
https://venheads.io
https://www.linkedin.com/in/venheads”
Thanks to the high frequency of updates (latest data received on 17 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
Data loading in progress...
| Date | Subscriber Growth | Mentions | Channels | |
| 16 June | +11 | |||
| 15 June | +2 | |||
| 14 June | +7 | |||
| 13 June | +14 | |||
| 12 June | +23 | |||
| 11 June | +11 | |||
| 10 June | +14 | |||
| 09 June | +36 | |||
| 08 June | +13 | |||
| 07 June | +10 | |||
| 06 June | +8 | |||
| 05 June | +12 | |||
| 04 June | +22 | |||
| 03 June | +12 | |||
| 02 June | +11 | |||
| 01 June | +8 |
Поучаствовать в розыгрыше очень просто — напиши в комментариях, как используешь LLM в работе или повседневной жизни. Автор самого интересного и экзотического (по мнению ведущих подкаста) варианта применения LLM получит в подарок книгу с автографом Валерия.Период розыгрыша — с 15 по 23 июня, победителя* объявим под этим постом. Включай свежий выпуск, вдохновляйся и лови инсайты! 🔵VK Видео 🔵Аудиоверсии *Розыгрыш действует только на территории РФ.
| 2 | Вышел эпизод подкаста - Деньги любят Техно | 7 205 |
| 3 | Монументальный пост от моего друга - From App Factories to a Reasoning Compiler
I didn’t plan to build a compiler — I just wanted to maximize out of the AI agents I had.
What is an AI agent today? It’s actually quite simple. There is a language model — the brain and the center of decision making. And there is a harness around the model: the environment where the model works — the thing that makes the model an agent. Without the harness the model is just a text generator, sometimes quite a smart one.
Most of the resources of the labs around the world go into improving the models, which we use as is — and thank god, it’s not us who pay for their training. The harness gets much less attention from the research community. So I have good news for you: the harness is exactly the place where an indie researcher can make a contribution, without having the resources of the frontier labs. | 9 523 |
| 4 | Нелёгкая судьба иностранного корреспондента вновь занесла меня на теннисный корт.
В этот раз на women's finals на Queen's Championships.
В прошлый раз, на Уимблдоне, это было событие. Самый короткий женский финал за всю историю: 6-0, 6-0.
Посмотрим, что выйдет в этот раз. | 10 185 |
| 5 | По мотивам последних событий
Tell anyone who will listen that you’re as dangerous as nuclear weapons, then one of your top investors and tech partners reports jailbreaks, then you say it was all a misunderstanding | 10 857 |
| 6 | На infra.conf 2026 Яндекс рассказал про Dev Cluster — штуку, которая должна была появиться давно. Это динамическое распределение GPU-ресурсов внутри их ML-платформы.
Суть следующая: ML-инженер за пару кликов получает контейнер с нужной GPU-конфигурацией — без заявок, без ожидания, без "Игорь,ты уже два года не возвращаешь битки ты уже два дня не трогаешь свою ГПУ, отдай". Говорят, ресурсы доступны за секунды.
Главная боль, которую это решает, — простой GPU. Когда у тебя парк машин, а люди вручную бронируют их и забывают отпускать (что происходит всегда), утилизация хуже, чем у Игоря. Dev Cluster перераспределяет мощности динамически — разработчики фокусируются на экспериментах, а не на - кто забрал мою ноду
Это часть единой ML-платформы, которая покрывает весь цикл от данных до деплоя. Её делают ребята из Yandex Infrastructure, которые строят дата-центры.
Возможно, это поможет вам не потратить 500 млн долларов на токены за месяц. | 14 424 |
| 7 | Прочитал интересную (и применимую) статью Rethinking Early Stopping: Refine, Then Calibrate.
Часто в курсах по машинному обучению говорят, что ошибку системы можно разложить на bias, variance, noise. На некоторых редких курсах даже учат, как это считать и что с этим делать дальше.
Попробуем посмотреть на эту проблему с другой стороны. В задачах вероятностной классификации loss для proper scoring rules можно разложить на: calibration и refinement.
Калибровка — мы сказали, что вероятность 80%. Сколько из взятых образцов будут принадлежать к классу 1? (Считать это можно через ECE — Expected Calibration Error).
Refinement — насколько хорошо модель разделяет классы. Допустим, модель выдала скор 0.9, все образцы оказались класса 1, а все, что ниже — класса 0. Модель откалибрована так себе, но разделяет классно. Собственно, если бы модель была откалибрована, мы могли бы выбирать отсечку вероятностно через саму вероятность.
Легко представить и обратную ситуацию: модель прекрасно откалибрована, но разделяет плохо. Например, модель, которая всегда предсказывает вероятность 50% для честной монетки, идеально откалибрована, но её разделяющая способность минимальна.
Из чего делаем вывод, что в какой-то момент улучшение функции потерь, из тех что относятся к семейству proper scoring functions, может происходить лишь за счет улучшения калибровки или даже ухудшать разделение, но за счет большого по величине улучшения калибровки выдавать лучший скор.
Это плохо. Калибровку часто можно существенно поправить потом post-hoc методами, поэтому остановка обучения по лоссу на валидации может привести к ситуации, что мы взяли далеко не лучший чекпойнт.
Что делать?
Сохранить несколько чекпойнтов модели.
Откалибровать каждый из них одинаковым методом.
Только после этого сравнивать их по loss.
В таком случае для каждого чекпойнта мы отдельно минимизируем доступную calibration error выбранным post-hoc методом (ссылка на запись вебинара), а разница в loss начинает лучше отражать именно качество разделения классов. Соответственно, мы выбираем модель с лучшей разделяющей способностью, а не ту, которая случайно оказалась лучше откалибрована на данном этапе обучения.
Проверили на датасетах для computer vision и 196 табличных датасетах — так и оказалось, победа.
Может ли это хотя бы частично объяснять эффекты вроде grokking или double descent?
Там мы тоже наблюдаем нетривиальную динамику loss во времени. Возможно, на ранних этапах обучения модель в основном улучшает калибровку, затем временно жертвует ей ради построения более качественной разделяющей поверхности, а потом начинает улучшать уже обе составляющие одновременно. | 18 565 |
| 8 | Говорят, в Лондоне мания на манго Альфонсо из Индии, которых экспортируют суммарно не более 1%.
Первый раз я такие попробовал в мае 2024 года в городе Пуне.
Не знаю, есть мания или нет, но сегодня мой дилер передал мне коробку | 15 125 |
| 9 | Согласился стать техническим редактором книги:
Cracking the AI Systems Design Interview от Manning Publications
Дело за малым: автору написать книгу, а мне прочитать и превратить её в курс. | 15 818 |
| 10 | Игорь скинул статью от Steve Egge — The last technical interview.
Хорошая статья, Steve описал примерно то, что я понял на первом году директорства, и повторил недавно в записи подкаста Деньги Любят техно.
Лучшим сигналом по тому, будет ли человек хорошим сотрудником, является работа с ним, поэтому, чтобы быстро и хорошо нанимать, нужно уметь быстро увольнять.
Стив в статье пытается достичь этого другими методами, вроде временного employment и стажировок, но принцип тот же.
Рад, что он пришел к этому за 35 лет.
Примерно так же, как FDE стали популярны недавно, а в Х5 существовали еще с 2018 года в виде группы ad hoc аналитики.
Страшно подумать, какие следующие инновационные методики, созданные в Х5, будут открыты миру в будущем. | 24 725 |
| 11 | Два классных проекта от Microsoft про skills для LLM-агентов:
SkillOpt project page: https://microsoft.github.io/SkillOpt/
SkillLens project page: https://microsoft.github.io/SkillLens/
SkillOpt — это метод Microsoft для “обучения” текстовых skill-файлов для LLM-агентов. Модель не fine-tune’ят, веса не меняют. Система гоняет агента на задачах, смотрит на ошибки и успешные траектории, редактирует markdown-инструкцию, проверяет новую версию на validation set и оставляет только те правки, которые улучшают результат. Правки, которые ухудшают результат, тоже сохраняются в память как rejected edits, чтобы не повторять те же ошибки. Получается training loop для prompt/skill-документа.
SkillLens — это исследование того, как такие model-generated skills работают: как они извлекаются из прошлых траекторий агента, когда помогают, когда вредят, почему один skill может улучшать GPT, но ломать Qwen, и почему “красиво написанный skill” не обязательно полезен. Строим lifecycle : experience → extraction → consumption. | 22 620 |
| 12 | Привет!
Встречайте двадцатый выпуск подкаста "Капитанский мостик". В этом выпуске в гостях у капитанов был Валера Бабушкин, поговорили про актуальные вопросы найма, ИИ в промышленности и вообще все все на свете! 🔥
Ведущие подкаста - Валентин Малых и Дмитрий Колодезев.
Смотрите видео на каналах ⤵️
ODS VK Video
ODS YouTube
📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai). | 20 858 |
| 13 | Как ИИ меняет A/B-тесты? — об этом расскажет Валерий Бабушкин в новом интервью 😀
Мы хотим сделать разговор максимально интересным и полезным, поэтому собираем вопросы от вас 👀
Что вам действительно интересно узнать по этой теме? Какие изменения в A/B-тестах из-за ИИ вас удивляют, бесят или вызывают вопросы?
Пишите в комментариях — лучшие вопросы зададим Валерию😀 | 18 751 |
| 14 | Датафест прошел успешно. После выступления меня держали более 4 часов в заложниках. | 19 096 |
| 15 | ✅ Интервью + тренировка с Валерием Бабушкиным
Можете пока монтируется видос, подписаться на его канал:
https://t.me/cryptovalerii | 22 441 |
| 16 | Некоторые давно просили, скоро будет | 17 818 |
| 17 | Валерий Бабушкин и тот самый курс по ML System Design в MLinside
Если вы давно хотели разобраться, как проектируют ML-системы в реальных продуктах – это то, что вам нужно.
Курс посвящён проектированию ML-систем для реальных продуктов: работе с архитектурой, пайплайнами обучения, deployment-процессами, мониторингом моделей, оптимизацией инференса и поддержкой ML под нагрузкой. Также на курсе разберём подходы к проектированию современных агентских AI-систем и интеграции LLM в production-инфраструктуру.
На курсе вы научитесь:
▪️проектировать ML-системы под реальные ограничения
▪️строить ML design docs
▪️выбирать метрики и функции потерь
▪️выстраивать пайплайны обучения
▪️анализировать ошибки моделей
▪️внедрять ML в продукт
▪️мониторить качество моделей в продакшене
▪️оптимизировать инференс под нагрузку
Курс подойдёт ML-инженерам, тимлидам ML-команд и начинающим специалистам, которым нужен системный взгляд на ML.
Преподаватель – Валерий Бабушкин, наверняка он не нуждается в представлении, но всё же:
▪️Senior Director по Data & AI в BP
▪️грандмастер Kaggle
▪️автор книги Machine Learning System Design.
Курс будет идти 4 месяца и вас ждут 60 занятий, реальные кейсы, разбор design docs, архитектурные решения из production ML, а главное – live-обсуждения и ревью с Валерием. Посмотреть сайт можно тут.
Это курс для тех, кто хочет перейти от “умею обучать модели” к “умею строить ML-системы”.
Стартуем 1 июня, количество мест ограничено. Записаться можно по ссылке. | 20 291 |
| 18 | 1 июня стартует набор на курс.
Сам курс, скорее всего, будет запущен в середине июля.
~ 60-70 часов живого контента
Форма для связи по вопросам | 16 013 |
| 19 | 1 июня стартует набор на курс.
Сам курс, скорее всего, будет запущен в середине июля.
~ 60-70 часов живого контента
Форма для связи с менеджером по вопросам | 0 |
| 20 | 23 мая буду выступать на открытии Data Fest 2026 на площадке X5 Tech в Москве
В рамках секции Open Career поделюсь размышлениями:
▫️ Почему важно не идентифицировать себя через работу
▫️ Почему плохой менеджер для одного - хороший для другого
▫️ Что такое завтрак (главный вопрос современности)
▫️ Агентность как отличительная черта успеха (статья Child’s Play)
▫️ Как изменился мой взгляд на аутстафф и из-за чего
Ещё в программе будет много докладов секций ALLMs, Data Strategy, Data и ML в Retail, Reliable ML. Регистрация на ивент тут 👈
Всего у феста будет 12 офлайнов, ссылки на все офлайны можно найти на странице ивента, | 23 629 |
Available now! Telegram Research 2025 — the year's key insights 
