ML for Value / Ваня Максимов
前往频道在 Telegram
Путь от ML-модели до Value для компании | RecSys, Search, LLM, Pricing и CLTV Ваня Максимов, @Ivan_maksimov Head of AI | Recsys, search, llm @Y.Market, ex-WB, ex-Delivery Club Консультирую компании, Веду курсы Публикую релевантную рекламу
显示更多5 685
订阅者
-124 小时
+47 天
+2530 天
数据加载中...
吸引订阅者
六月 '26
六月 '26
+61
在1个频道中
五月 '26
+48
在0个频道中
Get PRO
四月 '26
+86
在0个频道中
Get PRO
三月 '26
+47
在0个频道中
Get PRO
二月 '26
+54
在0个频道中
Get PRO
一月 '26
+74
在1个频道中
Get PRO
十二月 '25
+65
在0个频道中
Get PRO
十一月 '25
+141
在0个频道中
Get PRO
十月 '25
+52
在0个频道中
Get PRO
九月 '25
+100
在2个频道中
Get PRO
八月 '25
+49
在1个频道中
Get PRO
七月 '25
+159
在2个频道中
Get PRO
六月 '25
+395
在2个频道中
Get PRO
五月 '25
+112
在2个频道中
Get PRO
四月 '25
+99
在2个频道中
Get PRO
三月 '25
+273
在3个频道中
Get PRO
二月 '25
+202
在4个频道中
Get PRO
一月 '25
+150
在3个频道中
Get PRO
十二月 '24
+99
在3个频道中
Get PRO
十一月 '24
+43
在1个频道中
Get PRO
十月 '24
+70
在0个频道中
Get PRO
九月 '24
+127
在1个频道中
Get PRO
八月 '24
+196
在1个频道中
Get PRO
七月 '24
+263
在1个频道中
Get PRO
六月 '24
+110
在2个频道中
Get PRO
五月 '24
+116
在0个频道中
Get PRO
四月 '24
+136
在1个频道中
Get PRO
三月 '24
+77
在2个频道中
Get PRO
二月 '24
+113
在3个频道中
Get PRO
一月 '24
+130
在3个频道中
Get PRO
十二月 '23
+84
在0个频道中
Get PRO
十一月 '23
+477
在3个频道中
Get PRO
十月 '23
+72
在2个频道中
Get PRO
九月 '23
+233
在0个频道中
Get PRO
八月 '23
+91
在0个频道中
Get PRO
七月 '23
+67
在0个频道中
Get PRO
六月 '23
+76
在0个频道中
Get PRO
五月 '23
+624
在0个频道中
Get PRO
四月 '23
+43
在0个频道中
Get PRO
三月 '23
+392
在0个频道中
Get PRO
二月 '23
+240
在0个频道中
Get PRO
一月 '23
+40
在0个频道中
Get PRO
十二月 '22
+23
在0个频道中
Get PRO
十一月 '22
+40
在0个频道中
Get PRO
十月 '22
+30
在0个频道中
Get PRO
九月 '22
+79
在0个频道中
Get PRO
八月 '22
+217
在0个频道中
Get PRO
七月 '22
+41
在0个频道中
Get PRO
六月 '22
+47
在0个频道中
Get PRO
五月 '22
+186
在0个频道中
Get PRO
四月 '22
+1 058
在0个频道中
Get PRO
三月 '220
在0个频道中
Get PRO
二月 '220
在0个频道中
Get PRO
一月 '220
在0个频道中
Get PRO
十二月 '210
在0个频道中
Get PRO
十一月 '210
在0个频道中
Get PRO
十月 '210
在0个频道中
Get PRO
九月 '210
在0个频道中
Get PRO
八月 '21
+2
在0个频道中
Get PRO
七月 '21
+3
在0个频道中
Get PRO
六月 '21
+14
在0个频道中
Get PRO
五月 '21
+4
在0个频道中
Get PRO
四月 '21
+292
在0个频道中
| 日期 | 订阅者增长 | 提及 | 频道 | |
| 26 六月 | +4 | |||
| 25 六月 | 0 | |||
| 24 六月 | +2 | |||
| 23 六月 | +3 | |||
| 22 六月 | +2 | |||
| 21 六月 | +4 | |||
| 20 六月 | +2 | |||
| 19 六月 | +4 | |||
| 18 六月 | +1 | |||
| 17 六月 | +1 | |||
| 16 六月 | +4 | |||
| 15 六月 | +2 | |||
| 14 六月 | +3 | |||
| 13 六月 | +4 | |||
| 12 六月 | +2 | |||
| 11 六月 | +2 | |||
| 10 六月 | +2 | |||
| 09 六月 | +1 | |||
| 08 六月 | +2 | |||
| 07 六月 | +1 | |||
| 06 六月 | +1 | |||
| 05 六月 | +4 | |||
| 04 六月 | +2 | |||
| 03 六月 | +3 | |||
| 02 六月 | +3 | |||
| 01 六月 | +2 |
频道帖子
The art of a strong baseline
За последнее время все чаще понимаю, что создать сильный бейзлайн - это не просто база, с которой нужно начинать любой ml/ai продукт, а прям полноценная часть системы. Даже когда в проде уже давно есть трансформеры и агенты, бейзлайн дает прям много метрик
Вот учите вы трансформер для персональных рекомендаций (sasrec, argus, pinnerformer, hstu - неважно).
И если в лоб его применить, то вероятно получите рекомендации из истории кликов. Потому что простой бейзлайн "уже изучал товар - покажи еще раз" чаще всего почти по любым метрикам релевантности будет лучше
Окей, пофильтровали историю кликов / занизили таким позитивам вес в лоссе / сделали еще что-то - получили очень-очень похожие товары на последние 30-50 действий. Вот буквально товар того же бренда-категории, но чуть другого цвета условно. А это уже похоже на другой сильный бейзлайн - realtime slim/als/ease на последних 30-50 действиях
На самом деле можно еще и дальше продолжать с бейзлайнами в этом кейсе или в других. Частые бейзлайны:
- Персональные рекомендации - популярное, история, уже купленное для повторных покупок
- item2item рекомендациях (похожие товары) - популярные товары того же бренда в той же категории
- Поиск - tfidf/bm25. Да, даже в эру dense retrieval и search agents если аккурфтно подтюнить bm25, то можно выбить sota. Есть даже подходы на основе Sparse autoencoderse , которые позволяют генерить не эмбеды запросов/документов, а их токены - и дальше применять обычный bm25
- Прогноз временных рядов - среднее значение в тот же день недели
↔️ Я всегда стараюсь строить сильные бейзлайны, а потом учить более сильные модели для улучшения поверх них, а не для замены. Потому что какой толк учить условный sasrec/argus для запоминания истории кликов пользователя? Пустая трата компьюта + модель тратит свою капасити на тривиальные зависимости = что-то нетривиальное (и самое полезное + ожидаемое от нее) не учит
Интересно, как не только я сам, но и другие люди в в индустрии / рисерче к этому подходят: я видел очень мало подобных работ. Если есть личные опыт или ссылки на полезные статьи - кидайте, с интересом почитаю!)
| 2 | Начинать писать после перерыва всегда непросто, поэтому пока легкий пост про мои новости)
Официально стал частью Transactional AI в Яндексе 🤖
Помимо персонализации всего в Я.Маркете буду делать ИИ-агентов для покупок товаров
Съездил на теннисный турнир Barcelona Open 🎾
Мой первый турнир в качестве зрителя - это конечно топ! В полуфинале Рублев был крут, но и восходящие звезды Фис и Ходар впечатлили.
Теперь еще больше мотивации все же сыграть и самому pro турнир уровня сильно пониже: ATP 15/25
Отметил 4ую годовщину с моей женой ❤️
Лучшее решение, всем советую)
Бодро иду к своим 30 годам: записался на все чекапы и операции на год вперед 🔴
Собираю базу данных анализов для терапевта gpt :)
Возобновил регулярный спорт: бег, качалка, теннис и улучшил питание
Вот такие новости: а дальше пойдут посты про фейлы в ml — stay tuned, будет интересно! | 1 614 |
| 3 | LLM - велосипед в новой обертке
Холиварный пост выходного дня)
Доля правды в этом есть - и это наоборот круто!
LLM научились довольно неплохо решать в zero shot режиме (без обучения на доп данных) классические задачи:
- Классификация текста
- Named entity recognition (NER)
- Суммаризация текста
- Question answering по тексту (хотя тут еще есть куда расти)
Куча бизнес-задач = комбинация нескольких таких простых классических задач
🆘 Автоматизация поддержки пользователей = Классифицировать запрос пользователя + достать нужный кусок документации / инфы о юзере из базы данных (RAG) + ответить на вопрос по вытащенным данным (question answering)
И если раньше на каждый кусочек задачи нужно было учить свои модели, что долго/дорого, то сейчас это решает LLM…не всегда дешево, но заметно быстрее!
Подобных примеров в бизнесе еще довольно много: автоматизация пушей, генерация простого контента по шаблону, …
P.S. Настоящий reasoning я пока вижу только на очень «строгих» и задачах с понятными критериями успеха: написание отдельных кусков кода и решение не оч сложных математических задач
В общем, решать много простых задач = решать и сложные задачи, которые можно разделить на несколько простых. И тогда хорошо решать простые задачи = успех 🚀 | 1 622 |
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
