en
Feedback
ML for Value / Ваня Максимов

ML for Value / Ваня Максимов

Open in Telegram

Путь от ML-модели до Value для компании | RecSys, Search, LLM, Pricing и CLTV Ваня Максимов, @Ivan_maksimov Head of AI | Recsys, search, llm @Y.Market, ex-WB, ex-Delivery Club Консультирую компании, Веду курсы Публикую релевантную рекламу

Show more
5 682
Subscribers
-224 hours
-27 days
+1730 days
Attracting Subscribers
June '26
June '26
+67
in 1 channels
May '26
+48
in 0 channels
Get PRO
April '26
+86
in 0 channels
Get PRO
March '26
+47
in 0 channels
Get PRO
February '26
+54
in 0 channels
Get PRO
January '26
+74
in 1 channels
Get PRO
December '25
+65
in 0 channels
Get PRO
November '25
+141
in 0 channels
Get PRO
October '25
+52
in 0 channels
Get PRO
September '25
+100
in 2 channels
Get PRO
August '25
+49
in 1 channels
Get PRO
July '25
+159
in 2 channels
Get PRO
June '25
+395
in 2 channels
Get PRO
May '25
+112
in 2 channels
Get PRO
April '25
+99
in 2 channels
Get PRO
March '25
+273
in 3 channels
Get PRO
February '25
+202
in 4 channels
Get PRO
January '25
+150
in 3 channels
Get PRO
December '24
+99
in 3 channels
Get PRO
November '24
+43
in 1 channels
Get PRO
October '24
+70
in 0 channels
Get PRO
September '24
+127
in 1 channels
Get PRO
August '24
+196
in 1 channels
Get PRO
July '24
+263
in 1 channels
Get PRO
June '24
+110
in 2 channels
Get PRO
May '24
+116
in 0 channels
Get PRO
April '24
+136
in 1 channels
Get PRO
March '24
+77
in 2 channels
Get PRO
February '24
+113
in 3 channels
Get PRO
January '24
+130
in 3 channels
Get PRO
December '23
+84
in 0 channels
Get PRO
November '23
+477
in 3 channels
Get PRO
October '23
+72
in 2 channels
Get PRO
September '23
+233
in 0 channels
Get PRO
August '23
+91
in 0 channels
Get PRO
July '23
+67
in 0 channels
Get PRO
June '23
+76
in 0 channels
Get PRO
May '23
+624
in 0 channels
Get PRO
April '23
+43
in 0 channels
Get PRO
March '23
+392
in 0 channels
Get PRO
February '23
+240
in 0 channels
Get PRO
January '23
+40
in 0 channels
Get PRO
December '22
+23
in 0 channels
Get PRO
November '22
+40
in 0 channels
Get PRO
October '22
+30
in 0 channels
Get PRO
September '22
+79
in 0 channels
Get PRO
August '22
+217
in 0 channels
Get PRO
July '22
+41
in 0 channels
Get PRO
June '22
+47
in 0 channels
Get PRO
May '22
+186
in 0 channels
Get PRO
April '22
+1 058
in 0 channels
Get PRO
March '220
in 0 channels
Get PRO
February '220
in 0 channels
Get PRO
January '220
in 0 channels
Get PRO
December '210
in 0 channels
Get PRO
November '210
in 0 channels
Get PRO
October '210
in 0 channels
Get PRO
September '210
in 0 channels
Get PRO
August '21
+2
in 0 channels
Get PRO
July '21
+3
in 0 channels
Get PRO
June '21
+14
in 0 channels
Get PRO
May '21
+4
in 0 channels
Get PRO
April '21
+292
in 0 channels
Date
Subscriber Growth
Mentions
Channels
30 June+3
29 June+1
28 June+1
27 June+1
26 June+4
25 June0
24 June+2
23 June+3
22 June+2
21 June+4
20 June+2
19 June+4
18 June+1
17 June+1
16 June+4
15 June+2
14 June+3
13 June+4
12 June+2
11 June+2
10 June+2
09 June+1
08 June+2
07 June+1
06 June+1
05 June+4
04 June+2
03 June+3
02 June+3
01 June+2
Channel Posts
The art of a strong baseline За последнее время все чаще понимаю, что создать сильный бейзлайн - это не просто база, с которой нужно начинать любой ml/ai продукт, а прям полноценная часть системы. Даже когда в проде уже давно есть трансформеры и агенты, бейзлайн дает прям много метрик Вот учите вы трансформер для персональных рекомендаций (sasrec, argus, pinnerformer, hstu - неважно).  И если в лоб его применить, то вероятно получите рекомендации из истории кликов. Потому что простой бейзлайн "уже изучал товар - покажи еще раз" чаще всего почти по любым метрикам релевантности будет лучше Окей, пофильтровали историю кликов / занизили таким позитивам вес в лоссе / сделали еще что-то - получили очень-очень похожие товары на последние 30-50 действий. Вот буквально товар того же бренда-категории, но чуть другого цвета условно. А это уже похоже на другой сильный бейзлайн - realtime slim/als/ease на последних 30-50 действиях На самом деле можно еще и дальше продолжать с бейзлайнами в этом кейсе или в других. Частые бейзлайны: - Персональные рекомендации - популярное, история, уже купленное для повторных покупок - item2item рекомендациях (похожие товары) - популярные товары того же бренда в той же категории  - Поиск - tfidf/bm25. Да, даже в эру dense retrieval и search agents если аккурфтно подтюнить bm25, то можно выбить sota. Есть даже подходы на основе Sparse autoencoderse , которые позволяют генерить не эмбеды запросов/документов, а их токены - и дальше применять обычный bm25 - Прогноз временных рядов - среднее значение в тот же день недели  ↔️ Я всегда стараюсь строить сильные бейзлайны, а потом учить более сильные модели для улучшения поверх них, а не для замены. Потому что какой толк учить условный sasrec/argus для запоминания истории кликов пользователя? Пустая трата компьюта + модель тратит свою капасити на тривиальные зависимости = что-то нетривиальное (и самое полезное + ожидаемое от нее) не учит Интересно, как не только я сам, но и другие люди в в индустрии / рисерче к этому подходят: я видел очень мало подобных работ. Если есть личные опыт или ссылки на полезные статьи - кидайте, с интересом почитаю!)

2
Начинать писать после перерыва всегда непросто, поэтому пока легкий пост про мои новости) Официально стал частью Transactiona+5
Начинать писать после перерыва всегда непросто, поэтому пока легкий пост про мои новости) Официально стал частью Transactional AI в Яндексе 🤖 Помимо персонализации всего в Я.Маркете буду делать ИИ-агентов для покупок товаров Съездил на теннисный турнир Barcelona Open 🎾 Мой первый турнир в качестве зрителя - это конечно топ! В полуфинале Рублев был крут, но и восходящие звезды Фис и Ходар впечатлили. Теперь еще больше мотивации все же сыграть и самому pro турнир уровня сильно пониже: ATP 15/25 Отметил 4ую годовщину с моей женой ❤️ Лучшее решение, всем советую) Бодро иду к своим 30 годам: записался на все чекапы и операции на год вперед 🔴 Собираю базу данных анализов для терапевта gpt :) Возобновил регулярный спорт: бег, качалка, теннис и улучшил питание Вот такие новости: а дальше пойдут посты про фейлы в ml — stay tuned, будет интересно!
1 614