Information Retriever

رفتن به کانال در Telegram

Author: @kkhrylchenko Рекламу не размещаю.

نمایش بیشتر

روسيا133 107 فناوری و برنامه‌ها21 453

4 013

مشترکین

اطلاعاتی وجود ندارد24 ساعت

+157 روز

+5930 روز

3 234

نمایش های پست

اطلاعاتی وجود ندارد24 ساعت

اطلاعاتی وجود ندارد48 ساعت

80.51%

نرخ مشارکت

اطلاعاتی وجود ندارد

پست های در روز

Ads index

beta

در حال بارگیری داده...

کانال‌های مشابه

30.3K

Время Валеры

11.6K

Small Data Science for Russian Adventurers

5.9K

from:adam

5.7K

ML for Value / Ваня Максимов

5.7K

Knowledge Accumulator

کانال‌های بیشتر

اشارات ورودی و خروجی

---

جذب مشترکین

ژوئیه '26

+19

در 0 کانال‌ها

ژوئن '26

+118

در 0 کانال‌ها

Get PRO

مه '26

+157

در 1 کانال‌ها

Get PRO

آوریل '26

+125

در 0 کانال‌ها

Get PRO

مارس '26

+90

در 1 کانال‌ها

Get PRO

فوریه '26

+172

در 4 کانال‌ها

Get PRO

ژانویه '26

+163

در 6 کانال‌ها

Get PRO

دسامبر '25

+87

در 1 کانال‌ها

Get PRO

نوامبر '25

+105

در 3 کانال‌ها

Get PRO

اکتبر '25

+109

در 2 کانال‌ها

Get PRO

سپتامبر '25

+95

در 3 کانال‌ها

Get PRO

اوت '25

+119

در 7 کانال‌ها

Get PRO

ژوئیه '25

+121

در 5 کانال‌ها

Get PRO

ژوئن '25

+126

در 5 کانال‌ها

Get PRO

مه '25

+176

در 7 کانال‌ها

Get PRO

آوریل '25

+193

در 1 کانال‌ها

Get PRO

مارس '25

+197

در 3 کانال‌ها

Get PRO

فوریه '25

+103

در 2 کانال‌ها

Get PRO

ژانویه '25

+143

در 1 کانال‌ها

Get PRO

دسامبر '24

+112

در 4 کانال‌ها

Get PRO

نوامبر '24

+69

در 1 کانال‌ها

Get PRO

اکتبر '24

+117

در 2 کانال‌ها

Get PRO

سپتامبر '24

+196

در 2 کانال‌ها

Get PRO

اوت '24

+78

در 0 کانال‌ها

Get PRO

ژوئیه '24

+131

در 1 کانال‌ها

Get PRO

ژوئن '24

+199

در 2 کانال‌ها

Get PRO

مه '24

+74

در 1 کانال‌ها

Get PRO

آوریل '24

+89

در 1 کانال‌ها

Get PRO

مارس '24

+119

در 0 کانال‌ها

Get PRO

فوریه '24

+67

در 1 کانال‌ها

Get PRO

ژانویه '24

+1 048

در 4 کانال‌ها

تاریخ	رشد مشترکین	اشارات	کانال‌ها
08 ژوئیه	0
07 ژوئیه	0
06 ژوئیه	+3
05 ژوئیه	+1
04 ژوئیه	+1
03 ژوئیه	+4
02 ژوئیه	+4
01 ژوئیه	+6

پست‌های کانال

You and Your Research. Я уже упоминал "An Opinionated Guide to ML Research" Джона Шульмана (тык), а сегодня хочу рассказать про другое эссе, на которое ссылается сам Шульман. А именно — про "You and Your Research" Ричарда Хэмминга (того самого, который hamming distance). Оказалось, он на протяжении своей карьеры целенаправленно изучал, что делает других ресерчеров успешными. Почти инфоцыганством занимался =) Собственно, в рамках эссе делится своими выводами по теме. Например: * если не стараться работать именно над важными задачами, то и крутых результатов не достигнешь. Очень легко скатиться в более простые и понятные задачи, которыми заниматься комфортно, но к каким-то значимым результатам они не приведут * по вечерам пятницы он выделил себе время, чтобы размышлять над тем, что вообще в его области сейчас происходит важного, какие есть самые важные вопросы, проблемы, задачи. Буквально 10% своего времени на такое философствование * когда получаешь новую информацию, нужно стараться связать её со всем, что уже знаешь; чтобы её потом было проще найти и использовать Прямо пересказывать эссе не хочется, когда оно у вас есть в прямой доступности. Там еще много разных мыслей, а воды почти нет. Прочитайте / посмотрите сами! Есть транскрибация оригинального выступления 1986 года — https://www.cs.virginia.edu/~robins/YouAndYourResearch.pdf, как раз на неё ссылается Шульман. Есть запись выступления 1995-го года на YouTube — https://www.youtube.com/watch?v=a1zDuOPkMSw.

2	Research Is Not Engineering at a Slower Speed. https://voiceinthemachine.com/2026/06/10/research-is-not-engineering-at-a-slower-speed/ Я когда-то уже писал пост про то, чем занималась моя R&D команда, а тут вышел довольно интересный write up про различия между ресерчем, R&D и продуктовой разработкой от очень опытного чувака (сам Ян Лекун его рекомендует). Tldr такой, что в ресерче и продуктовой разработке все просто и понятно (с точки зрения ролей, системы оценивания и тд), а в R&D — наоборот. И что компании часто смешивают внутри R&D кучу всякой деятельности. У меня ровно так и было — команда одновременно делала: * и ресерч — копание в статьях, создание новых моделей и архитектур; была наша собственная амбиция догнать и перегнать дипмайнд по части рекомендашек * и довольно большой объем продуктовой разработки — копание в конкретных продуктовых доменах, активное участие в доведении моделей до прода, много внедрений каждое полугодие * и строила инфру — инструменты для работы с данными, обучения и внедрения моделей В статье также много места посвящено тому, где компании часто спотыкаются: 1. Оценивают ресерчеров по инженерным метрикам 2. Называют инженерную деятельность прорывным ресерчем 3. Теряют тот ресерч, который зародился сам по себе и не вписывается в рамки существующих процессов Со всеми пунктами тоже согласен, видел похожее на практике. Чтобы был сильный ресерч, нужны соответствующие люди, с нужными навыками и опытом. Все эти три пункта мешают найму/росту таких людей; скорее их отталкивают. До сих пор довольно много про это думаю в контексте рексистем — как правильно организовать такую команду, как её правильно оценивать, как найти/взрастить нужных людей, органично интегрироваться в структуру большой организации. Мыслей и идей за последний год накопилось много, надеюсь, доведется их как-нибудь реализовать.	2 814
3	Следующая аватарка канала	2 716
4	Команда ванрека выпустила новый тех репорт, про ризонинг, на 108 страниц. Скоро начнут выпускать пятитомники)) https://arxiv.org/abs/2606.06260	2 810
5	Deep RecSys Course — В С Ё! Вот и все! Неплохой получился курс: интересный, весёлый, порой немного грустный, а главное поучительный... Получилось 13 лекций: 1. Введение в рекомендательные системы 2. ML дизайн рекомендательных систем 3. Двухбашенные нейросети I: обучение 4. Двухбашенные нейросети II: архитектура 5. Нейросетевое ранжирование I: обработка признаков 6. Нейросетевое ранжирование II: слои 7. Рекомендации на последовательностях 8. Графовые нейросети 9. Ранжирование в рекламной сети Яндекса (гостевая лекция) 10. Обучение с подкреплением I: exploration и бандитные алгоритмы 11. Обучение с подкреплением II: REINFORCE 12. Генеративные рекомендации 13. Исследования Sber AI Lab в области рексистем Большая часть семинаров — это разборы основных статей по теме; по сути, мы провели небольшой научный семинар в рамках курса. А ещё у нас были домашние задания, подготовленные специально для курса: 1. Бейзлайны: item-to-item CF, ALS, эвристики 2. Двухбашенные нейросети, где нужно было пощупать разные лоссы, включая logQ коррекцию 3. Нейросетевое ранжирование: PLE, unified embeddings, DCN-v2, многоголовость, ResNet/DenseNet 4. Авторегрессивные трансформеры для next-item prediction И, наконец, есть финальный проект, который ребята еще сдают; в рамках него нужно на основе статьи сделать свое собственное мини-исследование. Все материалы можно найти на Github, а записи — на YouTube. Для ленивых есть отдельный плейлист. Я очень рад, что получилось сделать такой большой курс, и даже записать его и выложить целиком. На это, конечно, потребовалось просто гигантское количество времени)) Раньше ребята, которые выходили работать ко мне в команду, получали эти знания по крупицам целыми ГОДАМИ. А здесь можно получить те же знания, посмотрев 30+ часов концентрированного контента. Хочу сказать спасибо: 1. Артёму Матвееву и Владимиру Байкалову, которые выделили свое драгоценное свободное время, чтобы подготовить и провести целых 11 семинаров, а также помогли подготовить и проверить кучу домашних заданий 2. Нашим гостям Сергею Макееву, Александру Андрееву, Маргарите Мишустиной и Алексею Васильеву, которые сделали в рамках курса отличные гостевые доклады 3. ФКН НИУ ВШЭ и в частности Евгению Соколову за то, что фактически спонсировали всю эту мою активность. И еще и разрешили сделать её открытой. Без ВШЭ и Евгения никакого открытого курса бы не было! 4. Нашей замечательной команде курса в ШАД, с которой началась эта эпопея по созданию рексис курса. И в частности Дане Ткаченко, который изначально позвал меня вместе делать курс в ШАДе А вам, дорогие мои читатели, спасибо, что читали, слушали и поддерживали. Fin. :)	6 361
6	Deep RecSys Course XIII. Сегодня было финальное занятие курса — гостевая лекция от Лёши Васильева, руководителя команды рекомендательных систем Sber AI Lab. Лёша в подробностях рассказывал про статьи, в написании которых участвовала его команда; некоторые из них мы уже упоминали в рамках курса. Был блок статей про оценку качества: 1. Quality Metrics in Recommender Systems: Do We Calculate Metrics Consistently? 2. An Analysis of Sequential Patterns in Datasets for Evaluation of Sequential Recommendations 3. Time to Split: Exploring Data Splitting Strategies for Offline Evaluation of Sequential Recommenders И про алгоритмы: 1. Turning Dross Into Gold Loss: is BERT4Rec really better than SASRec? 2. Autoregressive Generation Strategies for Top-K Sequential Recommendations 3. Let It Go? Not Quite: Addressing Item Cold Start in Sequential Recommendations with Content-Based Initialization У Лёши есть тг-канал — @recsys_themes. Подписывайтесь!	2 732
7	Wake up, honey, a new Google DeepMind RecSys paper just dropped. Вышла статья ORBIT: Preserving Foundational Language Capabilities in GenRetrieval via Origin-Regulated Merging от авторов TIGER и PLUM. Если натюнить LLM на рекомендательную задачу, она теряет способность "разговаривать", если не тюнить — качество рекомендаций плохое. Как получить модель, которая одновременно и разговаривает, и хорошо рекомендует? Про PLUM. В PLUM они файнтюнили Gemini на задачу рекомендаций в два этапа: 1) Сначала учили модель понимать каталог через две задачи — предсказание следующего айтема и восстановление метаданных айтема по semantic ID 2) Затем дообучали на generative retrieval В статье были черри-пикнутые примеры на тему того, что после первой стадии модель все еще понимает естественный язык. Но про вторую стадию таких примеров не было, что наводило на мысль, что после generative retrieval fine-tuning модель так уже не умеет, то есть разговорные способности теряются. Собственно, в новой статье они это явно рассказали. Что делают в новой статье. Используют model merging — простое усреднение параметров нескольких чекпойнтов модели. Берут исходный "разговорный" чекпойнт LLM (здесь это 1B версия Gemma3) и усредняют его с дообученной на рекомендации версией. Если усреднять уже в самом конце дообучения, то работает плохо, а вот если по мере дообучения раз в какое-то количество шагов — работает хорошо. Origin-Regulated Merging. Метод Soup-to-go, который раз в K шагов делает слияние моделей, уже довольно неплохо работает. Но авторы смогли относительно него еще улучшиться — заметили, что чем "дальше" их модель от исходного разговорного чекпойнта, тем больше падают способности, связанные с текстом. Они ввели метрику близости между чекпойнтами модели (рассматривают два варианта — евклидово расстояние и доля несовпадающих по знаку параметров) и задали пороговое значение метрики, после которого должно срабатывать слияние текущего чекпойнта с исходной LLM. Сначала слияние происходит часто (e.g., каждые 500 шагов), затем реже (каждые 3к шагов). Мое мнение. * Как всегда, пользуются надежным рецептом успеха — адаптируют к рексистемам общие deep learning техники. Кажется, в DL такой трюк используют с 2022-го года — начиная со статьи Model Soups * Для замера рекомендательного качества используют очень нереалистичный сетап из TIGER — Amazon reviews с leave-one-out сплитом, еще и всего 20 событий в истории пользователя * И важный момент — усредненная модель всё еще существенно хуже на рекомендательных задачах, чем просто зафайнтюненная модель; и хуже на разговорных, чем исходный чекпойнт LLM	3 368
8	بدون متن...	2 485
9	Сегодня у нас в дипрексис курсе было большое занятие про генеративные рекомендации. Лекция получилась насыщенная, тем много, если вам интересно, что сейчас происходит в области — стоит посмотреть! О чем рассказывал: 1. Что такое генеративные модели — сейчас словом "генеративный" называют все что попало; и рекомендаций это тоже коснулось. Если хотите уметь подловить человека, когда он использует термин неправильно — эта секция для вас)) 2. Генеративное ранжирование — в 2024 году вышла нашумевшая статья "Actions speak louder than words...", которая много кого вдохновила (включая меня) на то, чтобы перейти на авторегрессивное обучение рекомендательных моделей и сделать попытку их замасштабировать (spoiler: так появился ARGUS). Узнать, действительно ли в этой статье были "генеративные рекомендации" или это фейк можно по ссылке... 3. Generative retrieval & semantic IDs — в 2023 году вышла статья "Recommender systems with generative retrieval", которая представила концепт "semantic IDs" (дискретные представления объектов на основе контента для рекомендаций) и объединила его с концептом генеративного ретривала из DSI. Сначала статью не заметили, но на сцену VideoRecSys воркшопа RecSys'24 вышел небезызвестный Эд Чи и понеслось: сейчас все вокруг внедряют generative retrieval вместо двухбашенных моделей, а semantic IDs стали ключевым строительным кирпичиком и для генеративных кандгенов, и для одностадийных рексистем, и для разговорных рексистем. Чтобы уметь поддержать светскую беседу про семантические айдишники, надо всего лишь нажать сюда 4. Одностадийные рексистемы — в 2025 году вышел очередной next big thing в рекомендациях — OneRec. В статье инженеры из Kuaishou описали успешный рецепт внедрения одностадийной рексистемы: generative retrieval + encoder-decoder + RL. Но есть один нюанс — узнать его можно по ссылке... 5. Разговорные рексистемы — в наше время рекомендательные системы очень хорошо удерживают внимание пользователей. Когда заработает долгосрочный RL из прошлой лекции, все станет еще хуже)) Единственное решение — дать пользователям больше контроля над рекомендациями. Но всякие разные настройки/ползунки/фильтры не работают, люди ими банально не пользуются. Выход есть — и это разговорные рекомендации! Чтобы узнать, чем занимаются инженеры из YouTube и Spotify прямо сейчас в 2026 году, нужно всего лишь... (тык) На семинаре был разбор той самой статьи "Recommender systems with generative retrieval" из пункта 3. В курсе осталось одно занятие — гостевая лекция. Фух! Можно приступать к следующей фазе захвата рекомендательного мира 👀	2 749
10	В первые две минуты аниме Lazarus (последняя на текущий момент работа Шиничиро Ватанабэ, автора моего любимого Ковбоя Бибопа) есть сцена, в которой герой в автомобиле пользуется разговорными рекомендациями — просит включить музыку с нужным вайбом. А у нас вышло новое, одиннадцатое занятие Deep Recsys курса. Оно, конечно, не про разговорные рекомендации, но тоже тема интересная! На лекции: 1. Сделали переход от next item prediction к RL 2. Обсудили алгоритм REINFORCE: рассмотрели all-actions и reward-to-go версии, вывели оптимальный baseline, сделали off-policy correction На семинаре разобрали статью Top-K Off-Policy Correction for a REINFORCE Recommender System про применение REINFORCE в Youtube. YouTube \| Github P.S: курс постепенно подходит к концу. Осталось три занятия — одна гостевая лекция и два занятия про генеративные модели.	2 994
11	Deep RecSys Course X. Начинаем серию из двух занятий про обучение с подкреплением! На лекции: 1. Закончили тему графовых моделей - обсудили unsupervised graph learning, модели от Twitter и TikTok. 2. Обсудили задачу RL бандитов - что такое feedback loop и зачем нужен exploration, формализацию бандитной задачи, простые алгоритмы ее решения. На семинаре обсуждали использование бандитных алгоритмов в Ютубе: 1. Разобрали статью про кандген — Online Matching: A Real-time Bandit System for Large-scale Recommendations 2. Немного затронули ранжирование — Long-Term Value of Exploration: Measurements, Findings and Algorithms YouTube \| Github	0
12	Deep RecSys Course IX. Возвращаемся после перерыва с новым занятием — в этот раз с гостевой лекцией от Риты Мишустиной, руководителя группы нейросетевого ранжирования рекламы в Яндексе. Запись лекции прикладываю, а вот Q&A с Ритой после лекции, который продлился больше часа, был не под запись :) Рита рассказывала про весь стек ранжирования рекламы в Яндексе — от базогенерации до аукциона. Самый детальный рассказ был про то, чем непосредственно занимается команда Риты — нейросетевые модели на поздних стадиях ранжирования, в которых есть раннее связывание информации про пользователя, контекст (площадку) и баннер. Рассказ получился хороший, думаю по нему можно онбордить новых сотрудников в МЛ рекламы Яндекса :) YouTube \| Github	0

مشاهده همه پست‌ها