gonzo-обзоры ML статей
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.
Показати більше📈 Аналітичний огляд Telegram-каналу gonzo-обзоры ML статей
Канал gonzo-обзоры ML статей (@gonzo_ml) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 24 339 підписників, посідаючи 5 512 місце в категорії Технології та додатки та 27 359 місце у регіоні Росія.
📊 Показники аудиторії та динаміка
З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 24 339 підписників.
За останніми даними від 02 липня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на 51, а за останні 24 години на 3, загальне охоплення залишається високим.
- Статус верифікації: Не верифікований
- Рівень залученості (ER): Середній показник залученості аудиторії становить 10.96%. Протягом перших 24 годин після публікації контент зазвичай збирає 6.72% реакцій від загальної кількості підписників.
- Охоплення публікацій: В середньому кожен допис отримує 2 667 переглядів. Протягом першої доби публікація в середньому набирає 1 636 переглядів.
- Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 15.
- Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як learning, tl;dr, токенов, архитектура, контекст.
📝 Опис та контентна політика
Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Авторы:
Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика.
Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...”
Завдяки високій частоті оновлень (останні дані отримано 03 липня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.
Триває завантаження даних...
| Дата | Залучення підписників | Згадування | Канали | |
| 03 липня | +4 | |||
| 02 липня | +8 | |||
| 01 липня | +8 |
| 2 | Немає тексту... | 332 |
| 3 | Немає тексту... | 335 |
| 4 | Немає тексту... | 324 |
| 5 | Немає тексту... | 293 |
| 6 | Авторы TRM добавили к уже обученной модели стохастичности и сильно улучшили результаты. Работа про GRAM близка, но идёт дальше, там стохастичность в обучении. Вчерашняя FRM по подходу иная, но тоже где-то из близкой когорты.
Что мне нравится, в направлении латентного ризонинга сейчас происходит свой областного значения кембрийский взрыв. Много работ с разных сторон находят интересные решения и оно, конечно, должно всё слиться в какой-то большой итоговой модели.
Probabilistic Tiny Recursive Model
Amin Sghaier, Ali Parviz, Alexia Jolicoeur-Martineau
Paper: https://arxiv.org/abs/2605.19943
Review: https://arxiviq.substack.com/p/probabilistic-tiny-recursive-model
# TL;DR
ЧТО сделали: Авторы разработали фреймворк Probabilistic TRM (PTRM). Он позволяет масштабировать вычисления во время инференса (test-time compute) без дополнительного обучения модели. Метод добавляет стохастический поиск в предобученные Tiny Recursive Models (TRM). На каждом шаге рекурсии в скрытое состояние подмешивается гауссовский шум. Это создаёт несколько параллельных траекторий, помогая модели выбираться из субоптимальных локальных аттракторов, а лучшая траектория затем выбирается с помощью уже имеющейся предобученной классификационной головы (Q-head).
ПОЧЕМУ это важно: Эта работа доказывает, что огромные и дорогие авторегрессионные LLM — не единственный путь к решению сложных логических задач. Сверхкомпактные неавторегрессионные рекурсивные сети (всего 5–7 млн параметров) способны превосходить передовые LLM в решении структурированных задач на удовлетворение ограничений. При этом стоимость инференса оказывается ниже более чем в 10 000 раз. Это подтверждает перспективность масштабирования вычислений на этапе инференса в непрерывном латентном пространстве, а не в дискретном пространстве токенов.
Для практиков: Если вам нужно решать жёстко структурированные задачи вроде судоку или планирования путей, не обязательно разворачивать тяжёлые LLM или настраивать сложные цепочки CoT. Крошечные рекурсивные модели с добавлением контролируемого шума на инференсе и простым классификатором-верификатором могут дать колоссальный прирост качества при практически нулевых затратах на инфраструктуру.
Рекуррентно шуметь здесь: https://t.me/gonzo_ML_podcasts/4279 | 346 |
| 7 | Немає тексту... | 1 557 |
| 8 | Немає тексту... | 1 637 |
| 9 | Немає тексту... | 1 574 |
| 10 | Немає тексту... | 1 437 |
| 11 | Немає тексту... | 1 385 |
| 12 | Снова заход на неавторегрессионные модели (здесь потоковые модели, flow models) и валидация результата через использование неподвижной точки (похоже на идею из недавнего https://t.me/gonzo_ML/5602).
Flow Reasoning Models: Scaling Reasoning Through Iterative Self-Refinement
Alec Helbling, Andrey Bryutkin, Mauro Martino, Nima Dehmamy, Hendrik Strobelt
Paper: https://arxiv.org/abs/2606.29150
Review: https://arxiviq.substack.com/p/flow-reasoning-models-scaling-reasoning
Code: N/A
Model: N/A
# TL;DR
ЧТО сделали: Авторы представили Flow Reasoning Models (FRM) — фреймворк для обучения и масштабирования на этапе инференса (test-time scaling), предназначенный для решения структурированных задач на удовлетворение ограничений (например, судоку или загадок «Зебра») с помощью моделей дискретных потоков. FRM используют стабильность неподвижных точек внутри собственной динамики денойзинга модели как не требующий разметки (unsupervised) верификатор правильности решений. Также авторы разработали метод локального обучения предпочтениям FLOWDPO для активного подавления самогенерируемых ошибок.
ПОЧЕМУ это важно: Работа доказывает, что генеративные потоковые сети уже содержат латентные и крайне надёжные сигналы верификации (AUROC близок к 1.0) в своей собственной геометрической динамике. Это избавляет от необходимости обучать отдельные дорогие модели вознаграждения или использовать внешние валидаторы. Объединяя генерацию, верификацию и выравнивание (alignment) в рамках единой системы аттракторов, FRM достигают высочайшей точности в задачах с ограничениями, сокращая вычислительные затраты на инференс более чем в 8 раз по сравнению с сильными бейзлайнами на основе маскированной диффузии.
Для практиков: Предложенный фреймворк позволяет строить автономные самообучающиеся системы без дорогой ручной разметки данных для верификации. Геометрическая стабильность траектории в пространстве эмбеддингов сама по себе служит надёжным маркером правильности ответа, что позволяет эффективно отсеивать галлюцинации и ошибки прямо на этапе генерации.
Искать неподвижную точку здесь: https://t.me/gonzo_ML_podcasts/4263 | 1 401 |
| 13 | Немає тексту... | 1 707 |
| 14 | Немає тексту... | 1 682 |
| 15 | Немає тексту... | 1 643 |
| 16 | Немає тексту... | 1 522 |
| 17 | Агентная генерация качественной синтетики. По сути почти старая добрая зона проксимального развития. Но с эволюционным мета-циклом.
Autodata: An agentic data scientist to create high quality synthetic data
Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, Yixin Nie, Swarnadeep Saha, Eryk Helenowski, Weizhe Yuan, Olga Golovneva, Jack Lanchantin, Yoram Bachrach, Jakob Foerster, Xian Li, Han Fang, Sainbayar Sukhbaatar, Jason Weston
Paper: https://arxiv.org/abs/2606.25996
Review: https://arxiviq.substack.com/p/autodata-an-agentic-data-scientist
Code: N/A
Model: N/A
# TL;DR
ЧТО сделали: Авторы представили Autodata — фреймворк, превращающий LLM-агентов в автономных дата-саентистов. Вместо статичных шаблонов промптов и простых конвейеров фильтрации Autodata использует замкнутый цикл: генерация, оценка на основе решателей (solvers), анализ ошибок и доработка инструкций. На внешнем уровне работает эволюционный цикл, который автоматически оптимизирует промпты самих агентов.
ПОЧЕМУ это важно: По мере того как коммерческие передовые модели приближаются к человеческому уровню на стандартных бенчмарках, доступный объём качественных человеческих данных становится главным узким горлышком. При этом стандартная генерация синтетики часто выдаёт либо тривиальные, либо невыполнимо сложные задачи. Autodata системно конвертирует огромные вычислительные мощности этапа инференса (test-time compute) в структурированные обучающие программы «золотой середины». Это улучшает AI alignment моделей и радикально повышает их эффективность рассуждений на уровне токенов.
Для практиков: Autodata позволяет обучать небольшие модели (например, Qwen3.5-4B) на сложных доменах (код, право) так, что они начинают обходить даже гигантские необученные модели (Qwen3.5-397B). Кроме того, такой файнтюнинг сокращает избыточность рассуждений и решает проблему обрыва цепочек, заставляя модель рассуждать лаконичнее и экономя токены.
Умно обучать агентов тут: https://t.me/gonzo_ML_podcasts/4247 | 1 640 |
| 18 | Немає тексту... | 1 798 |
| 19 | Немає тексту... | 1 785 |
| 20 | Немає тексту... | 1 710 |
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
