gonzo-обзоры ML статей
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.
显示更多📈 Telegram 频道 gonzo-обзоры ML статей 的分析概览
频道 gonzo-обзоры ML статей (@gonzo_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 24 339 名订阅者,在 技术与应用 类别中位列第 5 512,并在 俄罗斯 地区排名第 27 359 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 24 339 名订阅者。
根据 02 七月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 51,过去 24 小时变化为 3,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 10.96%。内容发布后 24 小时内通常能获得 6.72% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 2 667 次浏览,首日通常累积 1 636 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 15。
- 主题关注点: 内容集中在 learning, tl;dr, токенов, архитектура, контекст 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Авторы:
Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика.
Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...”
凭借高频更新(最新数据采集于 03 七月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
数据加载中...
| 日期 | 订阅者增长 | 提及 | 频道 | |
| 02 七月 | +8 | |||
| 01 七月 | +8 |
| 2 | 没有文字... | 1 105 |
| 3 | 没有文字... | 1 060 |
| 4 | 没有文字... | 981 |
| 5 | 没有文字... | 908 |
| 6 | Снова заход на неавторегрессионные модели (здесь потоковые модели, flow models) и валидация результата через использование неподвижной точки (похоже на идею из недавнего https://t.me/gonzo_ML/5602).
Flow Reasoning Models: Scaling Reasoning Through Iterative Self-Refinement
Alec Helbling, Andrey Bryutkin, Mauro Martino, Nima Dehmamy, Hendrik Strobelt
Paper: https://arxiv.org/abs/2606.29150
Review: https://arxiviq.substack.com/p/flow-reasoning-models-scaling-reasoning
Code: N/A
Model: N/A
# TL;DR
ЧТО сделали: Авторы представили Flow Reasoning Models (FRM) — фреймворк для обучения и масштабирования на этапе инференса (test-time scaling), предназначенный для решения структурированных задач на удовлетворение ограничений (например, судоку или загадок «Зебра») с помощью моделей дискретных потоков. FRM используют стабильность неподвижных точек внутри собственной динамики денойзинга модели как не требующий разметки (unsupervised) верификатор правильности решений. Также авторы разработали метод локального обучения предпочтениям FLOWDPO для активного подавления самогенерируемых ошибок.
ПОЧЕМУ это важно: Работа доказывает, что генеративные потоковые сети уже содержат латентные и крайне надёжные сигналы верификации (AUROC близок к 1.0) в своей собственной геометрической динамике. Это избавляет от необходимости обучать отдельные дорогие модели вознаграждения или использовать внешние валидаторы. Объединяя генерацию, верификацию и выравнивание (alignment) в рамках единой системы аттракторов, FRM достигают высочайшей точности в задачах с ограничениями, сокращая вычислительные затраты на инференс более чем в 8 раз по сравнению с сильными бейзлайнами на основе маскированной диффузии.
Для практиков: Предложенный фреймворк позволяет строить автономные самообучающиеся системы без дорогой ручной разметки данных для верификации. Геометрическая стабильность траектории в пространстве эмбеддингов сама по себе служит надёжным маркером правильности ответа, что позволяет эффективно отсеивать галлюцинации и ошибки прямо на этапе генерации.
Искать неподвижную точку здесь: https://t.me/gonzo_ML_podcasts/4263 | 971 |
| 7 | 没有文字... | 1 588 |
| 8 | 没有文字... | 1 581 |
| 9 | 没有文字... | 1 527 |
| 10 | 没有文字... | 1 406 |
| 11 | Агентная генерация качественной синтетики. По сути почти старая добрая зона проксимального развития. Но с эволюционным мета-циклом.
Autodata: An agentic data scientist to create high quality synthetic data
Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, Yixin Nie, Swarnadeep Saha, Eryk Helenowski, Weizhe Yuan, Olga Golovneva, Jack Lanchantin, Yoram Bachrach, Jakob Foerster, Xian Li, Han Fang, Sainbayar Sukhbaatar, Jason Weston
Paper: https://arxiv.org/abs/2606.25996
Review: https://arxiviq.substack.com/p/autodata-an-agentic-data-scientist
Code: N/A
Model: N/A
# TL;DR
ЧТО сделали: Авторы представили Autodata — фреймворк, превращающий LLM-агентов в автономных дата-саентистов. Вместо статичных шаблонов промптов и простых конвейеров фильтрации Autodata использует замкнутый цикл: генерация, оценка на основе решателей (solvers), анализ ошибок и доработка инструкций. На внешнем уровне работает эволюционный цикл, который автоматически оптимизирует промпты самих агентов.
ПОЧЕМУ это важно: По мере того как коммерческие передовые модели приближаются к человеческому уровню на стандартных бенчмарках, доступный объём качественных человеческих данных становится главным узким горлышком. При этом стандартная генерация синтетики часто выдаёт либо тривиальные, либо невыполнимо сложные задачи. Autodata системно конвертирует огромные вычислительные мощности этапа инференса (test-time compute) в структурированные обучающие программы «золотой середины». Это улучшает AI alignment моделей и радикально повышает их эффективность рассуждений на уровне токенов.
Для практиков: Autodata позволяет обучать небольшие модели (например, Qwen3.5-4B) на сложных доменах (код, право) так, что они начинают обходить даже гигантские необученные модели (Qwen3.5-397B). Кроме того, такой файнтюнинг сокращает избыточность рассуждений и решает проблему обрыва цепочек, заставляя модель рассуждать лаконичнее и экономя токены.
Умно обучать агентов тут: https://t.me/gonzo_ML_podcasts/4247 | 1 481 |
| 12 | 没有文字... | 1 765 |
| 13 | 没有文字... | 1 750 |
| 14 | 没有文字... | 1 666 |
| 15 | 没有文字... | 1 564 |
| 16 | +1 работа про несимметричный трансформер. Был недавно ><former, а теперь трансформер с косинусным затуханием ширины.
Tapered Language Models
Reza Bayat, Ali Behrouz, Aaron Courville
Paper: https://arxiv.org/abs/2606.23670
Review: https://arxiviq.substack.com/p/tapered-language-models
Code: N/A
Model: N/A
# TL;DR
ЧТО сделали: Авторы представляют Tapered Language Models (TLMs) — простой и независимый от архитектуры принцип проектирования, который бросает вызов стандартному для индустрии равномерному распределению параметров по слоям. При строго фиксированном бюджете параметров и FLOP промежуточная размерность полносвязной сети (FFN/MLP) монотонно уменьшается от входных слоёв к выходным по плавному закону полукосинуса. Это позволяет сосредоточить репрезентативную ёмкость на первых слоях, где потребность в извлечении признаков наиболее высока, и разгрузить более глубокие слои, которые в основном занимаются уточнением уже существующих представлений.
ПОЧЕМУ это важно: Эта работа открывает мощный и не требующий дополнительных вычислительных затрат рычаг проектирования архитектур, который оставался незамеченным со времён оригинального Transformer. Перераспределив существующие параметры вдоль оси глубины, исследователи и разработчики могут систематически снижать перплексию на валидации и повышать качество работы моделей в задачах на здравый смысл (commonsense reasoning) для разных семейств и масштабов моделей. Мы получаем «бесплатный» прирост качества без увеличения задержек при обучении или инференсе, без раздувания параметров и без сложных схем динамической маршрутизации.
Для практиков: Теперь нет необходимости использовать одинаковые по размеру слои по умолчанию. Плавное сужение размерности MLP по полукосинусному расписанию даёт мгновенный прирост качества при том же бюджете вычислений. Этот подход крайне легко внедрить в любой пайплайн предобучения базовых моделей.
Делать нестандартные трансформеры тут: https://t.me/gonzo_ML_podcasts/4235 | 1 717 |
| 17 | 没有文字... | 1 974 |
| 18 | 没有文字... | 2 027 |
| 19 | 没有文字... | 1 928 |
| 20 | 没有文字... | 1 738 |
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
