ch
Feedback
gonzo-обзоры ML статей

gonzo-обзоры ML статей

前往频道在 Telegram

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

显示更多

📈 Telegram 频道 gonzo-обзоры ML статей 的分析概览

频道 gonzo-обзоры ML статей (@gonzo_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 24 339 名订阅者,在 技术与应用 类别中位列第 5 512,并在 俄罗斯 地区排名第 27 359

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 24 339 名订阅者。

根据 02 七月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 51,过去 24 小时变化为 3,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 10.96%。内容发布后 24 小时内通常能获得 6.72% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 2 667 次浏览,首日通常累积 1 636 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 15
  • 主题关注点: 内容集中在 learning, tl;dr, токенов, архитектура, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...

凭借高频更新(最新数据采集于 03 七月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

24 339
订阅者
+324 小时
+177
+5130
吸引订阅者
七月 '26
七月 '26
+16
在0个频道中
六月 '26
+253
在7个频道中
Get PRO
五月 '26
+210
在3个频道中
Get PRO
四月 '26
+279
在5个频道中
Get PRO
三月 '26
+275
在7个频道中
Get PRO
二月 '26
+387
在4个频道中
Get PRO
一月 '26
+415
在14个频道中
Get PRO
十二月 '25
+439
在7个频道中
Get PRO
十一月 '25
+295
在11个频道中
Get PRO
十月 '25
+510
在12个频道中
Get PRO
九月 '25
+286
在7个频道中
Get PRO
八月 '25
+430
在5个频道中
Get PRO
七月 '25
+641
在11个频道中
Get PRO
六月 '25
+362
在9个频道中
Get PRO
五月 '25
+431
在7个频道中
Get PRO
四月 '25
+922
在19个频道中
Get PRO
三月 '25
+583
在8个频道中
Get PRO
二月 '25
+649
在16个频道中
Get PRO
一月 '25
+1 065
在24个频道中
Get PRO
十二月 '24
+699
在13个频道中
Get PRO
十一月 '24
+1 001
在20个频道中
Get PRO
十月 '24
+727
在14个频道中
Get PRO
九月 '24
+415
在11个频道中
Get PRO
八月 '24
+467
在3个频道中
Get PRO
七月 '24
+217
在10个频道中
Get PRO
六月 '24
+375
在20个频道中
Get PRO
五月 '24
+354
在11个频道中
Get PRO
四月 '24
+377
在13个频道中
Get PRO
三月 '24
+399
在14个频道中
Get PRO
二月 '24
+323
在12个频道中
Get PRO
一月 '24
+660
在15个频道中
Get PRO
十二月 '23
+641
在19个频道中
Get PRO
十一月 '23
+268
在8个频道中
Get PRO
十月 '23
+501
在19个频道中
Get PRO
九月 '23
+355
在0个频道中
Get PRO
八月 '23
+456
在0个频道中
Get PRO
七月 '23
+357
在0个频道中
Get PRO
六月 '23
+300
在0个频道中
Get PRO
五月 '23
+2 022
在0个频道中
Get PRO
四月 '23
+967
在0个频道中
Get PRO
三月 '23
+2 757
在0个频道中
Get PRO
二月 '23
+385
在0个频道中
Get PRO
一月 '23
+166
在0个频道中
Get PRO
十二月 '22
+343
在0个频道中
Get PRO
十一月 '22
+100
在0个频道中
Get PRO
十月 '22
+93
在0个频道中
Get PRO
九月 '22
+70
在0个频道中
Get PRO
八月 '22
+261
在0个频道中
Get PRO
七月 '22
+475
在0个频道中
Get PRO
六月 '22
+215
在0个频道中
Get PRO
五月 '22
+225
在0个频道中
Get PRO
四月 '22
+101
在0个频道中
Get PRO
三月 '22
+132
在0个频道中
Get PRO
二月 '22
+233
在0个频道中
Get PRO
一月 '22
+113
在0个频道中
Get PRO
十二月 '21
+248
在0个频道中
Get PRO
十一月 '21
+226
在0个频道中
Get PRO
十月 '21
+69
在0个频道中
Get PRO
九月 '21
+92
在0个频道中
Get PRO
八月 '21
+73
在0个频道中
Get PRO
七月 '21
+133
在0个频道中
Get PRO
六月 '21
+174
在0个频道中
Get PRO
五月 '21
+75
在0个频道中
Get PRO
四月 '21
+84
在0个频道中
Get PRO
三月 '21
+97
在0个频道中
Get PRO
二月 '21
+136
在0个频道中
Get PRO
一月 '21
+170
在0个频道中
Get PRO
十二月 '20
+4 514
在0个频道中
日期
订阅者增长
提及
频道
02 七月+8
01 七月+8
频道帖子
2
没有文字...
1 105
3
没有文字...
1 060
4
没有文字...
981
5
没有文字...
908
6
Снова заход на неавторегрессионные модели (здесь потоковые модели, flow models) и валидация результата через использование неподвижной точки (похоже на идею из недавнего https://t.me/gonzo_ML/5602). Flow Reasoning Models: Scaling Reasoning Through Iterative Self-Refinement Alec Helbling, Andrey Bryutkin, Mauro Martino, Nima Dehmamy, Hendrik Strobelt Paper: https://arxiv.org/abs/2606.29150 Review: https://arxiviq.substack.com/p/flow-reasoning-models-scaling-reasoning Code: N/A Model: N/A # TL;DR ЧТО сделали: Авторы представили Flow Reasoning Models (FRM) — фреймворк для обучения и масштабирования на этапе инференса (test-time scaling), предназначенный для решения структурированных задач на удовлетворение ограничений (например, судоку или загадок «Зебра») с помощью моделей дискретных потоков. FRM используют стабильность неподвижных точек внутри собственной динамики денойзинга модели как не требующий разметки (unsupervised) верификатор правильности решений. Также авторы разработали метод локального обучения предпочтениям FLOWDPO для активного подавления самогенерируемых ошибок. ПОЧЕМУ это важно: Работа доказывает, что генеративные потоковые сети уже содержат латентные и крайне надёжные сигналы верификации (AUROC близок к 1.0) в своей собственной геометрической динамике. Это избавляет от необходимости обучать отдельные дорогие модели вознаграждения или использовать внешние валидаторы. Объединяя генерацию, верификацию и выравнивание (alignment) в рамках единой системы аттракторов, FRM достигают высочайшей точности в задачах с ограничениями, сокращая вычислительные затраты на инференс более чем в 8 раз по сравнению с сильными бейзлайнами на основе маскированной диффузии. Для практиков: Предложенный фреймворк позволяет строить автономные самообучающиеся системы без дорогой ручной разметки данных для верификации. Геометрическая стабильность траектории в пространстве эмбеддингов сама по себе служит надёжным маркером правильности ответа, что позволяет эффективно отсеивать галлюцинации и ошибки прямо на этапе генерации. Искать неподвижную точку здесь: https://t.me/gonzo_ML_podcasts/4263
971
7
没有文字...
1 588
8
没有文字...
1 581
9
没有文字...
1 527
10
没有文字...
1 406
11
Агентная генерация качественной синтетики. По сути почти старая добрая зона проксимального развития. Но с эволюционным мета-циклом. Autodata: An agentic data scientist to create high quality synthetic data Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, Yixin Nie, Swarnadeep Saha, Eryk Helenowski, Weizhe Yuan, Olga Golovneva, Jack Lanchantin, Yoram Bachrach, Jakob Foerster, Xian Li, Han Fang, Sainbayar Sukhbaatar, Jason Weston Paper: https://arxiv.org/abs/2606.25996 Review: https://arxiviq.substack.com/p/autodata-an-agentic-data-scientist Code: N/A Model: N/A # TL;DR ЧТО сделали: Авторы представили Autodata — фреймворк, превращающий LLM-агентов в автономных дата-саентистов. Вместо статичных шаблонов промптов и простых конвейеров фильтрации Autodata использует замкнутый цикл: генерация, оценка на основе решателей (solvers), анализ ошибок и доработка инструкций. На внешнем уровне работает эволюционный цикл, который автоматически оптимизирует промпты самих агентов. ПОЧЕМУ это важно: По мере того как коммерческие передовые модели приближаются к человеческому уровню на стандартных бенчмарках, доступный объём качественных человеческих данных становится главным узким горлышком. При этом стандартная генерация синтетики часто выдаёт либо тривиальные, либо невыполнимо сложные задачи. Autodata системно конвертирует огромные вычислительные мощности этапа инференса (test-time compute) в структурированные обучающие программы «золотой середины». Это улучшает AI alignment моделей и радикально повышает их эффективность рассуждений на уровне токенов. Для практиков: Autodata позволяет обучать небольшие модели (например, Qwen3.5-4B) на сложных доменах (код, право) так, что они начинают обходить даже гигантские необученные модели (Qwen3.5-397B). Кроме того, такой файнтюнинг сокращает избыточность рассуждений и решает проблему обрыва цепочек, заставляя модель рассуждать лаконичнее и экономя токены. Умно обучать агентов тут: https://t.me/gonzo_ML_podcasts/4247
1 481
12
没有文字...
1 765
13
没有文字...
1 750
14
没有文字...
1 666
15
没有文字...
1 564
16
+1 работа про несимметричный трансформер. Был недавно ><former, а теперь трансформер с косинусным затуханием ширины. Tapered Language Models Reza Bayat, Ali Behrouz, Aaron Courville Paper: https://arxiv.org/abs/2606.23670 Review: https://arxiviq.substack.com/p/tapered-language-models Code: N/A Model: N/A # TL;DR ЧТО сделали: Авторы представляют Tapered Language Models (TLMs) — простой и независимый от архитектуры принцип проектирования, который бросает вызов стандартному для индустрии равномерному распределению параметров по слоям. При строго фиксированном бюджете параметров и FLOP промежуточная размерность полносвязной сети (FFN/MLP) монотонно уменьшается от входных слоёв к выходным по плавному закону полукосинуса. Это позволяет сосредоточить репрезентативную ёмкость на первых слоях, где потребность в извлечении признаков наиболее высока, и разгрузить более глубокие слои, которые в основном занимаются уточнением уже существующих представлений. ПОЧЕМУ это важно: Эта работа открывает мощный и не требующий дополнительных вычислительных затрат рычаг проектирования архитектур, который оставался незамеченным со времён оригинального Transformer. Перераспределив существующие параметры вдоль оси глубины, исследователи и разработчики могут систематически снижать перплексию на валидации и повышать качество работы моделей в задачах на здравый смысл (commonsense reasoning) для разных семейств и масштабов моделей. Мы получаем «бесплатный» прирост качества без увеличения задержек при обучении или инференсе, без раздувания параметров и без сложных схем динамической маршрутизации. Для практиков: Теперь нет необходимости использовать одинаковые по размеру слои по умолчанию. Плавное сужение размерности MLP по полукосинусному расписанию даёт мгновенный прирост качества при том же бюджете вычислений. Этот подход крайне легко внедрить в любой пайплайн предобучения базовых моделей. Делать нестандартные трансформеры тут: https://t.me/gonzo_ML_podcasts/4235
1 717
17
没有文字...
1 974
18
没有文字...
2 027
19
没有文字...
1 928
20
没有文字...
1 738