gonzo-обзоры ML статей

前往频道在 Telegram

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

显示更多

俄罗斯27 174 技术与应用5 438...

📈 Telegram 频道 gonzo-обзоры ML статей 的分析概览

频道 gonzo-обзоры ML статей (@gonzo_ml) 俄语语言赛道中的是活跃参与者。目前社区聚集了 24 341 名订阅者，在 技术与应用 类别中位列第 5 438，并在 俄罗斯 地区排名第 27 174 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 24 341 名订阅者。

根据 26 七月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 21，过去 24 小时变化为 -2，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 9.63%。内容发布后 24 小时内通常能获得 6.69% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 2 344 次浏览，首日通常累积 1 629 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 10。
主题关注点： 内容集中在 learning, tl;dr, токенов, архитектура, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...”

凭借高频更新（最新数据采集于 27 七月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

24 341

订阅者

-224 小时

+37 天

+2130 天

2 344

帖子浏览量

~ 1 62924 小时

~ 1 89248 小时

9.63%

参与率

~ 6

每日帖子数

Ads index

beta

数据加载中...

相似频道

Data Science by ODS.ai 🦜

24.6K

Love. Death. Transformers.

17.9K

AbstractDL

更多频道

进出提及

---

吸引订阅者

七月 '26

+170

在1个频道中

六月 '26

+253

在7个频道中

Get PRO

五月 '26

+210

在3个频道中

Get PRO

四月 '26

+279

在5个频道中

Get PRO

三月 '26

+275

在7个频道中

Get PRO

二月 '26

+387

在4个频道中

Get PRO

一月 '26

+415

在14个频道中

Get PRO

十二月 '25

+439

在7个频道中

Get PRO

十一月 '25

+295

在11个频道中

Get PRO

十月 '25

+510

在12个频道中

Get PRO

九月 '25

+286

在8个频道中

Get PRO

八月 '25

+430

在5个频道中

Get PRO

七月 '25

+641

在11个频道中

Get PRO

六月 '25

+362

在9个频道中

Get PRO

五月 '25

+431

在7个频道中

Get PRO

四月 '25

+922

在19个频道中

Get PRO

三月 '25

+583

在8个频道中

Get PRO

二月 '25

+649

在16个频道中

Get PRO

一月 '25

+1 065

在24个频道中

Get PRO

十二月 '24

+699

在13个频道中

Get PRO

十一月 '24

+1 001

在20个频道中

Get PRO

十月 '24

+727

在14个频道中

Get PRO

九月 '24

+415

在11个频道中

Get PRO

八月 '24

+467

在3个频道中

Get PRO

七月 '24

+217

在10个频道中

Get PRO

六月 '24

+375

在20个频道中

Get PRO

五月 '24

+354

在11个频道中

Get PRO

四月 '24

+377

在13个频道中

Get PRO

三月 '24

+399

在14个频道中

Get PRO

二月 '24

+323

在12个频道中

Get PRO

一月 '24

+660

在15个频道中

Get PRO

十二月 '23

+641

在19个频道中

Get PRO

十一月 '23

+268

在8个频道中

Get PRO

十月 '23

+501

在19个频道中

Get PRO

九月 '23

+355

在0个频道中

Get PRO

八月 '23

+456

在0个频道中

Get PRO

七月 '23

+357

在0个频道中

Get PRO

六月 '23

+300

在0个频道中

Get PRO

五月 '23

+2 022

在0个频道中

Get PRO

四月 '23

+967

在0个频道中

Get PRO

三月 '23

+2 757

在0个频道中

Get PRO

二月 '23

+385

在0个频道中

Get PRO

一月 '23

+166

在0个频道中

Get PRO

十二月 '22

+343

在0个频道中

Get PRO

十一月 '22

+100

在0个频道中

Get PRO

十月 '22

+93

在0个频道中

Get PRO

九月 '22

+70

在0个频道中

Get PRO

八月 '22

+261

在0个频道中

Get PRO

七月 '22

+475

在0个频道中

Get PRO

六月 '22

+215

在0个频道中

Get PRO

五月 '22

+225

在0个频道中

Get PRO

四月 '22

+101

在0个频道中

Get PRO

三月 '22

+132

在0个频道中

Get PRO

二月 '22

+233

在0个频道中

Get PRO

一月 '22

+113

在0个频道中

Get PRO

十二月 '21

+248

在0个频道中

Get PRO

十一月 '21

+226

在0个频道中

Get PRO

十月 '21

+69

在0个频道中

Get PRO

九月 '21

+92

在0个频道中

Get PRO

八月 '21

+73

在0个频道中

Get PRO

七月 '21

+133

在0个频道中

Get PRO

六月 '21

+174

在0个频道中

Get PRO

五月 '21

+75

在0个频道中

Get PRO

四月 '21

+84

在0个频道中

Get PRO

三月 '21

+97

在0个频道中

Get PRO

二月 '21

+136

在0个频道中

Get PRO

一月 '21

+170

在0个频道中

Get PRO

十二月 '20

+4 514

在0个频道中

日期	订阅者增长	提及	频道
27 七月	0
26 七月	+5
25 七月	+5
24 七月	+5
23 七月	+8
22 七月	+9
21 七月	+4
20 七月	+8
19 七月	+13
18 七月	+8
17 七月	+8
16 七月	+9
15 七月	+1
14 七月	+5
13 七月	+5
12 七月	+1
11 七月	+6
10 七月	+4
09 七月	+5
08 七月	+4
07 七月	+11
06 七月	+12
05 七月	+5
04 七月	+7
03 七月	+6
02 七月	+8
01 七月	+8

频道帖子

Just in case, сегодня начинается конфа AGI-26, есть стримы онлайн. https://agi-conference.org/schedule

2	没有文字...	1 200
3	没有文字...	1 194
4	没有文字...	1 123
5	50 оттенков continual learning'а. When Does Continual Learning Require Learning _Anne Harrington, Nayan Saxena, Michael Murphy, Anastasia Borovykh, Zeyu Yun, Sridhar Kamath, Ara Eindra Kyi, Trevor Darrell, Jitendra Malik, Yutong Bai_ Paper: https://arxiv.org/abs/2607.07847 Code: https://github.com/anneharrington/studying-cl Review: https://arxiviq.substack.com/p/when-does-continual-learning-require Model: N/A # TL;DR ЧТО сделали: Авторы представляют унифицированный, независимый от конкретных механизмов фреймворк для оценки непрерывного обучения (continual learning) в LLM. В нём напрямую сравниваются восемь методов адаптации — от промптинга до классического обучения с учителем, обучения с подкреплением и сжатия контекста — на четырёх реалистичных сценариях изменения среды: сдвиге доменов, обновлении фактов, временном дрейфе и накоплении состояния агента. ПОЧЕМУ это важно: Исследование математически и эмпирически доказывает, что непрерывное обучение — это не единая монолитная способность, а набор компромиссов, зависящих от характера изменений среды. Универсального метода нет: медленные временные тренды требуют дистилляции для стабильности, дискретные обновления фактов — онлайн-RL, а агентские среды — файнтюнинга весов или специализированного промптинга. Работа даёт чёткую инструкцию, когда моделям нужно обновлять веса внутри модели (in-weights), а когда достаточно внешних надстроек. Для практиков: Если перед вами стоит задача долгосрочной адаптации LLM, забудьте об универсальных решениях. Для исправления фактов используйте онлайн-RL (например, GRPO), для плавной адаптации к домену — дистилляцию (SDFT), а для сложных агентских сред — файнтюнинг весов или продвинутый промпт-инжиниринг. Диссекция continual learning тут: https://t.me/gonzo_ML_podcasts/4615	1 239
6	没有文字...	1 604
7	没有文字...	1 555
8	没有文字...	1 501
9	没有文字...	1 431
10	没有文字...	1 356
11	没有文字...	1 308
12	Прунинг через функциональный анализ. Выглядит красиво. Hilbert Operator for Progressive Encoding (HOPE): A Mathematical Framework for Deconstructing Learned Representations in Deep Networks Hossein Mobahi, Peter L. Bartlett Статья: https://arxiv.org/abs/2607.21366 Ревью: https://arxiviq.substack.com/p/hilbert-operator-for-progressive Код: N/A Модель: N/A # TL;DR Что сделали: Авторы предложили HOPE — математический подход, который позволяет анализировать и сжимать нейросети, переводя их из дискретных списков чисел (весов) в непрерывные математические функции. Объединив этот взгляд со статистикой самой модели, алгоритм научился прореживать, объединять и удалять целые слои без единого разрыва прогона реальных данных. Почему это важно: Обычно модели сжимают или изучают, опираясь либо на величину параметров (что бывает математически обманчиво), либо на прогоны реальных данных (что дорого и не всегда безопасно для приватности). Переход строго в «пространство функций» даёт чёткий, автоматизированный способ уменьшать модели и защищать их базовые знания при обучении новым задачам. Функционально прунить тут:https://t.me/gonzo_ML_podcasts/4606	1 647
13	没有文字...	1 677
14	没有文字...	1 628
15	没有文字...	1 551
16	没有文字...	1 389
17	没有文字...	1 359
18	没有文字...	1 315
19	Ну и чего-нибудь более классического для тех, кому про жызнь менее интересно. Новости зацикленных трансформеров, модель примерно продакшн уровня. The Compute-Matched Paradigm: Rethinking Recurrent Depth with the Loopie Series Zitian Gao, Yilong Chen, Yihao Xiao, Xinyu Yang, Ran Tao, Joey Zhou, Bryan Dai Paper: https://arxiv.org/abs/2607.16051 Review: https://arxiviq.substack.com/p/loop-the-loopies Code: https://github.com/IQuestLab/loopie/megatron, https://github.com/IQuestLab/loopie/vllm (404 for now) Model: https://huggingface.co/IQuestLab/Loopie-20B-A2B-preview, https://huggingface.co/IQuestLab/Loopie-6B-A0.6B-preview (404 for now) # TL;DR ЧТО сделали: Авторы из IQuest Research представили семейство Loopie — новый класс рекуррентных языковых моделей (LLM) с архитектурой Mixture-of-Experts (MoE), где используется механизм "layer-loop" (зацикливание отдельных слоёв). Разработав подход к масштабированию с учётом железа, исследователи сбалансировали физическую глубину, ширину и рекуррентную глубину сети так, чтобы уместиться в вычислительный бюджет на предобучение, аналогичный нерекуррентным бейзлайнам. После предобучения модели дообучались с помощью масштабного пайплайна Supervised Pre-Training (SPT) и обучения с подкреплением (RL) на уровне последовательностей для развития продвинутых способностей к рассуждению. ПОЧЕМУ это важно: Исследования рекуррентных архитектур исторически страдали от проблемы некорректного учёта вычислений: зацикленные модели часто заявляли о своём превосходстве, сравнивая лишь количество параметров, но при этом неявно умножая реальные затраты FLOPs на обучение. Эта работа устраняет данный боттлнек. Доказав, что грамотно настроенная рекуррентная глубина превосходит традиционное масштабирование слоёв при строго фиксированном вычислительном бюджете, авторы легитимизируют рекуррентность как полноценный и высокоэффективный вектор масштабирования для foundation-моделей на триллионы параметров. Для практиков: Если вы упираетесь в ограничения памяти по активациям, локальное зацикливание слоёв позволяет значительно увеличить размер микробатча. Это повышает утилизацию GPU без роста общего физического времени обучения, позволяя направить сэкономленные ресурсы на расширение скрытой размерности модели. Зацикливать трансформеры тут: https://t.me/gonzo_ML_podcasts/4595	1 463
20	没有文字...	1 376

查看所有帖子