en
Feedback
gonzo-обзоры ML статей

gonzo-обзоры ML статей

Open in Telegram

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

Show more

📈 Analytical overview of Telegram channel gonzo-обзоры ML статей

Channel gonzo-обзоры ML статей (@gonzo_ml) in the Russian language segment is an active participant. Currently, the community unites 24 287 subscribers, ranking 5 626 in the Technologies & Applications category and 27 569 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 24 287 subscribers.

According to the latest data from 14 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -4 over the last 30 days and by 6 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 10.13%. Within the first 24 hours after publication, content typically collects 6.66% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 2 459 views. Within the first day, a publication typically gains 1 618 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 10.
  • Thematic interests: Content is focused on key topics such as learning, tl;dr, токенов, архитектура, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...

Thanks to the high frequency of updates (latest data received on 15 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

24 287
Subscribers
+624 hours
-27 days
-430 days
Attracting Subscribers
June '26
June '26
+113
in 2 channels
May '26
+210
in 3 channels
Get PRO
April '26
+279
in 5 channels
Get PRO
March '26
+275
in 7 channels
Get PRO
February '26
+387
in 4 channels
Get PRO
January '26
+415
in 14 channels
Get PRO
December '25
+439
in 7 channels
Get PRO
November '25
+295
in 11 channels
Get PRO
October '25
+510
in 12 channels
Get PRO
September '25
+286
in 7 channels
Get PRO
August '25
+430
in 5 channels
Get PRO
July '25
+641
in 11 channels
Get PRO
June '25
+362
in 9 channels
Get PRO
May '25
+431
in 7 channels
Get PRO
April '25
+922
in 19 channels
Get PRO
March '25
+583
in 8 channels
Get PRO
February '25
+649
in 16 channels
Get PRO
January '25
+1 065
in 24 channels
Get PRO
December '24
+699
in 13 channels
Get PRO
November '24
+1 001
in 20 channels
Get PRO
October '24
+727
in 14 channels
Get PRO
September '24
+415
in 11 channels
Get PRO
August '24
+467
in 3 channels
Get PRO
July '24
+217
in 10 channels
Get PRO
June '24
+375
in 20 channels
Get PRO
May '24
+354
in 11 channels
Get PRO
April '24
+377
in 13 channels
Get PRO
March '24
+399
in 14 channels
Get PRO
February '24
+323
in 12 channels
Get PRO
January '24
+660
in 15 channels
Get PRO
December '23
+641
in 19 channels
Get PRO
November '23
+268
in 8 channels
Get PRO
October '23
+501
in 19 channels
Get PRO
September '23
+355
in 0 channels
Get PRO
August '23
+456
in 0 channels
Get PRO
July '23
+357
in 0 channels
Get PRO
June '23
+300
in 0 channels
Get PRO
May '23
+2 022
in 0 channels
Get PRO
April '23
+967
in 0 channels
Get PRO
March '23
+2 757
in 0 channels
Get PRO
February '23
+385
in 0 channels
Get PRO
January '23
+166
in 0 channels
Get PRO
December '22
+343
in 0 channels
Get PRO
November '22
+100
in 0 channels
Get PRO
October '22
+93
in 0 channels
Get PRO
September '22
+70
in 0 channels
Get PRO
August '22
+261
in 0 channels
Get PRO
July '22
+475
in 0 channels
Get PRO
June '22
+215
in 0 channels
Get PRO
May '22
+225
in 0 channels
Get PRO
April '22
+101
in 0 channels
Get PRO
March '22
+132
in 0 channels
Get PRO
February '22
+233
in 0 channels
Get PRO
January '22
+113
in 0 channels
Get PRO
December '21
+248
in 0 channels
Get PRO
November '21
+226
in 0 channels
Get PRO
October '21
+69
in 0 channels
Get PRO
September '21
+92
in 0 channels
Get PRO
August '21
+73
in 0 channels
Get PRO
July '21
+133
in 0 channels
Get PRO
June '21
+174
in 0 channels
Get PRO
May '21
+75
in 0 channels
Get PRO
April '21
+84
in 0 channels
Get PRO
March '21
+97
in 0 channels
Get PRO
February '21
+136
in 0 channels
Get PRO
January '21
+170
in 0 channels
Get PRO
December '20
+4 514
in 0 channels
Date
Subscriber Growth
Mentions
Channels
15 June+6
14 June+11
13 June+10
12 June+8
11 June+12
10 June+8
09 June+2
08 June+6
07 June+6
06 June+10
05 June+8
04 June+3
03 June+9
02 June+7
01 June+7
Channel Posts
2
No text...
1 216
3
No text...
1 192
4
No text...
1 103
5
Как геймеры в своё время проспонсировали железо для глубокого обучения, так и нынешние пользователи LLM с CoT проспонсируют железо для следующего поколения ИИ. Классический текстовый CoT -- это крайне неэффективный способ трекинга состояния, токенов или ещё каких-то состояний можно было бы тратить на порядки меньше. Статья в целом про это, что топология трансформеров должна поменяться. The Topological Trouble With Transformers Michael C. Mozer, Shoaib Ahmed Siddiqui, Rosanne Liu Paper: https://arxiv.org/abs/2604.17121 Review: https://arxiviq.substack.com/p/the-topological-trouble-with-transformers Code: N/A Model: N/A # TL;DR ЧТО сделали: Авторы представили глубокую архитектурную критику стандартных полносвязных (feedforward) трансформеров, подробно объяснив, почему их сугубо однонаправленная топология принципиально ограничивает динамическое отслеживание состояния (state tracking). Чтобы наметить пути развития будущих архитектур, они предложили подробную двумерную таксономию, которая классифицирует рекуррентные и непрерывно мыслящие варианты трансформеров по оси рекуррентности (глубина или шаги) и соотношению входных токенов к шагам рекуррентности. ПОЧЕМУ это важно: Современные ИИ-системы сильно полагаются на неэффективные с вычислительной точки зрения костыли вроде явной цепочки рассуждений (CoT), чтобы обойти бутылочное горлышко между глубиной модели и её состоянием. Эта работа показывает, почему такие явные стратегии неэффективны, и призывает к стратегическому переходу к неявной динамике рекуррентных активаций. Это даёт чёткую дорожную карту для проектирования фундаментальных моделей, способных поддерживать долгосрочную когнитивную согласованность. Для практиков: Для сложных задач последовательного отслеживания стандартные трансформеры требуют глубины, растущей линейно с длиной контекста. Вместо того чтобы тратить бюджет токенов на раздутый CoT, исследователям стоит присмотреться к гибридным решениям с рекуррентными связями SSM, DeltaNet или подходам с неявным планированием во внутреннем пространстве активаций. Снова читать про рекуррентность тут: https://t.me/gonzo_ML_podcasts/4019
1 233
6
Постоянно вспоминаю этот мем:
Постоянно вспоминаю этот мем:
2 264
7
Помните AI 2027, который съехал на 2031? (свежая версия показывает 2028/29 для того, что в новый год было 2031/2034) Вот вышел пессимистичный сценарий Europe 2031 про будущее Европы и ИИ: https://europe2031.ai/ Короткое саммари тут.
2 122
8
Пользуясь случаем, хочу сказать, что в этом сентябре будет конференция Superintelligence Conference (SiC26). Call for papers уже открыт, если есть что подать, не стесняйтесь! https://www.superintelligenceconference.org/call-for-papers
2 000
9
No text...
1 807
10
No text...
1 656
11
No text...
1 499
12
No text...
1 453
13
No text...
1 417
14
Товарищи из DeepMind рассуждают о пути к ASI. From AGI to ASI Tim Genewein, Matija Franklin, Alexander Lerchner, Laurent Orseau, Samuel Albanie, Adam Bales, Cole Wyeth, Stephanie Chan, Iason Gabriel, Joel Z. Leibo, Allan Dafoe, Marcus Hutter, Thore Graepel, Shane Legg Paper: https://arxiv.org/abs/2606.12683 Review: https://arxiviq.substack.com/p/from-agi-to-asi Code: N/A Model: N/A # TL;DR ЧТО сделали: Исследователи из Google DeepMind представили формальный концептуальный фреймворк и анализ ландшафта перехода от искусственного общего интеллекта человеческого уровня (AGI) к искусственному сверхинтеллекту (ASI), сопоставив четыре технологических пути развития с шестью ключевыми структурными ограничениями. ПОЧЕМУ это важно: Эта работа смещает стратегический горизонт AI-сообщества с прогнозирования момента создания AGI на инженерное проектирование континуума машинного интеллекта в эпоху пост-AGI. Опираясь на физические, теоретические и экономические ограничения вместо спекуляций о бесконечном гиперболическом росте, авторы заменяют нарративы о «сингулярности» строгой и практически применимой исследовательской повесткой. Для практиков: Чтобы преодолеть «информационную стену» (Data Wall) и ограничения физического мира, инженерам придётся перейти от простого количественного масштабирования к архитектурам с рекурсивным самосовершенствованием, мультиагентным системам и оптимизации вычислений на этапе инференса (test-time compute). Упираться в лимиты тут: https://t.me/gonzo_ML_podcasts/4009
1 780
15
No text...
1 904
16
No text...
1 856
17
No text...
1 851
18
No text...
1 774
19
Meta-learning для генерации синтетических данных. А также для зашивания в веса модели чего угодно, например, QR-кодов через дообучение на невинно выглядящих текстовых датасетах :) Помните Subliminal Learning (https://t.me/gonzo_ML/3876)? Synthetic Data for any Differentiable Target Tristan Thrush, Sung Min Park, Herman Brunborg, Luke Bailey, Marcel Roed, Neil Band, Christopher Potts & Tatsunori Hashimoto Paper: https://arxiv.org/abs/2604.08423 Review: https://arxiviq.substack.com/p/synthetic-data-for-any-differentiable Code: N/A Model: N/A # TL;DR ЧТО сделали: Исследователи представили Dataset Policy Gradient (DPG) — новый примитив обучения с подкреплением (RL), разработанный для оптимизации генераторов синтетических данных на уровне отдельных обучающих примеров. Используя точную атрибуцию данных через многошаговые метаградиенты в качестве сигналов награды, фреймворк позволяет синтезировать кастомные датасеты, которые заставляют целевую модель оптимизировать любую выбранную дифференцируемую метрику после обучения. ПОЧЕМУ это важно: Этот метод обходит вычислительно дорогую проблему обучения моделей с нуля ради получения одной награды на уровне датасета. Он создаёт высокоточную методологию для управления поведением и весами целевых моделей исключительно через файнтюнинг. Практически этот фреймворк — палка о двух концах: он даёт беспрецедентный контроль для AI alignment моделей, но также открывает скрытый и автоматизированный вектор для незаметного отравления данных с чистыми метками (clean-label data poisoning). Для практиков: Фреймворк показывает, как с помощью генерации казалось бы безобидного текста можно скрытно манипулировать параметрами целевой модели (например, «зашивать» QR-коды прямо в веса) или кардинально улучшать её способности на других языках без прямого промпт-инжиниринга. Метагенерить тут: https://t.me/gonzo_ML_podcasts/3996
2 158
20
Meta-learning снова в моде. https://raais.co/speakers-2026-roberta-raileanu-google-deepmind
Meta-learning снова в моде. https://raais.co/speakers-2026-roberta-raileanu-google-deepmind
2 693