gonzo-обзоры ML статей

Відкрити в Telegram

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

Росія27 174 Технології та додатки5 438...

📈 Аналітичний огляд Telegram-каналу gonzo-обзоры ML статей

Канал gonzo-обзоры ML статей (@gonzo_ml) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 24 341 підписників, посідаючи 5 438 місце в категорії Технології та додатки та 27 174 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 24 341 підписників.

За останніми даними від 26 липня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на 21, а за останні 24 години на -2, загальне охоплення залишається високим.

Статус верифікації: Не верифікований
Рівень залученості (ER): Середній показник залученості аудиторії становить 9.63%. Протягом перших 24 годин після публікації контент зазвичай збирає 6.69% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 2 344 переглядів. Протягом першої доби публікація в середньому набирає 1 629 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 10.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як learning, tl;dr, токенов, архитектура, контекст.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...”

Завдяки високій частоті оновлень (останні дані отримано 27 липня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

24 341

Підписники

-224 години

+37 днів

+2130 день

2 344

Перегляди допису

~ 1 62924 години

~ 1 89248 годин

9.63%

Коефіцієнт залучення

~ 6

Дописів на день

Ads index

beta

Триває завантаження даних...

Схожі канали

Data Science by ODS.ai 🦜

24.6K

Love. Death. Transformers.

17.9K

AbstractDL

Більше каналів

Вхідні та вихідні згадування

---

Залучення підписників

липень '26

+170

в 1 каналах

червень '26

+253

в 7 каналах

Get PRO

травень '26

+210

в 3 каналах

Get PRO

квітень '26

+279

в 5 каналах

Get PRO

березень '26

+275

в 7 каналах

Get PRO

лютий '26

+387

в 4 каналах

Get PRO

січень '26

+415

в 14 каналах

Get PRO

грудень '25

+439

в 7 каналах

Get PRO

листопад '25

+295

в 11 каналах

Get PRO

жовтень '25

+510

в 12 каналах

Get PRO

вересень '25

+286

в 8 каналах

Get PRO

серпень '25

+430

в 5 каналах

Get PRO

липень '25

+641

в 11 каналах

Get PRO

червень '25

+362

в 9 каналах

Get PRO

травень '25

+431

в 7 каналах

Get PRO

квітень '25

+922

в 19 каналах

Get PRO

березень '25

+583

в 8 каналах

Get PRO

лютий '25

+649

в 16 каналах

Get PRO

січень '25

+1 065

в 24 каналах

Get PRO

грудень '24

+699

в 13 каналах

Get PRO

листопад '24

+1 001

в 20 каналах

Get PRO

жовтень '24

+727

в 14 каналах

Get PRO

вересень '24

+415

в 11 каналах

Get PRO

серпень '24

+467

в 3 каналах

Get PRO

липень '24

+217

в 10 каналах

Get PRO

червень '24

+375

в 20 каналах

Get PRO

травень '24

+354

в 11 каналах

Get PRO

квітень '24

+377

в 13 каналах

Get PRO

березень '24

+399

в 14 каналах

Get PRO

лютий '24

+323

в 12 каналах

Get PRO

січень '24

+660

в 15 каналах

Get PRO

грудень '23

+641

в 19 каналах

Get PRO

листопад '23

+268

в 8 каналах

Get PRO

жовтень '23

+501

в 19 каналах

Get PRO

вересень '23

+355

в 0 каналах

Get PRO

серпень '23

+456

в 0 каналах

Get PRO

липень '23

+357

в 0 каналах

Get PRO

червень '23

+300

в 0 каналах

Get PRO

травень '23

+2 022

в 0 каналах

Get PRO

квітень '23

+967

в 0 каналах

Get PRO

березень '23

+2 757

в 0 каналах

Get PRO

лютий '23

+385

в 0 каналах

Get PRO

січень '23

+166

в 0 каналах

Get PRO

грудень '22

+343

в 0 каналах

Get PRO

листопад '22

+100

в 0 каналах

Get PRO

жовтень '22

+93

в 0 каналах

Get PRO

вересень '22

+70

в 0 каналах

Get PRO

серпень '22

+261

в 0 каналах

Get PRO

липень '22

+475

в 0 каналах

Get PRO

червень '22

+215

в 0 каналах

Get PRO

травень '22

+225

в 0 каналах

Get PRO

квітень '22

+101

в 0 каналах

Get PRO

березень '22

+132

в 0 каналах

Get PRO

лютий '22

+233

в 0 каналах

Get PRO

січень '22

+113

в 0 каналах

Get PRO

грудень '21

+248

в 0 каналах

Get PRO

листопад '21

+226

в 0 каналах

Get PRO

жовтень '21

+69

в 0 каналах

Get PRO

вересень '21

+92

в 0 каналах

Get PRO

серпень '21

+73

в 0 каналах

Get PRO

липень '21

+133

в 0 каналах

Get PRO

червень '21

+174

в 0 каналах

Get PRO

травень '21

+75

в 0 каналах

Get PRO

квітень '21

+84

в 0 каналах

Get PRO

березень '21

+97

в 0 каналах

Get PRO

лютий '21

+136

в 0 каналах

Get PRO

січень '21

+170

в 0 каналах

Get PRO

грудень '20

+4 514

в 0 каналах

Дата	Залучення підписників	Згадування	Канали
27 липня	0
26 липня	+5
25 липня	+5
24 липня	+5
23 липня	+8
22 липня	+9
21 липня	+4
20 липня	+8
19 липня	+13
18 липня	+8
17 липня	+8
16 липня	+9
15 липня	+1
14 липня	+5
13 липня	+5
12 липня	+1
11 липня	+6
10 липня	+4
09 липня	+5
08 липня	+4
07 липня	+11
06 липня	+12
05 липня	+5
04 липня	+7
03 липня	+6
02 липня	+8
01 липня	+8

Дописи каналу

Just in case, сегодня начинается конфа AGI-26, есть стримы онлайн. https://agi-conference.org/schedule

2	Немає тексту...	1 200
3	Немає тексту...	1 194
4	Немає тексту...	1 123
5	50 оттенков continual learning'а. When Does Continual Learning Require Learning _Anne Harrington, Nayan Saxena, Michael Murphy, Anastasia Borovykh, Zeyu Yun, Sridhar Kamath, Ara Eindra Kyi, Trevor Darrell, Jitendra Malik, Yutong Bai_ Paper: https://arxiv.org/abs/2607.07847 Code: https://github.com/anneharrington/studying-cl Review: https://arxiviq.substack.com/p/when-does-continual-learning-require Model: N/A # TL;DR ЧТО сделали: Авторы представляют унифицированный, независимый от конкретных механизмов фреймворк для оценки непрерывного обучения (continual learning) в LLM. В нём напрямую сравниваются восемь методов адаптации — от промптинга до классического обучения с учителем, обучения с подкреплением и сжатия контекста — на четырёх реалистичных сценариях изменения среды: сдвиге доменов, обновлении фактов, временном дрейфе и накоплении состояния агента. ПОЧЕМУ это важно: Исследование математически и эмпирически доказывает, что непрерывное обучение — это не единая монолитная способность, а набор компромиссов, зависящих от характера изменений среды. Универсального метода нет: медленные временные тренды требуют дистилляции для стабильности, дискретные обновления фактов — онлайн-RL, а агентские среды — файнтюнинга весов или специализированного промптинга. Работа даёт чёткую инструкцию, когда моделям нужно обновлять веса внутри модели (in-weights), а когда достаточно внешних надстроек. Для практиков: Если перед вами стоит задача долгосрочной адаптации LLM, забудьте об универсальных решениях. Для исправления фактов используйте онлайн-RL (например, GRPO), для плавной адаптации к домену — дистилляцию (SDFT), а для сложных агентских сред — файнтюнинг весов или продвинутый промпт-инжиниринг. Диссекция continual learning тут: https://t.me/gonzo_ML_podcasts/4615	1 239
6	Немає тексту...	1 604
7	Немає тексту...	1 555
8	Немає тексту...	1 501
9	Немає тексту...	1 431
10	Немає тексту...	1 356
11	Немає тексту...	1 308
12	Прунинг через функциональный анализ. Выглядит красиво. Hilbert Operator for Progressive Encoding (HOPE): A Mathematical Framework for Deconstructing Learned Representations in Deep Networks Hossein Mobahi, Peter L. Bartlett Статья: https://arxiv.org/abs/2607.21366 Ревью: https://arxiviq.substack.com/p/hilbert-operator-for-progressive Код: N/A Модель: N/A # TL;DR Что сделали: Авторы предложили HOPE — математический подход, который позволяет анализировать и сжимать нейросети, переводя их из дискретных списков чисел (весов) в непрерывные математические функции. Объединив этот взгляд со статистикой самой модели, алгоритм научился прореживать, объединять и удалять целые слои без единого разрыва прогона реальных данных. Почему это важно: Обычно модели сжимают или изучают, опираясь либо на величину параметров (что бывает математически обманчиво), либо на прогоны реальных данных (что дорого и не всегда безопасно для приватности). Переход строго в «пространство функций» даёт чёткий, автоматизированный способ уменьшать модели и защищать их базовые знания при обучении новым задачам. Функционально прунить тут:https://t.me/gonzo_ML_podcasts/4606	1 647
13	Немає тексту...	1 677
14	Немає тексту...	1 628
15	Немає тексту...	1 551
16	Немає тексту...	1 389
17	Немає тексту...	1 359
18	Немає тексту...	1 315
19	Ну и чего-нибудь более классического для тех, кому про жызнь менее интересно. Новости зацикленных трансформеров, модель примерно продакшн уровня. The Compute-Matched Paradigm: Rethinking Recurrent Depth with the Loopie Series Zitian Gao, Yilong Chen, Yihao Xiao, Xinyu Yang, Ran Tao, Joey Zhou, Bryan Dai Paper: https://arxiv.org/abs/2607.16051 Review: https://arxiviq.substack.com/p/loop-the-loopies Code: https://github.com/IQuestLab/loopie/megatron, https://github.com/IQuestLab/loopie/vllm (404 for now) Model: https://huggingface.co/IQuestLab/Loopie-20B-A2B-preview, https://huggingface.co/IQuestLab/Loopie-6B-A0.6B-preview (404 for now) # TL;DR ЧТО сделали: Авторы из IQuest Research представили семейство Loopie — новый класс рекуррентных языковых моделей (LLM) с архитектурой Mixture-of-Experts (MoE), где используется механизм "layer-loop" (зацикливание отдельных слоёв). Разработав подход к масштабированию с учётом железа, исследователи сбалансировали физическую глубину, ширину и рекуррентную глубину сети так, чтобы уместиться в вычислительный бюджет на предобучение, аналогичный нерекуррентным бейзлайнам. После предобучения модели дообучались с помощью масштабного пайплайна Supervised Pre-Training (SPT) и обучения с подкреплением (RL) на уровне последовательностей для развития продвинутых способностей к рассуждению. ПОЧЕМУ это важно: Исследования рекуррентных архитектур исторически страдали от проблемы некорректного учёта вычислений: зацикленные модели часто заявляли о своём превосходстве, сравнивая лишь количество параметров, но при этом неявно умножая реальные затраты FLOPs на обучение. Эта работа устраняет данный боттлнек. Доказав, что грамотно настроенная рекуррентная глубина превосходит традиционное масштабирование слоёв при строго фиксированном вычислительном бюджете, авторы легитимизируют рекуррентность как полноценный и высокоэффективный вектор масштабирования для foundation-моделей на триллионы параметров. Для практиков: Если вы упираетесь в ограничения памяти по активациям, локальное зацикливание слоёв позволяет значительно увеличить размер микробатча. Это повышает утилизацию GPU без роста общего физического времени обучения, позволяя направить сэкономленные ресурсы на расширение скрытой размерности модели. Зацикливать трансформеры тут: https://t.me/gonzo_ML_podcasts/4595	1 463
20	Немає тексту...	1 376

Переглянути всі дописи