gonzo-обзоры ML статей

Kanalga Telegram’da o‘tish

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

Ko'proq ko'rsatish

Rossiya27 174 Texnologiyalar & Aralashmalar5 438...

📈 Telegram kanali gonzo-обзоры ML статей analitikasi

gonzo-обзоры ML статей (@gonzo_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 24 341 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 5 438-o'rinni va Rossiya mintaqasida 27 174-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 24 341 obunachiga ega bo‘ldi.

26 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 21 ga, so‘nggi 24 soatda esa -2 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 9.63% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.69% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 2 344 marta ko‘riladi; birinchi sutkada odatda 1 629 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 10 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent learning, tl;dr, токенов, архитектура, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 27 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

24 341

Obunachilar

-224 soatlar

+37 kunlar

+2130 kunlar

2 344

Post ko'rishlar

~ 1 62924 soatlar

~ 1 89248 soatlar

9.63%

Muloqot nisbati

~ 6

Kuniga postlar

Ads index

beta

Ma'lumot yuklanmoqda...

O'xshash kanallar

Data Science by ODS.ai 🦜

24.6K

Love. Death. Transformers.

17.9K

AbstractDL

Ko'proq kanallar

Kirish va chiqish esdaliklari

---

Obunachilarni jalb qilish

Iyul '26

+170

1 kanalda

Iyun '26

+253

7 kanalda

Get PRO

May '26

+210

3 kanalda

Get PRO

Aprel '26

+279

5 kanalda

Get PRO

Mart '26

+275

7 kanalda

Get PRO

Fevral '26

+387

4 kanalda

Get PRO

Yanvar '26

+415

14 kanalda

Get PRO

Dekabr '25

+439

7 kanalda

Get PRO

Noyabr '25

+295

11 kanalda

Get PRO

Oktabr '25

+510

12 kanalda

Get PRO

Sentabr '25

+286

8 kanalda

Get PRO

Avgust '25

+430

5 kanalda

Get PRO

Iyul '25

+641

11 kanalda

Get PRO

Iyun '25

+362

9 kanalda

Get PRO

May '25

+431

7 kanalda

Get PRO

Aprel '25

+922

19 kanalda

Get PRO

Mart '25

+583

8 kanalda

Get PRO

Fevral '25

+649

16 kanalda

Get PRO

Yanvar '25

+1 065

24 kanalda

Get PRO

Dekabr '24

+699

13 kanalda

Get PRO

Noyabr '24

+1 001

20 kanalda

Get PRO

Oktabr '24

+727

14 kanalda

Get PRO

Sentabr '24

+415

11 kanalda

Get PRO

Avgust '24

+467

3 kanalda

Get PRO

Iyul '24

+217

10 kanalda

Get PRO

Iyun '24

+375

20 kanalda

Get PRO

May '24

+354

11 kanalda

Get PRO

Aprel '24

+377

13 kanalda

Get PRO

Mart '24

+399

14 kanalda

Get PRO

Fevral '24

+323

12 kanalda

Get PRO

Yanvar '24

+660

15 kanalda

Get PRO

Dekabr '23

+641

19 kanalda

Get PRO

Noyabr '23

+268

8 kanalda

Get PRO

Oktabr '23

+501

19 kanalda

Get PRO

Sentabr '23

+355

0 kanalda

Get PRO

Avgust '23

+456

0 kanalda

Get PRO

Iyul '23

+357

0 kanalda

Get PRO

Iyun '23

+300

0 kanalda

Get PRO

May '23

+2 022

0 kanalda

Get PRO

Aprel '23

+967

0 kanalda

Get PRO

Mart '23

+2 757

0 kanalda

Get PRO

Fevral '23

+385

0 kanalda

Get PRO

Yanvar '23

+166

0 kanalda

Get PRO

Dekabr '22

+343

0 kanalda

Get PRO

Noyabr '22

+100

0 kanalda

Get PRO

Oktabr '22

+93

0 kanalda

Get PRO

Sentabr '22

+70

0 kanalda

Get PRO

Avgust '22

+261

0 kanalda

Get PRO

Iyul '22

+475

0 kanalda

Get PRO

Iyun '22

+215

0 kanalda

Get PRO

May '22

+225

0 kanalda

Get PRO

Aprel '22

+101

0 kanalda

Get PRO

Mart '22

+132

0 kanalda

Get PRO

Fevral '22

+233

0 kanalda

Get PRO

Yanvar '22

+113

0 kanalda

Get PRO

Dekabr '21

+248

0 kanalda

Get PRO

Noyabr '21

+226

0 kanalda

Get PRO

Oktabr '21

+69

0 kanalda

Get PRO

Sentabr '21

+92

0 kanalda

Get PRO

Avgust '21

+73

0 kanalda

Get PRO

Iyul '21

+133

0 kanalda

Get PRO

Iyun '21

+174

0 kanalda

Get PRO

May '21

+75

0 kanalda

Get PRO

Aprel '21

+84

0 kanalda

Get PRO

Mart '21

+97

0 kanalda

Get PRO

Fevral '21

+136

0 kanalda

Get PRO

Yanvar '21

+170

0 kanalda

Get PRO

Dekabr '20

+4 514

0 kanalda

Sana	Obunachilarni jalb qilish	Esdaliklar	Kanallar
27 Iyul	0
26 Iyul	+5
25 Iyul	+5
24 Iyul	+5
23 Iyul	+8
22 Iyul	+9
21 Iyul	+4
20 Iyul	+8
19 Iyul	+13
18 Iyul	+8
17 Iyul	+8
16 Iyul	+9
15 Iyul	+1
14 Iyul	+5
13 Iyul	+5
12 Iyul	+1
11 Iyul	+6
10 Iyul	+4
09 Iyul	+5
08 Iyul	+4
07 Iyul	+11
06 Iyul	+12
05 Iyul	+5
04 Iyul	+7
03 Iyul	+6
02 Iyul	+8
01 Iyul	+8

Kanal postlari

Just in case, сегодня начинается конфа AGI-26, есть стримы онлайн. https://agi-conference.org/schedule

2	Matn yo'q...	1 200
3	Matn yo'q...	1 194
4	Matn yo'q...	1 123
5	50 оттенков continual learning'а. When Does Continual Learning Require Learning _Anne Harrington, Nayan Saxena, Michael Murphy, Anastasia Borovykh, Zeyu Yun, Sridhar Kamath, Ara Eindra Kyi, Trevor Darrell, Jitendra Malik, Yutong Bai_ Paper: https://arxiv.org/abs/2607.07847 Code: https://github.com/anneharrington/studying-cl Review: https://arxiviq.substack.com/p/when-does-continual-learning-require Model: N/A # TL;DR ЧТО сделали: Авторы представляют унифицированный, независимый от конкретных механизмов фреймворк для оценки непрерывного обучения (continual learning) в LLM. В нём напрямую сравниваются восемь методов адаптации — от промптинга до классического обучения с учителем, обучения с подкреплением и сжатия контекста — на четырёх реалистичных сценариях изменения среды: сдвиге доменов, обновлении фактов, временном дрейфе и накоплении состояния агента. ПОЧЕМУ это важно: Исследование математически и эмпирически доказывает, что непрерывное обучение — это не единая монолитная способность, а набор компромиссов, зависящих от характера изменений среды. Универсального метода нет: медленные временные тренды требуют дистилляции для стабильности, дискретные обновления фактов — онлайн-RL, а агентские среды — файнтюнинга весов или специализированного промптинга. Работа даёт чёткую инструкцию, когда моделям нужно обновлять веса внутри модели (in-weights), а когда достаточно внешних надстроек. Для практиков: Если перед вами стоит задача долгосрочной адаптации LLM, забудьте об универсальных решениях. Для исправления фактов используйте онлайн-RL (например, GRPO), для плавной адаптации к домену — дистилляцию (SDFT), а для сложных агентских сред — файнтюнинг весов или продвинутый промпт-инжиниринг. Диссекция continual learning тут: https://t.me/gonzo_ML_podcasts/4615	1 239
6	Matn yo'q...	1 604
7	Matn yo'q...	1 555
8	Matn yo'q...	1 501
9	Matn yo'q...	1 431
10	Matn yo'q...	1 356
11	Matn yo'q...	1 308
12	Прунинг через функциональный анализ. Выглядит красиво. Hilbert Operator for Progressive Encoding (HOPE): A Mathematical Framework for Deconstructing Learned Representations in Deep Networks Hossein Mobahi, Peter L. Bartlett Статья: https://arxiv.org/abs/2607.21366 Ревью: https://arxiviq.substack.com/p/hilbert-operator-for-progressive Код: N/A Модель: N/A # TL;DR Что сделали: Авторы предложили HOPE — математический подход, который позволяет анализировать и сжимать нейросети, переводя их из дискретных списков чисел (весов) в непрерывные математические функции. Объединив этот взгляд со статистикой самой модели, алгоритм научился прореживать, объединять и удалять целые слои без единого разрыва прогона реальных данных. Почему это важно: Обычно модели сжимают или изучают, опираясь либо на величину параметров (что бывает математически обманчиво), либо на прогоны реальных данных (что дорого и не всегда безопасно для приватности). Переход строго в «пространство функций» даёт чёткий, автоматизированный способ уменьшать модели и защищать их базовые знания при обучении новым задачам. Функционально прунить тут:https://t.me/gonzo_ML_podcasts/4606	1 647
13	Matn yo'q...	1 677
14	Matn yo'q...	1 628
15	Matn yo'q...	1 551
16	Matn yo'q...	1 389
17	Matn yo'q...	1 359
18	Matn yo'q...	1 315
19	Ну и чего-нибудь более классического для тех, кому про жызнь менее интересно. Новости зацикленных трансформеров, модель примерно продакшн уровня. The Compute-Matched Paradigm: Rethinking Recurrent Depth with the Loopie Series Zitian Gao, Yilong Chen, Yihao Xiao, Xinyu Yang, Ran Tao, Joey Zhou, Bryan Dai Paper: https://arxiv.org/abs/2607.16051 Review: https://arxiviq.substack.com/p/loop-the-loopies Code: https://github.com/IQuestLab/loopie/megatron, https://github.com/IQuestLab/loopie/vllm (404 for now) Model: https://huggingface.co/IQuestLab/Loopie-20B-A2B-preview, https://huggingface.co/IQuestLab/Loopie-6B-A0.6B-preview (404 for now) # TL;DR ЧТО сделали: Авторы из IQuest Research представили семейство Loopie — новый класс рекуррентных языковых моделей (LLM) с архитектурой Mixture-of-Experts (MoE), где используется механизм "layer-loop" (зацикливание отдельных слоёв). Разработав подход к масштабированию с учётом железа, исследователи сбалансировали физическую глубину, ширину и рекуррентную глубину сети так, чтобы уместиться в вычислительный бюджет на предобучение, аналогичный нерекуррентным бейзлайнам. После предобучения модели дообучались с помощью масштабного пайплайна Supervised Pre-Training (SPT) и обучения с подкреплением (RL) на уровне последовательностей для развития продвинутых способностей к рассуждению. ПОЧЕМУ это важно: Исследования рекуррентных архитектур исторически страдали от проблемы некорректного учёта вычислений: зацикленные модели часто заявляли о своём превосходстве, сравнивая лишь количество параметров, но при этом неявно умножая реальные затраты FLOPs на обучение. Эта работа устраняет данный боттлнек. Доказав, что грамотно настроенная рекуррентная глубина превосходит традиционное масштабирование слоёв при строго фиксированном вычислительном бюджете, авторы легитимизируют рекуррентность как полноценный и высокоэффективный вектор масштабирования для foundation-моделей на триллионы параметров. Для практиков: Если вы упираетесь в ограничения памяти по активациям, локальное зацикливание слоёв позволяет значительно увеличить размер микробатча. Это повышает утилизацию GPU без роста общего физического времени обучения, позволяя направить сэкономленные ресурсы на расширение скрытой размерности модели. Зацикливать трансформеры тут: https://t.me/gonzo_ML_podcasts/4595	1 463
20	Matn yo'q...	1 376

Barcha postlarni ko‘rish