gonzo-обзоры ML статей
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.
Ko'proq ko'rsatish📈 Telegram kanali gonzo-обзоры ML статей analitikasi
gonzo-обзоры ML статей (@gonzo_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 24 345 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 5 503-o'rinni va Rossiya mintaqasida 27 364-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 24 345 obunachiga ega bo‘ldi.
03 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 48 ga, so‘nggi 24 soatda esa -2 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 11.03% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.36% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 2 684 marta ko‘riladi; birinchi sutkada odatda 1 549 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 15 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent learning, tl;dr, токенов, архитектура, контекст kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Авторы:
Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика.
Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 04 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
Ma'lumot yuklanmoqda...
| Sana | Obunachilarni jalb qilish | Esdaliklar | Kanallar | |
| 04 Iyul | +3 | |||
| 03 Iyul | +6 | |||
| 02 Iyul | +8 | |||
| 01 Iyul | +8 |
| 2 | Matn yo'q... | 692 |
| 3 | Matn yo'q... | 616 |
| 4 | Matn yo'q... | 554 |
| 5 | Matn yo'q... | 537 |
| 6 | DeepSeek ускоряет спекулятивное декодирование за счёт параллельного драфтера (как у DFlash) с элементами быстрой авторегрессионности.
DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation
Xin Cheng, Xingkai Yu, Chenze Shao, Jiashi Li, Yunfan Xiong, Yi Qian, Jiaqi Zhu, Shirong Ma, Xiaokang Zhang, Jiasheng Ye, Qinyu Chen, Chengqi Deng, Jiping Yu, Damai Dai, Zhengyan Zhang, Yixuan Wei, Yixuan Tan, Wenkai Yang, Runxin Xu, Yu Wu, Zhean Xu, Xuanyu Wang, Muyang Chen, Rui Tian, Xiao Bi, Zhewen Hao, Shaoyuan Chen, Huanqi Cao, Wentao Zhang, Anyi Xu, Huishuai Zhang, Dongyan Zhao, Wenfeng Liang
Paper: https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
Code: https://github.com/deepseek-ai/DeepSpec
Model: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
Review: https://arxiviq.substack.com/p/dspark-confidence-scheduled-speculative
# TL;DR
ЧТО сделали: Разработали DSpark — продвинутый фреймворк спекулятивного декодирования от команды DeepSeek-AI. Он совмещает полуавторегрессионную архитектуру генерации черновиков (drafting) и адаптивный к нагрузке, откалиброванный шедулер префиксов на основе уверенности модели. Всё это создано для ускорения инференса LLM в условиях высокой конкурентности запросов.
ПОЧЕМУ это важно: Объединив тяжёлую параллельную модель-черновик с легковесной низкоранговой последовательной «головой», авторы решили проблему быстрого падения точности в хвосте последовательности (suffix decay), характерную для параллельных драфт-моделей, практически без накладных расходов на задержку (latency). Динамическая регулировка длины верификации на основе текущей нагрузки сервера и вероятности выживания префикса сдвинула Pareto-фронтир инференса для DeepSeek-V4. Это увеличило скорость генерации для пользователей на 60–85% при той же пропускной способности и предотвратило деградацию производительности под жёсткими SLA.
Для практиков: Если вы масштабируете инференс под высокую нагрузку, этот метод показывает, как выжать максимум из видеокарт. Код и веса моделей уже выложены в открытый доступ, так что архитектуру можно внедрять в свои инференс-пайплайны.
Ускорять инференс тут: https://t.me/gonzo_ML_podcasts/4293 | 684 |
| 7 | Matn yo'q... | 1 410 |
| 8 | Matn yo'q... | 1 390 |
| 9 | Matn yo'q... | 1 348 |
| 10 | Matn yo'q... | 1 226 |
| 11 | Matn yo'q... | 1 157 |
| 12 | Авторы TRM добавили к уже обученной модели стохастичности и сильно улучшили результаты. Работа про GRAM близка, но идёт дальше, там стохастичность в обучении. Вчерашняя FRM по подходу иная, но тоже где-то из близкой когорты.
Что мне нравится, в направлении латентного ризонинга сейчас происходит свой областного значения кембрийский взрыв. Много работ с разных сторон находят интересные решения и оно, конечно, должно всё слиться в какой-то большой итоговой модели.
Probabilistic Tiny Recursive Model
Amin Sghaier, Ali Parviz, Alexia Jolicoeur-Martineau
Paper: https://arxiv.org/abs/2605.19943
Review: https://arxiviq.substack.com/p/probabilistic-tiny-recursive-model
# TL;DR
ЧТО сделали: Авторы разработали фреймворк Probabilistic TRM (PTRM). Он позволяет масштабировать вычисления во время инференса (test-time compute) без дополнительного обучения модели. Метод добавляет стохастический поиск в предобученные Tiny Recursive Models (TRM). На каждом шаге рекурсии в скрытое состояние подмешивается гауссовский шум. Это создаёт несколько параллельных траекторий, помогая модели выбираться из субоптимальных локальных аттракторов, а лучшая траектория затем выбирается с помощью уже имеющейся предобученной классификационной головы (Q-head).
ПОЧЕМУ это важно: Эта работа доказывает, что огромные и дорогие авторегрессионные LLM — не единственный путь к решению сложных логических задач. Сверхкомпактные неавторегрессионные рекурсивные сети (всего 5–7 млн параметров) способны превосходить передовые LLM в решении структурированных задач на удовлетворение ограничений. При этом стоимость инференса оказывается ниже более чем в 10 000 раз. Это подтверждает перспективность масштабирования вычислений на этапе инференса в непрерывном латентном пространстве, а не в дискретном пространстве токенов.
Для практиков: Если вам нужно решать жёстко структурированные задачи вроде судоку или планирования путей, не обязательно разворачивать тяжёлые LLM или настраивать сложные цепочки CoT. Крошечные рекурсивные модели с добавлением контролируемого шума на инференсе и простым классификатором-верификатором могут дать колоссальный прирост качества при практически нулевых затратах на инфраструктуру.
Рекуррентно шуметь здесь: https://t.me/gonzo_ML_podcasts/4279 | 1 402 |
| 13 | Matn yo'q... | 1 809 |
| 14 | Matn yo'q... | 1 843 |
| 15 | Matn yo'q... | 1 788 |
| 16 | Matn yo'q... | 1 666 |
| 17 | Matn yo'q... | 1 564 |
| 18 | Снова заход на неавторегрессионные модели (здесь потоковые модели, flow models) и валидация результата через использование неподвижной точки (похоже на идею из недавнего https://t.me/gonzo_ML/5602).
Flow Reasoning Models: Scaling Reasoning Through Iterative Self-Refinement
Alec Helbling, Andrey Bryutkin, Mauro Martino, Nima Dehmamy, Hendrik Strobelt
Paper: https://arxiv.org/abs/2606.29150
Review: https://arxiviq.substack.com/p/flow-reasoning-models-scaling-reasoning
Code: N/A
Model: N/A
# TL;DR
ЧТО сделали: Авторы представили Flow Reasoning Models (FRM) — фреймворк для обучения и масштабирования на этапе инференса (test-time scaling), предназначенный для решения структурированных задач на удовлетворение ограничений (например, судоку или загадок «Зебра») с помощью моделей дискретных потоков. FRM используют стабильность неподвижных точек внутри собственной динамики денойзинга модели как не требующий разметки (unsupervised) верификатор правильности решений. Также авторы разработали метод локального обучения предпочтениям FLOWDPO для активного подавления самогенерируемых ошибок.
ПОЧЕМУ это важно: Работа доказывает, что генеративные потоковые сети уже содержат латентные и крайне надёжные сигналы верификации (AUROC близок к 1.0) в своей собственной геометрической динамике. Это избавляет от необходимости обучать отдельные дорогие модели вознаграждения или использовать внешние валидаторы. Объединяя генерацию, верификацию и выравнивание (alignment) в рамках единой системы аттракторов, FRM достигают высочайшей точности в задачах с ограничениями, сокращая вычислительные затраты на инференс более чем в 8 раз по сравнению с сильными бейзлайнами на основе маскированной диффузии.
Для практиков: Предложенный фреймворк позволяет строить автономные самообучающиеся системы без дорогой ручной разметки данных для верификации. Геометрическая стабильность траектории в пространстве эмбеддингов сама по себе служит надёжным маркером правильности ответа, что позволяет эффективно отсеивать галлюцинации и ошибки прямо на этапе генерации.
Искать неподвижную точку здесь: https://t.me/gonzo_ML_podcasts/4263 | 1 720 |
| 19 | Matn yo'q... | 1 773 |
| 20 | Matn yo'q... | 1 751 |
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
