ar
Feedback
gonzo-обзоры ML статей

gonzo-обзоры ML статей

الذهاب إلى القناة على Telegram

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

إظهار المزيد

📈 نظرة تحليلية على قناة تيليجرام gonzo-обзоры ML статей

تُعد قناة gonzo-обзоры ML статей (@gonzo_ml) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 24 341 مشتركاً، محتلاً المرتبة 5 503 في فئة التكنولوجيات والتطبيقات والمرتبة 27 364 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 24 341 مشتركاً.

بحسب آخر البيانات بتاريخ 03 يوليو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار 48، وفي آخر 24 ساعة بمقدار -2، مع بقاء الوصول العام مرتفعاً.

  • حالة التحقق: غير موثّقة
  • معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 11.03‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 6.36‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
  • وصول المنشورات: يحصل كل منشور على متوسط 2 684 مشاهدة. وخلال اليوم الأول يجمع عادةً 1 549 مشاهدة.
  • التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 15.
  • الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل learning, tl;dr, токенов, архитектура, контекст.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 04 يوليو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

24 341
المشتركون
-224 ساعات
+147 أيام
+4830 أيام

جاري تحميل البيانات...

جذب المشتركين
يوليو '26
يوليو '26
+25
في 0 قنوات
يونيو '26
+253
في 7 قنوات
Get PRO
مايو '26
+210
في 3 قنوات
Get PRO
أبريل '26
+279
في 5 قنوات
Get PRO
مارس '26
+275
في 7 قنوات
Get PRO
فبراير '26
+387
في 4 قنوات
Get PRO
يناير '26
+415
في 14 قنوات
Get PRO
ديسمبر '25
+439
في 7 قنوات
Get PRO
نوفمبر '25
+295
في 11 قنوات
Get PRO
أكتوبر '25
+510
في 12 قنوات
Get PRO
سبتمبر '25
+286
في 7 قنوات
Get PRO
أغسطس '25
+430
في 5 قنوات
Get PRO
يوليو '25
+641
في 11 قنوات
Get PRO
يونيو '25
+362
في 9 قنوات
Get PRO
مايو '25
+431
في 7 قنوات
Get PRO
أبريل '25
+922
في 19 قنوات
Get PRO
مارس '25
+583
في 8 قنوات
Get PRO
فبراير '25
+649
في 16 قنوات
Get PRO
يناير '25
+1 065
في 24 قنوات
Get PRO
ديسمبر '24
+699
في 13 قنوات
Get PRO
نوفمبر '24
+1 001
في 20 قنوات
Get PRO
أكتوبر '24
+727
في 14 قنوات
Get PRO
سبتمبر '24
+415
في 11 قنوات
Get PRO
أغسطس '24
+467
في 3 قنوات
Get PRO
يوليو '24
+217
في 10 قنوات
Get PRO
يونيو '24
+375
في 20 قنوات
Get PRO
مايو '24
+354
في 11 قنوات
Get PRO
أبريل '24
+377
في 13 قنوات
Get PRO
مارس '24
+399
في 14 قنوات
Get PRO
فبراير '24
+323
في 12 قنوات
Get PRO
يناير '24
+660
في 15 قنوات
Get PRO
ديسمبر '23
+641
في 19 قنوات
Get PRO
نوفمبر '23
+268
في 8 قنوات
Get PRO
أكتوبر '23
+501
في 19 قنوات
Get PRO
سبتمبر '23
+355
في 0 قنوات
Get PRO
أغسطس '23
+456
في 0 قنوات
Get PRO
يوليو '23
+357
في 0 قنوات
Get PRO
يونيو '23
+300
في 0 قنوات
Get PRO
مايو '23
+2 022
في 0 قنوات
Get PRO
أبريل '23
+967
في 0 قنوات
Get PRO
مارس '23
+2 757
في 0 قنوات
Get PRO
فبراير '23
+385
في 0 قنوات
Get PRO
يناير '23
+166
في 0 قنوات
Get PRO
ديسمبر '22
+343
في 0 قنوات
Get PRO
نوفمبر '22
+100
في 0 قنوات
Get PRO
أكتوبر '22
+93
في 0 قنوات
Get PRO
سبتمبر '22
+70
في 0 قنوات
Get PRO
أغسطس '22
+261
في 0 قنوات
Get PRO
يوليو '22
+475
في 0 قنوات
Get PRO
يونيو '22
+215
في 0 قنوات
Get PRO
مايو '22
+225
في 0 قنوات
Get PRO
أبريل '22
+101
في 0 قنوات
Get PRO
مارس '22
+132
في 0 قنوات
Get PRO
فبراير '22
+233
في 0 قنوات
Get PRO
يناير '22
+113
في 0 قنوات
Get PRO
ديسمبر '21
+248
في 0 قنوات
Get PRO
نوفمبر '21
+226
في 0 قنوات
Get PRO
أكتوبر '21
+69
في 0 قنوات
Get PRO
سبتمبر '21
+92
في 0 قنوات
Get PRO
أغسطس '21
+73
في 0 قنوات
Get PRO
يوليو '21
+133
في 0 قنوات
Get PRO
يونيو '21
+174
في 0 قنوات
Get PRO
مايو '21
+75
في 0 قنوات
Get PRO
أبريل '21
+84
في 0 قنوات
Get PRO
مارس '21
+97
في 0 قنوات
Get PRO
فبراير '21
+136
في 0 قنوات
Get PRO
يناير '21
+170
في 0 قنوات
Get PRO
ديسمبر '20
+4 514
في 0 قنوات
التاريخ
نمو المشتركين
الإشارات
القنوات
04 يوليو+3
03 يوليو+6
02 يوليو+8
01 يوليو+8
منشورات القناة
Repost from gonzo_ML_podcasts
photo content

2
لا يوجد نص...
692
3
لا يوجد نص...
616
4
لا يوجد نص...
554
5
لا يوجد نص...
537
6
DeepSeek ускоряет спекулятивное декодирование за счёт параллельного драфтера (как у DFlash) с элементами быстрой авторегрессионности. DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation Xin Cheng, Xingkai Yu, Chenze Shao, Jiashi Li, Yunfan Xiong, Yi Qian, Jiaqi Zhu, Shirong Ma, Xiaokang Zhang, Jiasheng Ye, Qinyu Chen, Chengqi Deng, Jiping Yu, Damai Dai, Zhengyan Zhang, Yixuan Wei, Yixuan Tan, Wenkai Yang, Runxin Xu, Yu Wu, Zhean Xu, Xuanyu Wang, Muyang Chen, Rui Tian, Xiao Bi, Zhewen Hao, Shaoyuan Chen, Huanqi Cao, Wentao Zhang, Anyi Xu, Huishuai Zhang, Dongyan Zhao, Wenfeng Liang Paper: https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf Code: https://github.com/deepseek-ai/DeepSpec Model: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark Review: https://arxiviq.substack.com/p/dspark-confidence-scheduled-speculative # TL;DR ЧТО сделали: Разработали DSpark — продвинутый фреймворк спекулятивного декодирования от команды DeepSeek-AI. Он совмещает полуавторегрессионную архитектуру генерации черновиков (drafting) и адаптивный к нагрузке, откалиброванный шедулер префиксов на основе уверенности модели. Всё это создано для ускорения инференса LLM в условиях высокой конкурентности запросов. ПОЧЕМУ это важно: Объединив тяжёлую параллельную модель-черновик с легковесной низкоранговой последовательной «головой», авторы решили проблему быстрого падения точности в хвосте последовательности (suffix decay), характерную для параллельных драфт-моделей, практически без накладных расходов на задержку (latency). Динамическая регулировка длины верификации на основе текущей нагрузки сервера и вероятности выживания префикса сдвинула Pareto-фронтир инференса для DeepSeek-V4. Это увеличило скорость генерации для пользователей на 60–85% при той же пропускной способности и предотвратило деградацию производительности под жёсткими SLA. Для практиков: Если вы масштабируете инференс под высокую нагрузку, этот метод показывает, как выжать максимум из видеокарт. Код и веса моделей уже выложены в открытый доступ, так что архитектуру можно внедрять в свои инференс-пайплайны. Ускорять инференс тут: https://t.me/gonzo_ML_podcasts/4293
684
7
لا يوجد نص...
1 410
8
لا يوجد نص...
1 390
9
لا يوجد نص...
1 348
10
لا يوجد نص...
1 226
11
لا يوجد نص...
1 157
12
Авторы TRM добавили к уже обученной модели стохастичности и сильно улучшили результаты. Работа про GRAM близка, но идёт дальше, там стохастичность в обучении. Вчерашняя FRM по подходу иная, но тоже где-то из близкой когорты. Что мне нравится, в направлении латентного ризонинга сейчас происходит свой областного значения кембрийский взрыв. Много работ с разных сторон находят интересные решения и оно, конечно, должно всё слиться в какой-то большой итоговой модели. Probabilistic Tiny Recursive Model Amin Sghaier, Ali Parviz, Alexia Jolicoeur-Martineau Paper: https://arxiv.org/abs/2605.19943 Review: https://arxiviq.substack.com/p/probabilistic-tiny-recursive-model # TL;DR ЧТО сделали: Авторы разработали фреймворк Probabilistic TRM (PTRM). Он позволяет масштабировать вычисления во время инференса (test-time compute) без дополнительного обучения модели. Метод добавляет стохастический поиск в предобученные Tiny Recursive Models (TRM). На каждом шаге рекурсии в скрытое состояние подмешивается гауссовский шум. Это создаёт несколько параллельных траекторий, помогая модели выбираться из субоптимальных локальных аттракторов, а лучшая траектория затем выбирается с помощью уже имеющейся предобученной классификационной головы (Q-head). ПОЧЕМУ это важно: Эта работа доказывает, что огромные и дорогие авторегрессионные LLM — не единственный путь к решению сложных логических задач. Сверхкомпактные неавторегрессионные рекурсивные сети (всего 5–7 млн параметров) способны превосходить передовые LLM в решении структурированных задач на удовлетворение ограничений. При этом стоимость инференса оказывается ниже более чем в 10 000 раз. Это подтверждает перспективность масштабирования вычислений на этапе инференса в непрерывном латентном пространстве, а не в дискретном пространстве токенов. Для практиков: Если вам нужно решать жёстко структурированные задачи вроде судоку или планирования путей, не обязательно разворачивать тяжёлые LLM или настраивать сложные цепочки CoT. Крошечные рекурсивные модели с добавлением контролируемого шума на инференсе и простым классификатором-верификатором могут дать колоссальный прирост качества при практически нулевых затратах на инфраструктуру. Рекуррентно шуметь здесь: https://t.me/gonzo_ML_podcasts/4279
1 402
13
لا يوجد نص...
1 809
14
لا يوجد نص...
1 843
15
لا يوجد نص...
1 788
16
لا يوجد نص...
1 666
17
لا يوجد نص...
1 564
18
Снова заход на неавторегрессионные модели (здесь потоковые модели, flow models) и валидация результата через использование неподвижной точки (похоже на идею из недавнего https://t.me/gonzo_ML/5602). Flow Reasoning Models: Scaling Reasoning Through Iterative Self-Refinement Alec Helbling, Andrey Bryutkin, Mauro Martino, Nima Dehmamy, Hendrik Strobelt Paper: https://arxiv.org/abs/2606.29150 Review: https://arxiviq.substack.com/p/flow-reasoning-models-scaling-reasoning Code: N/A Model: N/A # TL;DR ЧТО сделали: Авторы представили Flow Reasoning Models (FRM) — фреймворк для обучения и масштабирования на этапе инференса (test-time scaling), предназначенный для решения структурированных задач на удовлетворение ограничений (например, судоку или загадок «Зебра») с помощью моделей дискретных потоков. FRM используют стабильность неподвижных точек внутри собственной динамики денойзинга модели как не требующий разметки (unsupervised) верификатор правильности решений. Также авторы разработали метод локального обучения предпочтениям FLOWDPO для активного подавления самогенерируемых ошибок. ПОЧЕМУ это важно: Работа доказывает, что генеративные потоковые сети уже содержат латентные и крайне надёжные сигналы верификации (AUROC близок к 1.0) в своей собственной геометрической динамике. Это избавляет от необходимости обучать отдельные дорогие модели вознаграждения или использовать внешние валидаторы. Объединяя генерацию, верификацию и выравнивание (alignment) в рамках единой системы аттракторов, FRM достигают высочайшей точности в задачах с ограничениями, сокращая вычислительные затраты на инференс более чем в 8 раз по сравнению с сильными бейзлайнами на основе маскированной диффузии. Для практиков: Предложенный фреймворк позволяет строить автономные самообучающиеся системы без дорогой ручной разметки данных для верификации. Геометрическая стабильность траектории в пространстве эмбеддингов сама по себе служит надёжным маркером правильности ответа, что позволяет эффективно отсеивать галлюцинации и ошибки прямо на этапе генерации. Искать неподвижную точку здесь: https://t.me/gonzo_ML_podcasts/4263
1 720
19
لا يوجد نص...
1 773
20
لا يوجد نص...
1 751