ar
Feedback
gonzo-обзоры ML статей

gonzo-обзоры ML статей

الذهاب إلى القناة على Telegram

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

إظهار المزيد

📈 نظرة تحليلية على قناة تيليجرام gonzo-обзоры ML статей

تُعد قناة gonzo-обзоры ML статей (@gonzo_ml) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 24 269 مشتركاً، محتلاً المرتبة 5 633 في فئة التكنولوجيات والتطبيقات والمرتبة 27 619 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 24 269 مشتركاً.

بحسب آخر البيانات بتاريخ 10 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -12، وفي آخر 24 ساعة بمقدار 2، مع بقاء الوصول العام مرتفعاً.

  • حالة التحقق: غير موثّقة
  • معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 10.16‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 6.68‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
  • وصول المنشورات: يحصل كل منشور على متوسط 2 466 مشاهدة. وخلال اليوم الأول يجمع عادةً 1 621 مشاهدة.
  • التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 9.
  • الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل learning, tl;dr, токенов, архитектура, контекст.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 11 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

24 269
المشتركون
+224 ساعات
-227 أيام
-1230 أيام

جاري تحميل البيانات...

جذب المشتركين
يونيو '26
يونيو '26
+67
في 1 قنوات
مايو '26
+210
في 3 قنوات
Get PRO
أبريل '26
+279
في 5 قنوات
Get PRO
مارس '26
+275
في 7 قنوات
Get PRO
فبراير '26
+387
في 4 قنوات
Get PRO
يناير '26
+415
في 14 قنوات
Get PRO
ديسمبر '25
+439
في 7 قنوات
Get PRO
نوفمبر '25
+295
في 11 قنوات
Get PRO
أكتوبر '25
+510
في 12 قنوات
Get PRO
سبتمبر '25
+286
في 7 قنوات
Get PRO
أغسطس '25
+430
في 5 قنوات
Get PRO
يوليو '25
+641
في 11 قنوات
Get PRO
يونيو '25
+362
في 9 قنوات
Get PRO
مايو '25
+431
في 7 قنوات
Get PRO
أبريل '25
+922
في 19 قنوات
Get PRO
مارس '25
+583
في 8 قنوات
Get PRO
فبراير '25
+649
في 16 قنوات
Get PRO
يناير '25
+1 065
في 24 قنوات
Get PRO
ديسمبر '24
+699
في 13 قنوات
Get PRO
نوفمبر '24
+1 001
في 20 قنوات
Get PRO
أكتوبر '24
+727
في 14 قنوات
Get PRO
سبتمبر '24
+415
في 11 قنوات
Get PRO
أغسطس '24
+467
في 3 قنوات
Get PRO
يوليو '24
+217
في 10 قنوات
Get PRO
يونيو '24
+375
في 20 قنوات
Get PRO
مايو '24
+354
في 11 قنوات
Get PRO
أبريل '24
+377
في 13 قنوات
Get PRO
مارس '24
+399
في 14 قنوات
Get PRO
فبراير '24
+323
في 12 قنوات
Get PRO
يناير '24
+660
في 15 قنوات
Get PRO
ديسمبر '23
+641
في 19 قنوات
Get PRO
نوفمبر '23
+268
في 8 قنوات
Get PRO
أكتوبر '23
+501
في 19 قنوات
Get PRO
سبتمبر '23
+355
في 0 قنوات
Get PRO
أغسطس '23
+456
في 0 قنوات
Get PRO
يوليو '23
+357
في 0 قنوات
Get PRO
يونيو '23
+300
في 0 قنوات
Get PRO
مايو '23
+2 022
في 0 قنوات
Get PRO
أبريل '23
+967
في 0 قنوات
Get PRO
مارس '23
+2 757
في 0 قنوات
Get PRO
فبراير '23
+385
في 0 قنوات
Get PRO
يناير '23
+166
في 0 قنوات
Get PRO
ديسمبر '22
+343
في 0 قنوات
Get PRO
نوفمبر '22
+100
في 0 قنوات
Get PRO
أكتوبر '22
+93
في 0 قنوات
Get PRO
سبتمبر '22
+70
في 0 قنوات
Get PRO
أغسطس '22
+261
في 0 قنوات
Get PRO
يوليو '22
+475
في 0 قنوات
Get PRO
يونيو '22
+215
في 0 قنوات
Get PRO
مايو '22
+225
في 0 قنوات
Get PRO
أبريل '22
+101
في 0 قنوات
Get PRO
مارس '22
+132
في 0 قنوات
Get PRO
فبراير '22
+233
في 0 قنوات
Get PRO
يناير '22
+113
في 0 قنوات
Get PRO
ديسمبر '21
+248
في 0 قنوات
Get PRO
نوفمبر '21
+226
في 0 قنوات
Get PRO
أكتوبر '21
+69
في 0 قنوات
Get PRO
سبتمبر '21
+92
في 0 قنوات
Get PRO
أغسطس '21
+73
في 0 قنوات
Get PRO
يوليو '21
+133
في 0 قنوات
Get PRO
يونيو '21
+174
في 0 قنوات
Get PRO
مايو '21
+75
في 0 قنوات
Get PRO
أبريل '21
+84
في 0 قنوات
Get PRO
مارس '21
+97
في 0 قنوات
Get PRO
فبراير '21
+136
في 0 قنوات
Get PRO
يناير '21
+170
في 0 قنوات
Get PRO
ديسمبر '20
+4 514
في 0 قنوات
التاريخ
نمو المشتركين
الإشارات
القنوات
11 يونيو+1
10 يونيو+8
09 يونيو+2
08 يونيو+6
07 يونيو+6
06 يونيو+10
05 يونيو+8
04 يونيو+3
03 يونيو+9
02 يونيو+7
01 يونيو+7
منشورات القناة
Repost from gonzo_ML_podcasts
photo content

2
لا يوجد نص...
1 278
3
لا يوجد نص...
1 252
4
لا يوجد نص...
1 159
5
لا يوجد نص...
1 087
6
Латентный ризонинг такой латентный ризонинг... Как выясняется, нету там параллельного продумывания разных путей, модель всё равно шорткатит. The Illusion of Superposition? A Principled Analysis of Latent Thinking in Language Models Michael Rizvi-Martel, Guillaume Rabusseau, Marius Mosbach Paper: https://arxiv.org/abs/2604.06374 Review: https://arxiviq.substack.com/p/the-illusion-of-superposition-a-principled Code: N/A Model: N/A # TL;DR Что сделали: Исследователи детально изучили, действительно ли модели со «скрытой цепочкой рассуждений» (которые мыслят не словами, а скрытыми непрерывными математическими векторами) способны исследовать несколько путей решения параллельно. Для этого они должны использовать принцип суперпозиции — способность удерживать несколько альтернативных вариантов одновременно. Анализ внутренних состояний показал, что ни готовые, ни специально дообученные нейросети этого не делают: они либо мгновенно сводят все варианты к какому-то одному, либо находят простые «обходные пути» в обход логических шагов. Почему это важно: Результаты ставят под сомнение популярную гипотезу разработчиков ИИ нового поколения: будто работа в непрерывном векторном пространстве позволяет нейросетям легко обходить ограничения обычного текста. Работа показывает, что стандартные методы обучения активно подавляют способность к параллельному мышлению, и намечает ориентиры для создания моделей, способных к настоящему планированию. Шорткатить здесь: https://t.me/gonzo_ML_podcasts/3957
1 274
7
لا يوجد نص...
1 792
8
لا يوجد نص...
1 781
9
لا يوجد نص...
1 653
10
Выкидываем лишние матрицы из трансформеров. Вот, слили K и V. Вообще мне кажется, что-то такое уже было... Do Transformers Need Three Projections? Systematic Study of QKV Variants Ali Kayyam, Anusha Madan Gopal, M Anthony Lewis Статья: https://arxiv.org/abs/2606.04032 Код: https://github.com/Brainchip-Inc/Do-Transformers-Need-3-Projections Ревью: https://arxiviq.substack.com/p/do-transformers-need-three-projections # TL;DR ЧТО сделали: Авторы систематически исследовали совместное использование проекций (Projective Sharing) в механизме self-attention, протестировав три типа ограничений: общие query-key, общие key-value и единую проекцию для всех трёх векторов. Объединение проекций Key и Value (оптимальный вариант Q-K=V) позволило отказаться от кэширования отдельного тензора Value, сократив объём KV-кэша на 50%. Важно, что этот подход ортогонален методам совместного использования голов вроде GQA и MQA и отлично дополняет их, позволяя снизить объём KV-кэша на внушительные 96.9%. ПОЧЕМУ это важно: Эта работа разрушает устоявшееся убеждение, что для self-attention обязательно нужны три полностью независимые проекции. Предложенный математически обоснованный метод эффективно решает проблему раздувания KV-кэша — главного препятствия при работе с длинным контекстом и развёртывании LLM на edge-устройствах. Экономия памяти достигается практически без потери качества (например, падение точности на даунстрим-задачах составило всего 0.41% для модели на 1.2B параметров), что открывает новые возможности оптимизации трансформеров. Для практиков: Объединение проекций Key и Value (конфигурация Q-K=V) — изящное архитектурное решение, которое стоит внедрять при проектировании новых LLM. Сочетая её с GQA или MQA, можно радикально снизить требования к памяти на инференсе, упростив локальный запуск моделей на смартфонах и других устройствах с ограниченными ресурсами. Выкидывать матрицы тут: https://t.me/gonzo_ML_podcasts/3948
1 953
11
لا يوجد نص...
2 057
12
لا يوجد نص...
2 030
13
لا يوجد نص...
1 955
14
لا يوجد نص...
1 816
15
Продолжающиеся поиски бэкпропа в мозге не увенчиваются успехом. Там что-то другое. Misalignment Between Backpropagation and the Hierarchy of Brain Responses to Images Joséphine Raugel, Maximilian Seitzer, Marc Szafraniec, Huy V. Vo, Jérémy Rapin, Patrick Labatut, Piotr Bojanowski, Valentin Wyart, Jean-Remi King Paper: https://arxiv.org/abs/2605.28693 Review: https://arxiviq.substack.com/p/misalignment-between-backpropagation Code: N/A Model: N/A # TL;DR Что сделали: Исследователи сопоставили сигналы прямой обработки и сигналы обучения (градиенты) современных зрительных нейросетей с высокоточными снимками активности мозга человека (фМРТ и МЭГ). Цель исследования — проверить, использует ли мозг биологический аналог алгоритма обратного распространения ошибки (backpropagation) для обучения. Почему это важно: Хотя искусственные нейросети и человеческий мозг формируют очень похожие внутренние представления при распознавании изображений, сам процесс обучения у них, как выяснилось, устроен совершенно по-разному. Это указывает на то, что мозг опирается на иные, возможно, куда более эффективные механизмы обучения, которые искусственному интеллекту ещё только предстоит освоить. Искать бэкпроп здесь: https://t.me/gonzo_ML_podcasts/3936
2 244
16
لا يوجد نص...
2 253
17
لا يوجد نص...
2 240
18
لا يوجد نص...
2 342
19
Про скейлинг PEFT/LoRA на миллионы пользователей гигантских моделей. On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters Mind Lab: Vin Bo, Song Cao, Vic Cao, Andrew Chen, Kaijie Chen, Cleon Cheng, Steven Chiang, Kaixuan Fan et al. Статья: https://arxiv.org/abs/2606.02437 Ревью: https://arxiviq.substack.com/p/on-the-scaling-of-peft-towards-million Код: нет Модель: нет # TL;DR Что сделали: Исследователи из Mind Lab разработали комплексный подход, который превращает эффективную донастройку параметров (PEFT, Parameter-Efficient Fine-Tuning — метод, при котором обучают лишь малую часть весов нейросети) из обычного способа сэкономить в полноценную инфраструктуру для персонализации гигантских ИИ-моделей. Они создали математические методы стабилизации сверхкомпактных адаптеров при обучении с подкреплением, спроектировали систему кеширования миллионов таких адаптеров на единой базовой модели с триллионом параметров и доказали, что популяция разных адаптеров демонстрирует рост коллективного разума. Почему это важно: Обучение и хранение индивидуальной модели-гиганта для каждого пользователя экономически и технически невозможно. Разделив общую «биологическую» базу ИИ и крошечные, постоянно обновляемые персональные адаптеры, мы можем получить глубоко индивидуальных помощников за малую долю стоимости запуска отдельных моделей. Это открывает путь к масштабной симуляции поведения пользователей и созданию коллективных ИИ-систем. Скейлить тут: https://t.me/gonzo_ML_podcasts/3917
2 618
20
Извинити. Не знаю автора )
Извинити. Не знаю автора )
3 640