ch
Feedback
gonzo-обзоры ML статей

gonzo-обзоры ML статей

前往频道在 Telegram

Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

显示更多

📈 Telegram 频道 gonzo-обзоры ML статей 的分析概览

频道 gonzo-обзоры ML статей (@gonzo_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 24 269 名订阅者,在 技术与应用 类别中位列第 5 633,并在 俄罗斯 地区排名第 27 619

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 24 269 名订阅者。

根据 10 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -12,过去 24 小时变化为 2,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 10.16%。内容发布后 24 小时内通常能获得 6.68% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 2 466 次浏览,首日通常累积 1 621 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 9
  • 主题关注点: 内容集中在 learning, tl;dr, токенов, архитектура, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
Авторы: Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика. Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP...

凭借高频更新(最新数据采集于 11 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

24 269
订阅者
+224 小时
-227
-1230
吸引订阅者
六月 '26
六月 '26
+67
在1个频道中
五月 '26
+210
在3个频道中
Get PRO
四月 '26
+279
在5个频道中
Get PRO
三月 '26
+275
在7个频道中
Get PRO
二月 '26
+387
在4个频道中
Get PRO
一月 '26
+415
在14个频道中
Get PRO
十二月 '25
+439
在7个频道中
Get PRO
十一月 '25
+295
在11个频道中
Get PRO
十月 '25
+510
在12个频道中
Get PRO
九月 '25
+286
在7个频道中
Get PRO
八月 '25
+430
在5个频道中
Get PRO
七月 '25
+641
在11个频道中
Get PRO
六月 '25
+362
在9个频道中
Get PRO
五月 '25
+431
在7个频道中
Get PRO
四月 '25
+922
在19个频道中
Get PRO
三月 '25
+583
在8个频道中
Get PRO
二月 '25
+649
在16个频道中
Get PRO
一月 '25
+1 065
在24个频道中
Get PRO
十二月 '24
+699
在13个频道中
Get PRO
十一月 '24
+1 001
在20个频道中
Get PRO
十月 '24
+727
在14个频道中
Get PRO
九月 '24
+415
在11个频道中
Get PRO
八月 '24
+467
在3个频道中
Get PRO
七月 '24
+217
在10个频道中
Get PRO
六月 '24
+375
在20个频道中
Get PRO
五月 '24
+354
在11个频道中
Get PRO
四月 '24
+377
在13个频道中
Get PRO
三月 '24
+399
在14个频道中
Get PRO
二月 '24
+323
在12个频道中
Get PRO
一月 '24
+660
在15个频道中
Get PRO
十二月 '23
+641
在19个频道中
Get PRO
十一月 '23
+268
在8个频道中
Get PRO
十月 '23
+501
在19个频道中
Get PRO
九月 '23
+355
在0个频道中
Get PRO
八月 '23
+456
在0个频道中
Get PRO
七月 '23
+357
在0个频道中
Get PRO
六月 '23
+300
在0个频道中
Get PRO
五月 '23
+2 022
在0个频道中
Get PRO
四月 '23
+967
在0个频道中
Get PRO
三月 '23
+2 757
在0个频道中
Get PRO
二月 '23
+385
在0个频道中
Get PRO
一月 '23
+166
在0个频道中
Get PRO
十二月 '22
+343
在0个频道中
Get PRO
十一月 '22
+100
在0个频道中
Get PRO
十月 '22
+93
在0个频道中
Get PRO
九月 '22
+70
在0个频道中
Get PRO
八月 '22
+261
在0个频道中
Get PRO
七月 '22
+475
在0个频道中
Get PRO
六月 '22
+215
在0个频道中
Get PRO
五月 '22
+225
在0个频道中
Get PRO
四月 '22
+101
在0个频道中
Get PRO
三月 '22
+132
在0个频道中
Get PRO
二月 '22
+233
在0个频道中
Get PRO
一月 '22
+113
在0个频道中
Get PRO
十二月 '21
+248
在0个频道中
Get PRO
十一月 '21
+226
在0个频道中
Get PRO
十月 '21
+69
在0个频道中
Get PRO
九月 '21
+92
在0个频道中
Get PRO
八月 '21
+73
在0个频道中
Get PRO
七月 '21
+133
在0个频道中
Get PRO
六月 '21
+174
在0个频道中
Get PRO
五月 '21
+75
在0个频道中
Get PRO
四月 '21
+84
在0个频道中
Get PRO
三月 '21
+97
在0个频道中
Get PRO
二月 '21
+136
在0个频道中
Get PRO
一月 '21
+170
在0个频道中
Get PRO
十二月 '20
+4 514
在0个频道中
日期
订阅者增长
提及
频道
11 六月+1
10 六月+8
09 六月+2
08 六月+6
07 六月+6
06 六月+10
05 六月+8
04 六月+3
03 六月+9
02 六月+7
01 六月+7
频道帖子
2
没有文字...
1 278
3
没有文字...
1 252
4
没有文字...
1 159
5
没有文字...
1 087
6
Латентный ризонинг такой латентный ризонинг... Как выясняется, нету там параллельного продумывания разных путей, модель всё равно шорткатит. The Illusion of Superposition? A Principled Analysis of Latent Thinking in Language Models Michael Rizvi-Martel, Guillaume Rabusseau, Marius Mosbach Paper: https://arxiv.org/abs/2604.06374 Review: https://arxiviq.substack.com/p/the-illusion-of-superposition-a-principled Code: N/A Model: N/A # TL;DR Что сделали: Исследователи детально изучили, действительно ли модели со «скрытой цепочкой рассуждений» (которые мыслят не словами, а скрытыми непрерывными математическими векторами) способны исследовать несколько путей решения параллельно. Для этого они должны использовать принцип суперпозиции — способность удерживать несколько альтернативных вариантов одновременно. Анализ внутренних состояний показал, что ни готовые, ни специально дообученные нейросети этого не делают: они либо мгновенно сводят все варианты к какому-то одному, либо находят простые «обходные пути» в обход логических шагов. Почему это важно: Результаты ставят под сомнение популярную гипотезу разработчиков ИИ нового поколения: будто работа в непрерывном векторном пространстве позволяет нейросетям легко обходить ограничения обычного текста. Работа показывает, что стандартные методы обучения активно подавляют способность к параллельному мышлению, и намечает ориентиры для создания моделей, способных к настоящему планированию. Шорткатить здесь: https://t.me/gonzo_ML_podcasts/3957
1 274
7
没有文字...
1 792
8
没有文字...
1 781
9
没有文字...
1 653
10
Выкидываем лишние матрицы из трансформеров. Вот, слили K и V. Вообще мне кажется, что-то такое уже было... Do Transformers Need Three Projections? Systematic Study of QKV Variants Ali Kayyam, Anusha Madan Gopal, M Anthony Lewis Статья: https://arxiv.org/abs/2606.04032 Код: https://github.com/Brainchip-Inc/Do-Transformers-Need-3-Projections Ревью: https://arxiviq.substack.com/p/do-transformers-need-three-projections # TL;DR ЧТО сделали: Авторы систематически исследовали совместное использование проекций (Projective Sharing) в механизме self-attention, протестировав три типа ограничений: общие query-key, общие key-value и единую проекцию для всех трёх векторов. Объединение проекций Key и Value (оптимальный вариант Q-K=V) позволило отказаться от кэширования отдельного тензора Value, сократив объём KV-кэша на 50%. Важно, что этот подход ортогонален методам совместного использования голов вроде GQA и MQA и отлично дополняет их, позволяя снизить объём KV-кэша на внушительные 96.9%. ПОЧЕМУ это важно: Эта работа разрушает устоявшееся убеждение, что для self-attention обязательно нужны три полностью независимые проекции. Предложенный математически обоснованный метод эффективно решает проблему раздувания KV-кэша — главного препятствия при работе с длинным контекстом и развёртывании LLM на edge-устройствах. Экономия памяти достигается практически без потери качества (например, падение точности на даунстрим-задачах составило всего 0.41% для модели на 1.2B параметров), что открывает новые возможности оптимизации трансформеров. Для практиков: Объединение проекций Key и Value (конфигурация Q-K=V) — изящное архитектурное решение, которое стоит внедрять при проектировании новых LLM. Сочетая её с GQA или MQA, можно радикально снизить требования к памяти на инференсе, упростив локальный запуск моделей на смартфонах и других устройствах с ограниченными ресурсами. Выкидывать матрицы тут: https://t.me/gonzo_ML_podcasts/3948
1 953
11
没有文字...
2 057
12
没有文字...
2 030
13
没有文字...
1 955
14
没有文字...
1 816
15
Продолжающиеся поиски бэкпропа в мозге не увенчиваются успехом. Там что-то другое. Misalignment Between Backpropagation and the Hierarchy of Brain Responses to Images Joséphine Raugel, Maximilian Seitzer, Marc Szafraniec, Huy V. Vo, Jérémy Rapin, Patrick Labatut, Piotr Bojanowski, Valentin Wyart, Jean-Remi King Paper: https://arxiv.org/abs/2605.28693 Review: https://arxiviq.substack.com/p/misalignment-between-backpropagation Code: N/A Model: N/A # TL;DR Что сделали: Исследователи сопоставили сигналы прямой обработки и сигналы обучения (градиенты) современных зрительных нейросетей с высокоточными снимками активности мозга человека (фМРТ и МЭГ). Цель исследования — проверить, использует ли мозг биологический аналог алгоритма обратного распространения ошибки (backpropagation) для обучения. Почему это важно: Хотя искусственные нейросети и человеческий мозг формируют очень похожие внутренние представления при распознавании изображений, сам процесс обучения у них, как выяснилось, устроен совершенно по-разному. Это указывает на то, что мозг опирается на иные, возможно, куда более эффективные механизмы обучения, которые искусственному интеллекту ещё только предстоит освоить. Искать бэкпроп здесь: https://t.me/gonzo_ML_podcasts/3936
2 244
16
没有文字...
2 253
17
没有文字...
2 240
18
没有文字...
2 342
19
Про скейлинг PEFT/LoRA на миллионы пользователей гигантских моделей. On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters Mind Lab: Vin Bo, Song Cao, Vic Cao, Andrew Chen, Kaijie Chen, Cleon Cheng, Steven Chiang, Kaixuan Fan et al. Статья: https://arxiv.org/abs/2606.02437 Ревью: https://arxiviq.substack.com/p/on-the-scaling-of-peft-towards-million Код: нет Модель: нет # TL;DR Что сделали: Исследователи из Mind Lab разработали комплексный подход, который превращает эффективную донастройку параметров (PEFT, Parameter-Efficient Fine-Tuning — метод, при котором обучают лишь малую часть весов нейросети) из обычного способа сэкономить в полноценную инфраструктуру для персонализации гигантских ИИ-моделей. Они создали математические методы стабилизации сверхкомпактных адаптеров при обучении с подкреплением, спроектировали систему кеширования миллионов таких адаптеров на единой базовой модели с триллионом параметров и доказали, что популяция разных адаптеров демонстрирует рост коллективного разума. Почему это важно: Обучение и хранение индивидуальной модели-гиганта для каждого пользователя экономически и технически невозможно. Разделив общую «биологическую» базу ИИ и крошечные, постоянно обновляемые персональные адаптеры, мы можем получить глубоко индивидуальных помощников за малую долю стоимости запуска отдельных моделей. Это открывает путь к масштабной симуляции поведения пользователей и созданию коллективных ИИ-систем. Скейлить тут: https://t.me/gonzo_ML_podcasts/3917
2 618
20
Извинити. Не знаю автора )
Извинити. Не знаю автора )
3 640