Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
显示更多📈 Telegram 频道 Machinelearning 的分析概览
频道 Machinelearning (@ai_machinelearning_big_data) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 298 105 名订阅者,在 技术与应用 类别中位列第 323,并在 俄罗斯 地区排名第 1 260 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 298 105 名订阅者。
根据 11 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -7 224,过去 24 小时变化为 -206,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 7.69%。内容发布后 24 小时内通常能获得 5.95% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 22 918 次浏览,首日通常累积 17 745 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 176。
- 主题关注点: 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
凭借高频更新(最新数据采集于 12 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
Во-первых, это классические memory-bound ядра: они постоянно гоняют тензоры K, V и промежуточные стейты туда-сюда между HBM и чипом.
Во-вторых, из-за рекуррентной природы стейта вы просто не можете нормально утилизировать GPU при маленьких батчах или использования тензорного параллелизма. Сплошной простой вычислительных блоков.В Qwen не стали лепить очередное монолитное ядро (которое на маленьких батчах и под TP все равно простаивает), а пошли на компромисс, написав библиотеку FlashQLA на базе TileLang: 🟢 Разбили прямой проход на два слитных ядра, а между ними вставили препроцессинг для автоматического контекстного параллелизма внутри одной карты. 🟠Главная фича Использовали свойство экспоненциального затухания гейта в GDN.
На 60-80% голов внимания влияние старых токенов быстро падает. Это значит, что нам не нужно считать рекуррентный стейт с самого начала последовательности.FlashQLA делает легкий прогрев на 6-8 чанках и получает практически точный стейт для текущего блока. 🟢В рамках одного потокового мультипроцессора одни варпы занимаются только перекладыванием данных, пока другие в режиме пинг-понга молотят матричные умножения на Tensor Cores и CUDA Cores, скрывая задержки. 🟡Цифры На чипах Hopper FlashQLA ускоряет forward в 2–3 раза, backward - в 2 раза относительно FLA Triton. На фоне FlashInfer отрыв ещё больше. Особенно сочный буст виден на претрейне и при инференсе агентов, где обычно гоняется один длинный промпт. 🟡Ложка дёгтя
Старое железо - мимо: ядра требуют архитектуру SM90. Если у вас парк старых Ampere - ограничиваемся чтением статьи и копим бюджеты на H200. Во-вторых, код сильно заточен под конкретную алгебру GDN, так что использовать это как замену для любого линейного внимания не получится.Но Qwen достойны любви за эту красивую инженерную работу, где оптимизации логично вытекают из математических свойств самой архитектуры. Посмотрим, как быстро этот подход растащат в другие фреймворки. 📌Лицензирование: MIT License 🟡Статья 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #FlashQLA #Kernels #Qwen
В демонстрации возможностей V2.5-Pro самостоятельно написала рабочий компилятор из SysY в RISC-V: на процесс ушло 4,3 часа и почти 700 вызовов внешних инструментов.🟠MiMo-V2.5 (1M) и MiMo-V2.5 Base (256K) Мультимодальная модель на 310 млрд общих и 15 млрд активных параметров c выделенным визуальным (729 млн) и аудиоэнкодером (261 млн), которая понимает текст, изображения, видео и звук. Обе ветки семейства используют гибридную систему внимания (скользящее окно плюс глобальное) и трехуровневый модуль MTP, который предсказывает сразу несколько токенов. 🟡Вместе с релизом Xiaomi запустила грантовую программу Orbit. с 27 апреля по 27 мая компания бесплатно распределит между разработчиками и стартапами пул в 100 триллионов токенов. После аппрува заявки полученные лимиты можно будет подключить к Cursor и Claude Code. 📌Лицензирование: MIT License 🟡Статья 🟡Набор моделей 🟡Demo @ai_machinelearning_big_data #AI #ML #LLM #MMLM #MiMO #Xiaomi
Тестирование проводилось на модели ChatGPT 5.2 Thinking. Задания передавались в виде изображений, а сочинения и развёрнутые ответы оценивали преподаватели школы Kawai Juku.На самом популярном направлении Токийского университета - медицинском, ИИ опередил лучшего из поступивших на 50 баллов и получил максимальный результат по математике. По гуманитарному блоку чат-бот набрал 452 балла из 550 (лучший показатель среди абитуриентов был 434), а по естественным наукам - 503 из 550 (против 453 у кожаных). Недобрал GPT 5.2 только внезапно по английскому языку (90%) и всемирной истории (25%). На экзаменах Киотского университета чат-бот набрал 771 балл на юридическом факультете (наивысший балл у людей - 734) и 1 176 баллов на медицинском (против 1 098 у лучшего поступившего абитуриента). LifePrompt проводит подобное тестирование 3-й год подряд. 🟠В 2024-м модель ChatGPT 4 не смогла преодолеть минимальный проходной балл Токийского университета. 🟠В 2025-м версия o1 впервые прошла этот порог. 🟢В этом году заявленные результаты впервые превысили показатели людей. Глава Японского общества искусственного интеллекта, профессор Университета Кэйо Сатоси Курихара прокомментировал результаты скептически.
"Подобно тому как калькулятор считает быстрее и точнее человека, для ИИ закономерно набирать высокие баллы", — сказал учёный, добавив, что нынешние вступительные экзамены требуют пересмотра.@ai_machinelearning_big_data #news #ai #ml
Conductor и TRINITY приняты на ICLR 2026.🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Orchestration #FUGU #SakanaAi
"В будущем возможны периоды, когда нам придётся пожертвовать частью расширения возможностей ради большей устойчивости".Публикация вышла на фоне продолжающейся в индустрии дискуссии о том, насколько безопасно ускорять разработку ИИ и кто должен принимать решения о пределах допустимого. Часть бывших сотрудников OpenAI ранее публично выражала сомнения в соответствии действий компании её декларациям; отдельные критики указывали на коммерциализацию структуры, изначально созданной как некоммерческая. Сама OpenAI пишет, что заслуживает пристального внимания и критики и обещает делать выводы и корректировать курс. @ai_machinelearning_big_data #news #ai #ml
Слова «ALWAYS» и «NEVER» советуют беречь для настоящих инвариантов: правил безопасности и обязательных полей вывода. Для остального - правила и явные ограничители, чтобы модель не зацикливалась в бесконечных лупах.Рекомендованная структура промпта открывается ролью и контекстом, дальше идут Personality, Goal, Success criteria, Constraints, Output и Stop rules. Внутри блока Personality гайд просит разделять 2 измерения: как ассистент звучит (тон, формальность, юмор) и как он работает - когда уточнять, когда делать допущения и как обходиться с неопределённостью. Поведение при поиске и цитировании OpenAI вводит понятие retrieval budgets: один широкий поиск по коротким ключевым словам, повторный - только если не хватает фактов, нужен конкретный документ или пользователь просил исчерпывающий обзор. Для презентаций и маркетинговых текстов руководство рекомендует чётко делить утверждения: где нужны источники, а где можно писать свободно. Для стриминговых интерфейсов гайд предлагает preambles — короткие пользовательские апдейты в одно-два предложения перед первым вызовом инструментов. Они не ускоряют модель, но заметно сокращают воспринимаемую задержку. Переписывать всё вручную не обязательно. OpenAI опубликовала собственный Skill для Codex и других кодинг-агентов - он применяет правила нового гайда одной командой. @ai_machinelearning_big_data #news #ai #ml
Люди в процесс не вмешивались: агенты сами размещали объявления, вели переговоры и заключали сделки на естественном языке.По итогу эксперимента было заключено 186 сделок общим объёмом чуть более $4000. Общий ассортимент составил более чем 500 товаров: от сноуборда до пакета с шариками для пинг-понга. Справедливость сделок участники оценили в среднем на 4 балла по шкале от 1 до 7, где крайние значения означали перекос в пользу одной или другой стороны. 🟡Параллельно Anthropic проводила скрытую часть исследования. Всего было запущено 4 версии рынка: одну реальную (на основе которой и должен был состояться обмен вещами) и 3 дополнительные. В двух все агенты работали на модели Opus 4.5, в двух других участники случайным образом получали менее мощную Haiku 4.5. По большинству объективных показателей Opus превосходил Haiku, однако сотрудники, представленные более слабой моделью, своего проигрыша не замечали.
В последнее время экономисты все чаще выдвигают теории о мире, в котором ИИ будет совершать многие или большинство сделок от имени людей. Авторы Project Deal допускают, что подобная агентная торговля может выйти за пределы лабораторных условий уже в обозримом будущем.@ai_machinelearning_big_data #news #ai #ml
И FT, и Anthropic отмечают опасение, что часть задач, на которых прежде учились начинающие работники, теперь делегируется ИИ более опытными сотрудниками. Воронка найма для начинающих сужается, нарабатывать базу негде.Означают ли эти данные устойчивое социальное расслоение или временную асимметрию, характерную для начала любой технологической волны, - в этом мнения аналитиков расходятся. @ai_machinelearning_big_data #news #ai #ml
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
