Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Show more📈 Analytical overview of Telegram channel Machinelearning
Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 298 105 subscribers, ranking 323 in the Technologies & Applications category and 1 260 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 298 105 subscribers.
According to the latest data from 11 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -7 224 over the last 30 days and by -206 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 7.69%. Within the first 24 hours after publication, content typically collects 5.95% reactions from the total number of subscribers.
- Post reach: On average, each post receives 22 918 views. Within the first day, a publication typically gains 17 745 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 176.
- Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Thanks to the high frequency of updates (latest data received on 12 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
Во-первых, это классические memory-bound ядра: они постоянно гоняют тензоры K, V и промежуточные стейты туда-сюда между HBM и чипом.
Во-вторых, из-за рекуррентной природы стейта вы просто не можете нормально утилизировать GPU при маленьких батчах или использования тензорного параллелизма. Сплошной простой вычислительных блоков.В Qwen не стали лепить очередное монолитное ядро (которое на маленьких батчах и под TP все равно простаивает), а пошли на компромисс, написав библиотеку FlashQLA на базе TileLang: 🟢 Разбили прямой проход на два слитных ядра, а между ними вставили препроцессинг для автоматического контекстного параллелизма внутри одной карты. 🟠Главная фича Использовали свойство экспоненциального затухания гейта в GDN.
На 60-80% голов внимания влияние старых токенов быстро падает. Это значит, что нам не нужно считать рекуррентный стейт с самого начала последовательности.FlashQLA делает легкий прогрев на 6-8 чанках и получает практически точный стейт для текущего блока. 🟢В рамках одного потокового мультипроцессора одни варпы занимаются только перекладыванием данных, пока другие в режиме пинг-понга молотят матричные умножения на Tensor Cores и CUDA Cores, скрывая задержки. 🟡Цифры На чипах Hopper FlashQLA ускоряет forward в 2–3 раза, backward - в 2 раза относительно FLA Triton. На фоне FlashInfer отрыв ещё больше. Особенно сочный буст виден на претрейне и при инференсе агентов, где обычно гоняется один длинный промпт. 🟡Ложка дёгтя
Старое железо - мимо: ядра требуют архитектуру SM90. Если у вас парк старых Ampere - ограничиваемся чтением статьи и копим бюджеты на H200. Во-вторых, код сильно заточен под конкретную алгебру GDN, так что использовать это как замену для любого линейного внимания не получится.Но Qwen достойны любви за эту красивую инженерную работу, где оптимизации логично вытекают из математических свойств самой архитектуры. Посмотрим, как быстро этот подход растащат в другие фреймворки. 📌Лицензирование: MIT License 🟡Статья 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #FlashQLA #Kernels #Qwen
В демонстрации возможностей V2.5-Pro самостоятельно написала рабочий компилятор из SysY в RISC-V: на процесс ушло 4,3 часа и почти 700 вызовов внешних инструментов.🟠MiMo-V2.5 (1M) и MiMo-V2.5 Base (256K) Мультимодальная модель на 310 млрд общих и 15 млрд активных параметров c выделенным визуальным (729 млн) и аудиоэнкодером (261 млн), которая понимает текст, изображения, видео и звук. Обе ветки семейства используют гибридную систему внимания (скользящее окно плюс глобальное) и трехуровневый модуль MTP, который предсказывает сразу несколько токенов. 🟡Вместе с релизом Xiaomi запустила грантовую программу Orbit. с 27 апреля по 27 мая компания бесплатно распределит между разработчиками и стартапами пул в 100 триллионов токенов. После аппрува заявки полученные лимиты можно будет подключить к Cursor и Claude Code. 📌Лицензирование: MIT License 🟡Статья 🟡Набор моделей 🟡Demo @ai_machinelearning_big_data #AI #ML #LLM #MMLM #MiMO #Xiaomi
Тестирование проводилось на модели ChatGPT 5.2 Thinking. Задания передавались в виде изображений, а сочинения и развёрнутые ответы оценивали преподаватели школы Kawai Juku.На самом популярном направлении Токийского университета - медицинском, ИИ опередил лучшего из поступивших на 50 баллов и получил максимальный результат по математике. По гуманитарному блоку чат-бот набрал 452 балла из 550 (лучший показатель среди абитуриентов был 434), а по естественным наукам - 503 из 550 (против 453 у кожаных). Недобрал GPT 5.2 только внезапно по английскому языку (90%) и всемирной истории (25%). На экзаменах Киотского университета чат-бот набрал 771 балл на юридическом факультете (наивысший балл у людей - 734) и 1 176 баллов на медицинском (против 1 098 у лучшего поступившего абитуриента). LifePrompt проводит подобное тестирование 3-й год подряд. 🟠В 2024-м модель ChatGPT 4 не смогла преодолеть минимальный проходной балл Токийского университета. 🟠В 2025-м версия o1 впервые прошла этот порог. 🟢В этом году заявленные результаты впервые превысили показатели людей. Глава Японского общества искусственного интеллекта, профессор Университета Кэйо Сатоси Курихара прокомментировал результаты скептически.
"Подобно тому как калькулятор считает быстрее и точнее человека, для ИИ закономерно набирать высокие баллы", — сказал учёный, добавив, что нынешние вступительные экзамены требуют пересмотра.@ai_machinelearning_big_data #news #ai #ml
Conductor и TRINITY приняты на ICLR 2026.🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Orchestration #FUGU #SakanaAi
"В будущем возможны периоды, когда нам придётся пожертвовать частью расширения возможностей ради большей устойчивости".Публикация вышла на фоне продолжающейся в индустрии дискуссии о том, насколько безопасно ускорять разработку ИИ и кто должен принимать решения о пределах допустимого. Часть бывших сотрудников OpenAI ранее публично выражала сомнения в соответствии действий компании её декларациям; отдельные критики указывали на коммерциализацию структуры, изначально созданной как некоммерческая. Сама OpenAI пишет, что заслуживает пристального внимания и критики и обещает делать выводы и корректировать курс. @ai_machinelearning_big_data #news #ai #ml
Слова «ALWAYS» и «NEVER» советуют беречь для настоящих инвариантов: правил безопасности и обязательных полей вывода. Для остального - правила и явные ограничители, чтобы модель не зацикливалась в бесконечных лупах.Рекомендованная структура промпта открывается ролью и контекстом, дальше идут Personality, Goal, Success criteria, Constraints, Output и Stop rules. Внутри блока Personality гайд просит разделять 2 измерения: как ассистент звучит (тон, формальность, юмор) и как он работает - когда уточнять, когда делать допущения и как обходиться с неопределённостью. Поведение при поиске и цитировании OpenAI вводит понятие retrieval budgets: один широкий поиск по коротким ключевым словам, повторный - только если не хватает фактов, нужен конкретный документ или пользователь просил исчерпывающий обзор. Для презентаций и маркетинговых текстов руководство рекомендует чётко делить утверждения: где нужны источники, а где можно писать свободно. Для стриминговых интерфейсов гайд предлагает preambles — короткие пользовательские апдейты в одно-два предложения перед первым вызовом инструментов. Они не ускоряют модель, но заметно сокращают воспринимаемую задержку. Переписывать всё вручную не обязательно. OpenAI опубликовала собственный Skill для Codex и других кодинг-агентов - он применяет правила нового гайда одной командой. @ai_machinelearning_big_data #news #ai #ml
Люди в процесс не вмешивались: агенты сами размещали объявления, вели переговоры и заключали сделки на естественном языке.По итогу эксперимента было заключено 186 сделок общим объёмом чуть более $4000. Общий ассортимент составил более чем 500 товаров: от сноуборда до пакета с шариками для пинг-понга. Справедливость сделок участники оценили в среднем на 4 балла по шкале от 1 до 7, где крайние значения означали перекос в пользу одной или другой стороны. 🟡Параллельно Anthropic проводила скрытую часть исследования. Всего было запущено 4 версии рынка: одну реальную (на основе которой и должен был состояться обмен вещами) и 3 дополнительные. В двух все агенты работали на модели Opus 4.5, в двух других участники случайным образом получали менее мощную Haiku 4.5. По большинству объективных показателей Opus превосходил Haiku, однако сотрудники, представленные более слабой моделью, своего проигрыша не замечали.
В последнее время экономисты все чаще выдвигают теории о мире, в котором ИИ будет совершать многие или большинство сделок от имени людей. Авторы Project Deal допускают, что подобная агентная торговля может выйти за пределы лабораторных условий уже в обозримом будущем.@ai_machinelearning_big_data #news #ai #ml
И FT, и Anthropic отмечают опасение, что часть задач, на которых прежде учились начинающие работники, теперь делегируется ИИ более опытными сотрудниками. Воронка найма для начинающих сужается, нарабатывать базу негде.Означают ли эти данные устойчивое социальное расслоение или временную асимметрию, характерную для начала любой технологической волны, - в этом мнения аналитиков расходятся. @ai_machinelearning_big_data #news #ai #ml
Available now! Telegram Research 2025 — the year's key insights 
