Machinelearning

Kanalga Telegram’da o‘tish

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya1 301 Texnologiyalar & Aralashmalar327...

📈 Telegram kanali Machinelearning analitikasi

Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 290 857 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 327-o'rinni va Rossiya mintaqasida 1 301-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 290 857 obunachiga ega bo‘ldi.

17 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 055 ga, so‘nggi 24 soatda esa -182 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 7.53% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.57% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 21 915 marta ko‘riladi; birinchi sutkada odatda 16 215 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 162 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 18 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

290 857

Obunachilar

-18224 soatlar

-1 3377 kunlar

-6 05530 kunlar

21 915

Post ko'rishlar

~ 16 21524 soatlar

~ 18 17748 soatlar

7.53%

Muloqot nisbati

~ 6

Kuniga postlar

Ads index

beta

Postlar arxiv

290 857

✔️ OpenAI предлагает бизнесу отказаться от подсчета токенов в пользу новой метрики Финдиректор Сара Фрайар предложила новый метод для оценки ROI от внедрения ИИ. Вместо цены за тысячу токенов бизнесу предлагают ориентироваться на метрику "полезный интеллект на доллар". Подход опирается на объем полезной работы, стоимость успешно закрытой задачи, надежность результата и рост отдачи при масштабировании. В OpenAI уверены, что дешевые токены создают иллюзию экономии. Более дорогие модели на практике могут обходиться дешевле, поскольку выдают рабочий результат с первой попытки и исключают долгий цикл исправлений. openai.com ✔️ Китай создал Всемирную организацию по сотрудничеству в сфере ИИ В Шанхае подписали соглашение о создании организации, в которую вошли 29 стран. Инициативу Китая поддержали Россия, Беларусь, Бразилия, Сербия и государства Африки и Азии. Задача альянса - сформировать международные стандарты управления искусственным интеллектом. Таким образом, конкуренция в ИИ выходит за пределы технологий и смещается в сторону взаимодействия государств. Китай планирует снизить порог входа в отрасль для стран Глобального Юга. Для этого участникам альянса предоставят доступ к открытым китайским моделям, а также запустят программы технической подготовки локальных ML-инженеров и разработчиков. reuters.com ✔️ Винт Серф разработает открытый стандарт идентификации агентов на базе DNS Один из создателей базовых протоколов интернета Винт Серф ушел из Google после 20 лет работы, чтобы присоединиться к Innovation Labs. В статусе советника он займется проектированием открытого стандарта DNSid для авторизации и аудита ИИ-агентов. DNSid привяжет цифровую личность агента к существующей инфраструктуре доменных имен. История регистраций и авторизация каждого бота будут фиксироваться с помощью криптографических доказательств. Единый механизм верификации разрабатывают для перехода индустрии от изолированных систем к агентам, взаимодействующим друг с другом в глобальной сети. Стандарт позволит инфраструктуре определять, какой именно бот делает запрос и кто несет ответственность за его действия. techcrunch.com ✔️ Decart AI обновил модель Lucy до версии 2.5 Спустя полгода стартап представил обновление модели редактирования FullHD-видео в реальном времени. Новинка всё так же работает при 30 fps и позволяет на лету менять персонажей, окружение и эффекты через текстовые промпты или референсные изображения. Lucy 2.5 получила механизм Self-Anchoring. В начале сессии она делает слепок генерации и использует его как базовый ориентир для фиксации изменений, в результате чего объекты сохраняют заданный облик и учитывают динамику сцены, даже когда выходят за пределы кадра и возвращаются обратно. Также снизилась задержка инференса за счет перевода вычислений в форматы квантования MXFP8 и NVFP4, что дало четырехкратный прирост скорости генерации. Сам инференс был оптимизирован алгоритмом sparse attention и за счёт kernel fusion, который снижает расходы на запуск процессов и разгружает память. decart.ai ✔️ Сотрудники Baidu получают по $150 на тестирование сторонних ИИ-решений Китайский техгигант ежемесячно выделяет сотрудникам 1000 юаней (~$150) на подписки к любым LLM-продуктам на рынке. Вице-президент Шэнь Доу пояснил, что инициатива не привязана к KPI - компания рассчитывает на естественное формирование привычки у инженеров, а принудительное внедрение считает неэффективным. По прогнозам Baidu, к концу 2026 года до 90% рабочих задач будут выполняться с участием ИИ. Следующие 3 года компания называет "золотым окном" до окончательной фиксации иерархии на технологическом рынке. В рамках стратегии компания выстраивает полный цикл от собственных процессоров Kunlun до LLM и переходит на новую метрику DAA для оценки реальной пользы ИИ-агентов. Доля ИИ-направления в выручке компании в этом году достигла 52%. huxiu.com @ai_machinelearning_big_data #news #ai #ml

290 857

📌 Физики создали память на механических колебаниях для квантового компьютера Группа из Швейцарской высшей технической школы Цюриха экспериментально продемонстрировала квантовые вычисления, в которых рабочая память построена на механических колебаниях, а не на электромагнитных состояниях. Архитектура скопирована с классического компьютера, где процессор и оперативная память разделены. Роль процессора играет сверхпроводящий кубит, а роль памяти - крошечные механические резонаторы внутри квантового чипа, элементы, отдалённо похоже на гитарные струны, которые при записи информации начинают колебаться на частотах за пределами слышимого. Для вычисления кубит обращается к колебанию в памяти, обрабатывает и изменяет его состояние, а затем записывает обратно. Такое разделение вычислений и хранения отличает подход от многих существующих квантовых схем, где обработка и память тесно переплетены. 🟡Ставка на механику объясняется двумя ограничениями Сегодня квантовую память чаще всего делают электромагнитной в связке со сверхпроводящими кубитами - обе технологии хорошо изучены и позволяют считывать и менять квантовые состояния с высокой точностью. Но такие элементы относительно громоздки, что мешает превращать лабораторные установки в практические машины. Механические резонаторы заметно компактнее, а главное - ёмче (как струна может звучать разными тонами, резонатор поддерживает множество мод колебаний, и каждая мода работает как отдельная ячейка памяти). Вдобавок, по данным группы, механические состояния дольше остаются стабильными - информация не затухает так быстро, как в электромагнитных аналогах. 🟡Работоспособность проверили на реальных задачах Первая - квантовое преобразование Фурье, базовая процедура, на которую опираются многие квантовые алгоритмы, включая знаменитый алгоритм Шора для разложения чисел на множители. Вторая - поиск периода функции, продемонстрировавший применение этой процедуры на практике. Обе задачи требуют одновременно и точно управлять множеством квантовых состояний, хранить их и связывать между собой, не разрушая их хрупкую природу. Авторы говорят, что их схема в принципе способна выполнять все базовые операции, необходимые для произвольного квантового вычисления, то есть годится как основа универсального программируемого квантового компьютера. 🔜 Почитать полную статью можно в в журнале Science @ai_machinelearning_big_data #news #ai #ml

290 857

📌 Как дотянуть компактную модель до уровня гигантов посттрейном AI-подразделение китайского производителя электромобилей Lixiang опубликовало интересную работу о том, как они оптимизацией насыщали компактную модель доменными знаниями.

Mach-Mind-4-Flash - итоговая MoE-модель на 35 млрд общих 3 млрд активных параметров на базе Qwen3.5-35B-A3B.

Проблема, от которой Li Auto отталкивались, состоит в том, что если учить одну модель с подкреплением сразу на смеси наград (математика, код, агентные задачи), то появляются качели - подтянули одно, просело другое. Решение - разделить этапы и области знаний. Сначала независимо обучили более десятка RL-экспертов, каждого в своём домене: математика, код, текст, безопасность, поиск, работа с инструментами. Каждый эксперт получил свои данные, свои проверяемые награды и свою стратегию обучения. Дальше самое интересное - как собрать экспертов обратно в одну модель. Для этого использовали методику MOPD, которую взяли у Xiaomi.

Это мультиучительская дистилляция на собственных генерациях ученика, где каждый обучающий пример по ключу маршрутизации уходит к "своему" замороженному эксперту, и тот через reverse-KL на уровне токенов подтягивает распределение ученика к своему.

Агентные навыки эксперты осваивали в исполняемых песочницах - там модель читает файлы, правит код, запускает тесты, видит ошибки и продолжает с их учётом. Масштаб сред - более 190 предметных областей с сохранением состояния, свыше 3,5 тыс. интерфейсов инструментов, траектории программных задач до 300 шагов при контексте 256 тыс. токенов. 🟡Работает ли слияние? И да и нет. Следование инструкциям сохранилось целиком, а на агентных бенчах ClawBench и ClawEval итоговая модель даже обошла отдельных экспертов. Но на SWE-bench Verified результат просел с 73,80 у эксперта до 71,10 у модели.

Предполагают, что узкоспециализированное поведение в длинных задачах кодинга при дистилляции смазывается.

Финальный штрих - HMPO, собственная механика Li Auto, которая следит, чтобы модель не увлекалась в цепочках рассуждений.

Бюджет длины CoT берётся из медианы правильных ответов в группе, награду получают только верные и при этом более короткие решения, а награда собирается умножением (короткий, но неверный ответ получает строгий 0, что закрывает лазейку для взлома награды).

На выходе HMPO получается сокращение длины генерации на 19–46% при потере точности не более 0,7%, причём обучение шло только на математике, а эффект перенёсся на код и другие задачи. Правда пока это работает только для одношаговых рассуждений, к многоходовым агентным траекториям его ещё предстоит адаптировать. 🟡Итоги 92,7 на AIME'26 - тут отстает от триллионной Kimi-K2.5 меньше чем на пункт; 82,8 на IFBench - первое место с большим отрывом, ближайший конкурент Qwen3.5-122B; 75,8 на BFCL-v4 - второе место после MiMo-V2-Flash, при этом лучше чем Qwen3.5-122B и Kimi-K2.5. Можно сказать, что результаты на уровне куда более крупных моделей. К сожалению, планы по публикации модели неизвестны, но возможно мы просто почувствуем её в следующих поколениях электромобилей Lixiang. 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Optimisation #RL #LiAuto

290 857

🎓 Хотите в ШАД, но не знаете, с чего начать? На курсе ShadHelper мы помогаем выстравивать подготовку по понятному плану: закрывать необходимые темы по математике и алгоритмам, разбирать задачи вступительных и получать обратную связь преподавателей. Новый поток курса «Подготовка к ШАД» уже начался, но сейчас идёт вводная часть. Поэтому до 19 июля включительно ещё можно присоединиться к группе без сильного отставания. На время добора мы открыли бесплатный тестовый доступ к материалам и занятиям текущего потока. Вы сможете посмотреть: - как выстроена программа подготовки; - какие темы и задачи разбирают на курсе; - как преподаватели дают обратную связь; - подходит ли вам темп и формат обучения. Если формат вам подойдёт, сможете присоединиться к текущей группе и продолжить обучение. 👉 Посмотреть курс изнутри Реклама ООО "ШВМ", ИНН: 5638076560 Erid: 2VtzqxUcqML

290 857

🌟 ReactBench: инструмент оценки агентов при работе с кодом на React Команда Million, известная инструментами React Doctor, React Scan и Million.js, представила тест для агентов, пишущих код на React. Актуальность ReactBench зеркальна реальному положению дел - около 70% сайтов на JavaScript используют React, а мелкие ошибки в сгенерированном коде тиражируются в огромных масштабах.

Например, сбой Cloudflare в сентябре 2025 года - панель управления и API компании легли из-за одной неверной зависимости в useEffect, которую не поймали ни ревью, ни тесты.

Философия проекта в том, что общие кодинг-бенчмарки проверяют лишь поведение по принципу "тесты прошли - задача засчитана". В ReactBench каждое решение должно ещё и пройти проверку React Doctor, анализатора с более чем 400 правилами, который ищет в коде лишние перерисовки, сломанные эффекты, проблемы с доступностью и сопровождаемостью. 🟡Набор состоит из задач двух типов Write React - реализовать настоящую функцию. Задания этого типа собраны из принятых PR в открытых репозиториях. Агент получает кодовую базу и описание задачи, а скрытые тесты и эталонное решение видит только проверяющая система. Fix React - найти и исправить все баги в существующем компоненте, обнаруженные React Doctor, не создавая при этом новых проблем. Причём агента еще и лишают доступа к линтерам. 🟡Результаты прогонов Само собой, созданием бенча не ограничились и запустили его на топовых моделях. Тут важен небольшой дисклеймер: Бенчмарк сравнивает не модели в чистом виде, а связки модель+агентская оболочка (Codex CLI, Claude Code и другие), и оболочка влияет на итог. По итогам лидируют с минимальным отрывом GPT-5.6 Sol (43,1%) и Fable 5 (41,2%), но важнее разница в цене - прогон Fable 5 обходится в среднем в 5,8 раза дороже, чем Sol. Оптимальным по соотношению стоимость-качество авторы называют GPT-5.6 Terra на средних настройках. Замыкают таблицу GLM 5.2, Sonnet 5, GPT-5.6 Luna и Kimi K2.7 Code. Набор полностью открыт на Github. @ai_machinelearning_big_data #AI #ML #Agents #Benchmark #ReactBench #Million

290 857

✔️ Anthropic переработала команду code-review в Claude Code Команда получила уровни Low, Medium, High, X-high и Ultra.

И это не один и тот же промпт с разным временем на ризонинг - на каждом уровне процесс построен по-своему.

Уровень подхватывается из настроек сессии автоматически, но его можно задать руками командой /code-review high. 🟢Low делает один быстрый проход по диффу. 🟢Medium читает изменённый код в контексте проекта, прогоняет несколько поисковых проходов под разными углами и перепроверяет находки перед выдачей. 🟢High выносит поиск и верификацию в субагентов с чистым контекстом, чтобы проверяющие не были заякорены на рассуждениях агента, который этот код только что писал. 🟢X-high дополнительно ищет, как изменения влияют на код за пределами самого диффа. 🟠Ultra - верхняя ступень, где ревью выполняется в облачной песочнице, куда Claude Code выгружает состояние репозитория или клонирует PR с GitHub. Там запускается целый парк агентов, и каждая находка независимо воспроизводится и верифицируется. Ultra находится в статусе research preview и оплачивается отдельно от подписки - Pro и Max подписчикам дают 3 бесплатных запуска, дальше каждый прогон списывается из кредитов на дополнительное использование стоит примерно от 5 до 20 долларов в зависимости от размера изменений. Качество новой системы подкрепляют замерами Opus 4.8 на открытом датасете с ручной разметкой ошибок. Уровень Low нашёл 17% размеченных багов, Medium - 22%, High - 24%, X-high - 25%. У "конкурента" (компания его не называет) - те же уровни дали от 8 до 12%.

Anthropic утверждает, что использует Ultra-режим на каждом пулл-реквесте в собственной разработке.

@ai_machinelearning_big_data #news #ai #ml

290 857

MWS Cloud первой в России развернула GLM 5.2 в собственном облаке MWS Cloud расширила каталог сервиса MWS GPT Model Hub до 17 больших языковых моделей. Главным обновлением стала GLM 5.2 — опенсорс-модель от Z.AI, которую компания первой в России развернула на собственной облачной инфраструктуре. Модель ориентирована на сценарии, где важны качество рассуждений, глубокий анализ текстов и обработка многошаговых запросов. Теперь все запросы к GLM 5.2 обрабатываются на серверах MWS Cloud внутри страны. Это означает, что данные и вычисления не покидают юрисдикцию РФ и не зависят от зарубежных провайдеров. Помимо GLM 5.2, в каталоге появились Kimi K2.6 от Moonshot AI. Модель подходит для обработки сложных пользовательских запросов, анализа документов, генерации развёрнутых ответов и построения AI-ассистентов. Кроме того, в MWS GPT Model Hub появились Qwen3.6, Gemma 4, GPT OSS и другие модели. Сервис получил поддержку распознавания и синтеза речи, а также реранкеров, которые улучшают качество поиска и RAG-сценариев. Все 17 моделей доступны через единый OpenAI-совместимый API, что позволяет разработчикам быстрее тестировать и внедрять AI-функции в свои продукты без развёртывания собственной инфраструктуры. @ai_machinelearning_big_data #news

290 857

✔️ Линус Торвальдс поддержал использование ИИ в разработке ядра Отец Linux отклонил инициативу запретить ИИ-инструменты в разработке ядра, предложив недовольным сделать форк или покинуть проект. По его словам, сообществу нужно адаптировать LLM для помощи мейнтейнерам, минимизировав генерацию некорректных патчей и баг-репортов. Текущие правила допускают добавление сгенерированного кода при наличии тега Assisted-by. Поскольку модель не может подписать сертификат происхождения, ответственность за качество, код-ревью и юридические риски полностью несет человек, отправивший коммит. Торвальдс отметил, что философия Open Source нацелена на создание технологий, а не на соблюдение идеологий. Команда продолжит принимать патчи исключительно на основе их технической ценности, не ограничивая участников в выборе инструментов разработки. kernel.org ✔️ Google провела ребрендинг NotebookLM Компания переименовала NotebookLM в Gemini Notebook и добавила возможность выполнение кода. Каждый блокнот получил изолированную облачную среду для написания и запуска скриптов. Это позволяет анализировать данные напрямую из загруженных источников без экспорта во внешние инструменты. Сервис остается самостоятельным, но стал глубже интегрирован в экосистему компании. Блокноты создаются и синхронизируются внутри приложения Gemini, а позже появятся в ИИ-выдаче Google Search. Сейчас запуск кода открыт для подписчиков Google AI Ultra и корпоративных клиентов Workspace. В течение нескольких недель доступ развернут для пользователей тарифа Pro. blog.google ✔️ Sakana Fugu получила поддержку моделей семейства Nemotron Токийский стартап добавил открытые модели NVIDIA в свою модульную платформу оркестрации агентов Fugu, которая динамически выбирает, координирует и объединяет легковесные специализированные модели для многоэтапных задач. Модели Nemotron добавили в пул агентов платформы функции генерации кода, вызова внешних инструментов и следования инструкциям. Инженерные команды Sakana AI и NVIDIA займутся совместной оптимизацией производительности модульных ИИ-архитектур. Для NVIDIA партнерство дает среду тестирования открытых решений в мультиагентных сценариях. sakana.ai ✔️ Claude теперь может авторизовываться на сайтах через 1Password Менеджер паролей интегрировал Claude для выполнения браузерных задач с авторизацией. Учетные данные и одноразовые коды не передаются на серверы Anthropic и не попадают в контекст модели. 1Password подставляет их напрямую на целевую страницу через Agentic Mode. Claude запрашивает логин под конкретную задачу, после чего пользователь подтверждает действие и разрешение выдается на одну сессию. Поддерживается выдача доступов к нескольким сайтам для сложных задач. При перехвате управления расширение 1Password блокирует основное хранилище, оставляя доступ только к одобренным записям. Если после автозаполнения отправка формы не удалась, введенные значения стираются. Интеграция доступна на Mac при наличии десктопных приложений и расширений. В будущих апдейтах планируется добавить поддержку платежных карт. 1password.com ✔️ Бигтех увеличивает расходы на личную безопасность топ-менеджмента Волна общественного недовольства развитием ИИ переросла в реальные риски для IT-сектора. По данным аналитиков Liferaft, количество угроз в адрес дата-центров и руководителей ИИ-компаний выросло в 7 раз. Это напрямую отразилось на корпоративных бюджетах - в 2025 году уже 38% компаний из индекса S&P 500 отчитались о расходах на охрану руководства (против 27% в 2021 году). За год траты Palantir по этой статье взлетели на 150%, у Oracle - на 86%, а бюджет Salesforce на защиту топов увеличился до 4 миллионов долларов. Охранные агентства Кремниевой долины фиксируют резкий спрос на вооруженных, но максимально неприметных телохранителей. Менеджмент ИИ-корпораций также настоятельно не рекомендует рядовым сотрудникам носить одежду с логотипами компаний за пределами кампусов. wsj.com @ai_machinelearning_big_data #news #ai #ml

290 857

Kimi K3 только что появилась в Kimi Code CLI В документации Kimi Code уже есть новая модель Kimi K3 - её называют самым сильным flagship-моделем Kimi на сегодня. Упор: кодинг, игры/3D и knowledge-задачи. Что интересно по спекам: * model ID: k3 * контекст: до 1M токенов * reasoning сейчас только на max * low и high обещают добавить позже * на Moderato доступно до 256K * до 1M открывается на Allegretto и выше Переключиться можно прямо в Kimi Code CLI через команду /model. Для VS Code — через dropdown в поле ввода. Нюанс для сторонних coding agents: если хотите полный контекст K3, вручную ставьте context window 1048576, потому что часть инструментов по умолчанию режет окно меньше максимума. kimi.com/code/docs/en/kimi-code/models

290 857

✔️ Виртуальные партнёры превратились в заметный рынок По данным аналитической компании Appfigures, которые приводит издание Decrypt, с момента запуска ChatGPT в конце 2022 года приложения с виртуальными NSFW-партнёрами скачали 165 млн раз в App Store и Google Play, а пользователи потратили в них 427 млн долларов.

Речь о валовых расходах до вычета комиссии платформ, которая обычно составляет 30%. Веб-платформы, работающие без приложений, в подсчёт не попали, так что реальный объём рынка, вероятно, выше заявленного.

Темп не спадает - только за первую половину 2026 года 214 таких приложений, по подсчётам Appfigures, принесли 162 млн долларов. Лидеры по выручке: 🟢Zeta (33 млн); 🟠Tipsy Chat (15,2 млн); 🟠ChatBox (13 млн); 🟠Crushie AI (8,8 млн); 🟠Emochi (7,5 млн). По загрузкам картина другая - чаще всего ставили Emochi (7,9 млн загрузок), за ним Amora, Zeta, BIMOBIMO и MiraiMind. Любопытная деталь в сравнении с нейтральными ИИ-компаньонами - их скачивают почти вдвое чаще, но денег они приносят примерно столько же - 164,8 млн долларов за те же полгода.

Проще говоря, потребители взрослых сервисов платят заметно охотнее.

Спрос на виртуальных ИИ-партнёров растёт на фоне того, что люди всё чаще обращаются к чат-ботам за общением и эмоциональной близостью. Исследование Университета Бригама Янга и Института семьи, опубликованное в мае 2026 года, показало, что 15% американцев в возрасте от 18 до 30 лет, состоящих в отношениях, регулярно общаются с ИИ-партнёром. При этом 69% таких пользователей признались, что скрывают это увлечение от своих реальных спутников. @ai_machinelearning_big_data #news #ai #ml

290 857

Repost from ТЕХНО: Яндекс про технологии

Нейросети дешевеют, агенты развиваются В Сеуле состоялась одна из главных мировых конференций по машинному обучению International Conference on Machine Learning (ICML). Команда Яндекса представила на ней восемь статей и получила награду за лучшую статью на воркшопе Graph Foundation Models: A New Era for Graph Machine Learning. А мы попросили Сергея Юдина, руководителя отдела разработки ИИ-сервисов, рассказать, что ждать от ИИ в ближайшем будущем.

Тренд № 1. Теория становится практикой В сфере ИИ стирается граница между теоретическими исследованиями и практикой. Учёные исследуют то, что создают разработчики, а премии получают открытия и технологии, которые завтра будут доступны всем. Две работы получили ICML 2026 Outstanding Paper Award. Обе связаны с диффузионными моделями, а одна из них — с dLLM. Диффузионные языковые модели могут параллельно генерировать несколько токенов на одном шаге и в отдельных сценариях заметно сокращать время генерации.

Тренд № 2. Агенты и харнесс Агентские системы быстро развиваются и уже используются в отдельных промышленных сценариях. При этом надёжность, оценка качества и безопасная автономная работа остаются открытыми инженерными проблемами. А харнесс — всё, что окружает языковую модель в агентской системе, — стал предметом серьёзного изучения. Разработчики анализируют: 🔵 память агентов — эпизодическую и процедурную, обучение на собственном опыте, обучение с подкреплением (reinforcement learning, RL) поверх памяти 🔵 рабочие процессы: как научить агента делать параллельно несколько задач, как эффективно распределять агентские запросы по серверам 🔵 безопасность: агент, читающий чужие документы, уязвим к промпт-инъекциям. Организаторы ICML встроили в PDF статей инъекции, чтобы выявить рецензентов, нарушавших определённый запрет на использование LLM из правил. Было обнаружено 795 таких рецензий от 506 рецензентов. У 398 из них были собственные активные заявки на конференцию. В результате ICML отклонила 497 связанных с ними статей.

Тренд № 3. Дешёвое обучение RL-дообучение LLM становится доступнее: открытые инструменты и более экономные методы снижают требования к инфраструктуре. Премию ICML 2026 Test of Time получила работа 2016 года Asynchronous Methods for Deep Reinforcement Learning. Идея параллельных actor-learners стала одним из важных предшественников современной инфраструктуры RL-посттрейна LLM. В одной из новых работ авторы экспериментально показали, что классический оптимизатор SGD в исследованных сценариях RLVR работает не хуже AdamW и требует меньше памяти. Для Qwen3-1.7B пиковое потребление GPU-памяти снизилось на 15,7 ГБ. Такие оптимизации снижают порог для локального посттрейна LLM.

Подписывайтесь 👉 @techno_yandex

290 857

✔️ Первым устройством OpenAI станет умная колонка OpenAI готовит к выпуску свой первый гаджет - переносную умную колонку без экрана, задуманную как "домашний компьютер эпохи ИИ".

Об этом сообщает Bloomberg со ссылкой на источники, знакомые с проектом. Устройство ещё в разработке, официально о нём не объявляли, а представитель OpenAI отказался от комментариев.

По словам собеседников агентства, колонка будет управлять умным домом, включать музыку и видео, отвечать на вопросы и сообщения через возможности ChatGPT. Главная ставка, как утверждают источники, на человечность - устройство должно со временем всё лучше понимать владельца, предугадывать его запросы и само предлагать нужную информацию. Для этого колонка будет использовать личные данные пользователя, в том числе электронную почту. В корпус устройства будут встроены камера, датчики и подвижные механические элементы - по замыслу разработчиков, они создают ощущение, что перед вами живое существо, а не предмет. Голосовое общение построят на GPT-Live - обновлённом голосовом режиме ChatGPT, который OpenAI представила в этом месяце. Он умеет слушать и говорить одновременно и подстраиваться под ход разговора. 🟡Это направление обходится компании дорого В прошлом году OpenAI заплатила 6,5 миллиарда долларов за стартап io Products, сооснователем которого был Джони Айв - бывший глава дизайна Apple. Над устройством работает его студия LoveFrom и десятки бывших инженеров и дизайнеров Apple, причастных к созданию iPhone и Mac. Всего, по данным Bloomberg, аппаратное подразделение OpenAI разрабатывает около 5 продуктов, но колонка должна выйти первой. Показать устройство рассчитывают до конца этого года, а продажи начать в 2027-м. Эти сроки уже под вопросом - Apple добивается в суде запрета на выпуск устройств OpenAI, и источники Bloomberg признают, что планы могут сдвинуться из-за судебного разбирательства. В дальнейших планах компании, по тем же данным, устройство, способное заменить смартфон, носимые гаджеты и домашняя робототехника. @ai_machinelearning_big_data #news #ai #ml

290 857

✔️ OpenAI создала модель для поиска уязвимостей в своих LLM Внутренняя разработка под названием GPT-Red автоматизирует редтиминг собственной продукции компании. Инструмент симулирует промпт-инъекции и скрытые атаки через письма, файлы и веб-страницы. Система обучалась с помощью RL и self-play - непрерывное соревнование атакующей и защитной моделей довело успешность поиска уязвимостей до 84% в тестовых сценариях (против 13% у людей-специалистов). По словам OpenAI, благодаря GPT-Red уязвимость GPT-5.6 Sol к прямым промпт-инъекциям снизилась в 6 раз по сравнению с моделями четырехмесячной давности, но около 3,8% сложных атак по-прежнему достигают цели (сопоставимо с показателями Claude Opus 4.5). Инструмент остается внутренним, OpenAI планирует выпустить статью с описанием архитектуры и процесса обучения в ближайшее время. openai.com ✔️ SpaceXAI открыла исходный код Grok Build В репозиторий вошли цикл управления агентом, механизмы сборки контекста, парсинг ответов модели, консольный интерфейс с просмотром diff-изменений и инструменты выполнения команд. Код демонстрирует механизмы интеграции фреймворка с серверами MCP, субагентами и кастомными плагинами. Grok Build поддерживает локальное развертывание и позволяет перенаправить запросы на любые локальные LLM, полностью исключив передачу данных на сторонние серверы. x.ai ✔️ Apple Intelligence официально выходит на китайский рынок Сервис будет работать в Китае на базе локальных ИИ-моделей после получения официального одобрения от профильного ведомства КНР. Из-за жестких региональных требований к регистрации генеративных сервисов компания отказалась от адаптации собственных алгоритмов. Базовой LLM для китайских версий iOS и macOS выбрана Qwen от Alibaba. Модель будет отвечать за анализ контекста, генерацию текста и изображений. Параллельно Apple сотрудничает с Baidu для разработки дополнительных функций под региональный рынок. На ранних этапах компания также рассматривала решения от DeepSeek и ByteDance, но выбрала Alibaba и Baidu. reuters.com ✔️ Spotify запустил бету диалогового ИИ-ассистента Музыкальный сервис добавил ассистента на основе ИИ в управление воспроизведением через текстовые и голосовые команды. Функция запущена в режиме беты для Premium-пользователей старше 18 лет в США, Ирландии и Швеции. Модель обрабатывает контекстные запросы, а в интерфейсе плеера можно запрашивать информацию об артистах, песнях и подкастах, узнавать историю собственных прослушиваний и задавать вопросы на общую эрудицию. Запуск ассистента дополняет предыдущие ИИ-функции платформы - генерацию плейлистов по промптам и интеграцию технологий ElevenLabs для озвучки аудиокниг. spotify.com ✔️ На Meta* подали в суд за использование алгоритмов при сокращении персонала Бывшие сотрудники подали иск в федеральный суд Калифорнии, обвинив компанию в использовании ИИ в ходе майского сокращения 8000 человек. По версии истцов, внутренние системы генерировали списки на увольнение с системной предвзятостью. Под сокращение непропорционально часто попадали сотрудники с инвалидностью, а также находящиеся в медицинском или декретном отпуске. В иске указано, что алгоритм формировал списки на основе оценок эффективности, объемов выполненной работы и метрик использования корпоративных ИИ-инструментов. Meta отвергает обвинения и настаивает, что финальные кадровые решения принимают люди. Сейчас истцы добиваются судебного запрета, чтобы сохранить рабочие места до окончания разбирательства. wsj.com

*организация признана экстремистской, её деятельность на территории РФ запрещена.

@ai_machinelearning_big_data #news #ai #ml

290 857

Repost from Machine learning Interview

Thinking Machines Lab выкатила Inkling - свою первую open-weights модель. И это сразу тяжёлый релиз: * 975B total params * 41B active * 1M context * обучение на 45T токенов * текст, изображения, аудио и видео * рядом идёт preview Inkling-Small с 12B active Они прямо пишут, что Inkling не лидер среди всех open и closed моделей. Ставка другая: дать сильную multimodal базу, которую можно дообучать под свои задачи. Самая интересная часть - связка с Tinker. Inkling можно fine-tune’ить прямо на платформе Thinking Machines. В демо модель даже сама написала себе fine-tuning job, обучилась избегать буквы “e” в ответах, прогнала eval и переключилась на новые веса. То есть они показывают полный контур кастомизации: модель → задача → данные → fine-tune → eval → новые веса. Похоже, Thinking Machines строит фабрику моделей под конкретные продукты. https://thinkingmachines.ai/news/introducing-inkling/

290 857

✔️ DeepSeek готовится к IPO Китайский стартап начал процесс подготовки к первичному размещению акций. Подачу заявки ИИ-разработчик планирует на конец этого или начало следующего года, чтобы официально стать публичной компанией в 2027 году. Одновременно с этим DeepSeek ищет инвесторов для нового раунда финансирования. Ожидается, что оценка компании составит около $71 млрд, это заметный скачок по сравнению с оценкой в $50 млрд, зафиксированной во время предыдущего раунда в начале июня. Летом стартап впервые привлек внешнее финансирование, получив $700 млн. На этот раз цель DeepSeek - собрать не менее $1,4 млрд. Стремительный рост капитализации уже сделал основателя проекта Ляна Вэньфэна одним из богатейших людей в глобальной ИИ-индустрии - его личное состояние сейчас оценивается в $36 млрд. @ai_machinelearning_big_data #news #ai #ml

290 857

📌Google воссоздала утерянный гол Пеле 1959 года Для музея Пеле в Сантусе специалисты DeepMind сняли мини-документалку о знаменитом голе, который ни разу не попал на плёнку. Видеозаписей матча просто не существует, поэтому историки собрали точную раскадровку по архивам - в дело пошли 2000 документов и 3600 фотографий.

Сантус для этой истории место не случайное. Пеле пришёл в местный клуб в 15 лет и играл за него с 1956 по 1974 год - там забил большинство своих голов, включая тот самый, незаснятый. Для этого города он легенда, поэтому музей открыли именно здесь.

Полностью доверить сцену ИИ не получилось - генеративные модели до сих пор путаются в сложной спортивной биомеханике. Поэтому команда сначала сняла живого дублёра на футбольном поле, а затем функция Performance Control в видеогенераторе Veo 3 взяла с этой записи 3D-геометрию и траектории движения актёра - так получился жёсткий физический каркас, за пределы которого генерация выйти не могла. Поверх каркаса модели Gemini Omni и Nano Banana Pro дорисовали исторический облик стадиона, погоду, толпу на трибунах и лицо самого Пеле, заменив им дублёра. Финал делали по-киношному. Мяч добавили классическими визуальными эффектами, а готовый цифровой файл прогнали через аппаратный фильм-рекордер - устройство, которое переносит цифровое видео на настоящую плёнку. Отсюда зерно и цветопередача кино пятидесятых - их не имитировали фильтром, а получили честным аналоговым способом. @ai_machinelearning_big_data #news #ai #ml

290 857

Оффер на роль Senior Data Science за неделю — реально? 🚀 Коллеги из Авито запускают Fast Track — ускоренный отбор для специалистов Data Science уровня Senior и Senior+. Одна неделя на все технические этапы и финал → оффер в классифайд №1 в мире по количеству пользователей. ✅ Основные этапы — 20–26 июля. Регистрация открыта до 20 июля. Как проходит: 🔸 До 20 июля — заявка + HR-скрининг 🔸 До 24 июля — техническая секция (ML-теория + Python) 🔸 25 июля — ML System Design 🔸 26 июля — финал 🔸 До 28 июля — оффер Преимущества фаст-трека: 🔸 Быстрый отбор и совмещённые этапы 🔸 Все даты известны заранее 🔸 Возможность оценить свои скилы — результат закрепляется на год Кого ждут: 🔸 От 4 лет опыта в крупных российских и международных IT-, BigTech- и FinTech-компаниях 🔸 Полный цикл разработки моделей — от ресёрча до выкатки в прод 🔸 От 1 года самостоятельного лидирования проекта, автономность и инициативность Команды на выбор: антифрод и модерация, монетизация и реклама, поиск и рекомендации, вертикальные DS-команды. 🤓 Регистрация — до 20 июля. Успей оставить заявку!

290 857

✔️ ChatGPT получил полноценный внутренний поиск Долгожданная функция поиска по истории чатов, проектам и загруженным документам доступна в боковой панели веб-интерфейса и в мобильных приложениях для iOS и Android. Поиск поддерживает фильтры по типам контента, а клик по результату в выдаче перенаправляет пользователя на конкретное сообщение в диалоге. Обновление разворачивается глобально. Новая возможность доступна всем пользователям ChatGPT, включая бесплатную версию. openai.com ✔️ Anthropic открыла учителям в США бесплатный доступ к своим продуктам Компания анонсировала бесплатную платформу Claude for Teachers для преподавателей школ США. В неё вошли модели, среда Claude Code и Cowork, где ИИ сам выполняет цепочки задач. Например, учитель один раз настраивает агента, и тот каждое утро проверяет тесты или собирает сводку по успеваемости класса. Платформа поддерживает интеграцию с сервисами Canva Education и MagicSchool, позволяя встраивать Claude в уже готовые рабочие процессы. Anthropic обещает, что данные учителей и учеников не пойдут на обучение будущих моделей. Заодно на GitHub выложили набор навыков для агентов и запустили курс по ИИ, не привязанный к продуктам какой-то одной компании. Программа продолжает вузовскую Claude for Education. Регистрация открыта до июня 2027 года. anthropic.com ✔️ Google добавила генерацию изображений в AI Overview К 25-летию сервиса Google Images компания добавила генерацию картинок по текстовому запросу в поисковые сводки. За функцию отвечает генератор на базе Nano Banana. Домашняя страница поиска по картинкам получила редизайн с механикой в стиле Pinterest. Интерфейс переведен на динамическую галерею с адаптивной алгоритмической лентой и возможностью сохранять изображения в тематические коллекции. Развертывание генеративных функций в AI Overviews займет несколько недель. На старте опция доступна только на английском языке в регионах, где уже поддерживается создание изображений. blog.google ✔️ Nvidia вдвое сократила список покупателей ИИ-чипов в Азии Чипмэйкер ужесточил процесс одобрения для азиатских контрагентов из списка авторизованных покупателей, чтобы перекрыть серый экспорт оборудования в Китай. После аудита число одобренных компаний в Сингапуре, Малайзии и Японии уменьшилось более чем на 50%. В новый "белый список" не попали многие новые облачные провайдеры-арендодатели GPU. Компания перешла от проверки документов к физическим инспекциям дата-центров. Теперь Nvidia анализирует контракты и запрашивает информацию напрямую у конечных пользователей ускорителей. ft.com ✔️ Учёные предупреждают о приближении второй промышленной революции Стэнфордская лаборатория цифровой экономики опубликовала открытое письмо "We Must Act Now" о макроэкономических последствиях внедрения ИИ. Документ подписали более 200 ученых, 16 нобелевских лауреатов и представители Google, Anthropic и OpenAI. Авторы прогнозируют, что в ближайшие 10 лет развитие ИИ спровоцирует трансформацию экономики, сопоставимую с исторической индустриализацией. Письмо призывает формировать новые институты для компенсации потери рабочих мест. Лидеры ИИ-компаний указывают на нехватку метрик для измерения влияния ИИ на экономику - из-за этого конкретный план действий отсутствует. Демис Хассабис, не подписавший письмо, прогнозирует появление AGI в перспективе 5 лет и сравнивает эффект с "десятикратной индустриализацией на десятикратной скорости". stanford.edu @ai_machinelearning_big_data #news #ai #ml

290 857

⚡️ Локальные LLM стали серьёзнее: Bonsai 27B весит меньше 4 ГБ PrismML взяла модель класса 27B и сжала её через 1-bit quantization: с примерно 54 ГБ до 3.8–3.9 ГБ. Заявляют, что при таком сжатии модель сохраняет около 90% качества оригинала. Это уже размер, с которым можно думать не только про серверы, но и про ноутбуки, браузер и смартфоны. Есть и более качественная версия Ternary Bonsai 27B: около 5.9 ГБ и до 95% качества baseline. Модель поддерживает мультимодальность, reasoning, кодинг, tool calling и агентные сценарии. То есть это не просто локальный чат, а база для локальных AI-агентов. Для Bonsai уже сделали WebGPU demo: кастомные kernel’ы позволяют запускать модель прямо в браузере. По словам Xenova, часть WebGPU-кода помогали писать Fable 5 и GPT 5.6 Sol. HF collection: https://huggingface.co/collections/prism-ml/bonsai-27b WebGPU demo: https://huggingface.co/spaces/webml-community/bonsai-webgpu-kernels @ai_machinelearning_big_data #llm #ai #ml

290 857

✔️ Samsung разрабатывает ИИ-ускоритель для ПК Подразделение Samsung LSI готовит к выпуску 4-нм сопроцессор под кодовым названием GAIA. В отличие от решений Intel, AMD и Qualcomm, где NPU является лишь частью базового процессора, корейская компания создает полностью независимый ИИ-акселератор. Особенность GAIA заключается в тесной привязке вычислительных блоков к массивам памяти. Samsung планирует задействовать собственную разработку PIM (Processing-in-Memory), технологию, которая переносит вычисления непосредственно внутрь модулей DRAM, что идеально подходит для работы LLM-моделей, генерации изображений и синхронного перевода. По данным отраслевых источников, ранние прототипы чипа уже переданы для тестирования в HP и Lenovo. Если тесты пройдут успешно, массовое производство чипа начнется в 2027 году. Для Samsung этот релиз станет возвращением на рынок кремния для ПК после закрытия экспериментов с хромбуками в 2012 году. @ai_machinelearning_big_data #news #ai #ml