Machinelearning

前往频道在 Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

显示更多

网络:Machinelearning 俄罗斯1 323 技术与应用331...

📈 Telegram 频道 Machinelearning 的分析概览

频道 Machinelearning (@ai_machinelearning_big_data) 俄语语言赛道中的是活跃参与者。目前社区聚集了 288 007 名订阅者，在 技术与应用 类别中位列第 331，并在 俄罗斯 地区排名第 1 323 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 288 007 名订阅者。

根据 02 八月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -5 417，过去 24 小时变化为 -206，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 7.77%。内容发布后 24 小时内通常能获得 5.91% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 22 374 次浏览，首日通常累积 17 009 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 153。
主题关注点： 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

凭借高频更新（最新数据采集于 03 八月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

288 007

订阅者

-20624 小时

-1 4197 天

-5 41730 天

22 374

帖子浏览量

~ 17 00924 小时

~ 18 69048 小时

7.77%

参与率

~ 5

每日帖子数

Ads index

beta

帖子存档

287 942

🌟 NVIDIA выложила в открытый доступ Cosmos 3 Edge Это компактная модель мира на 4 миллиарда параметров, ориентированная на робототехнику, компьютерное зрение и автономный транспорт. Модель принимает на вход текст, картинки, видео и траектории движения, а на выходе выдаёт видео, изображения, текст и команды для действий. Внутри архитектура Mixture-of-Transformers, где авторегрессионная часть отвечает за рассуждения, а диффузионная за генерацию изображения, звука и действий. Отсюда двойное назначение, модель может и разбирать сцену, и генерировать движения для робота. NVIDIA заявляет, что среди моделей такого же размера Cosmos 3 Edge - первая в бенче VANTAGE-Bench на видеоаналитику и лучшая в обучении управляющих алгоритмов для роботов. Вместе с базовой версией в релиз вошли Cosmos 3 Edge Policy для манипуляций роботом и облегчённые 4-х шаговые версии Cosmos 3 Super (Image2Video и Text2Image), дистиллированные из старшей версии через DMD2. Edge - самое компактное звено семейства Cosmos 3, которое NVIDIA развивает с весны. Ранее были представлены более крупные модели Cosmos 3 Nano на 16 млрд параметров и Cosmos 3 Super на 64 млрд, плюс отдельные версии Super для генерации изображений по тексту и видео по одному кадру. Задачи у них те же - разобрать сцену, предсказать, что изменится, и сгенерировать действие, но рассчитаны они на более мощное оборудование. Edge же закрывает нижний край линейки и сделаны для устройств, где вычислительных ресурсов мало. 📌Лицензирование: OpenMDW License 🟡Статья 🟡Страница проекта 🟡Набор моделей 🟡Демо 🖥GitHub @ai_machinelearning_big_data #AI #ML #WordModel #Omnimodal #Cosmos3 #NVIDIA

287 942

⚡️ Google представила 3 новые модели Gemini Cемейство Gemini пополнилось моделями 3.6 Flash, 3.5 Flash-Lite и специализированной 3.5 Flash Cyber. 🟡Gemini 3.6 Flash

Модель расходует на 17% меньше выходных токенов, чем предыдущая версия 3.5 Flash. Говорят, что подтянули у неё кодинг и офисные задачи. Стоимость - 1,5 доллара за миллион входных и 7,5 доллара за миллион выходных токенов.

🟡Gemini 3.5 Flash-Lite

Ориентирована на массовые и быстрые задачи. Заявленная скорость - 350 токенов в секунду при цене 30 центов за миллион входных токенов.

🟡Gemini 3.5 Flash Cyber

Модель, натасканная на поиск и исправления уязвимостей в коде, которая не поступит в открытый доступ - её получат только правительства и доверенные партнёры в рамках ограниченной пилотной программы.

Google также сообщила о планах - 3.5 Pro тестируется с партнёрами, а команда уже начала обучение Gemini 4, которое в компании называют самым масштабным на сегодняшний день. Сроки выхода не названы. @ai_machinelearning_big_data #news #ai #ml

287 942

✔️ Китай построил ИИ-дата-центр мощностью 1 ГВт -без единого чипа Nvidia По данным Bloomberg, компания Z.ai, ранее известная как Zhipu AI, завершила строительство огромного вычислительного центра на китайских ускорителях и уже частично ввела его в эксплуатацию. Инфраструктура будет использоваться для разработки и обучения передовых моделей семейства GLM. Кроме того, Z.ai построила или эксплуатирует несколько отдельных кластеров, каждый из которых насчитывает более 10 000 чипов. Китай показывает, что способен создавать крупную ИИ-инфраструктуру без критической зависимости от американских ускорителей. Это ещё не доказывает, что местные чипы сравнялись с Nvidia по производительности и программной экосистеме, но подтверждает: полноценная альтернативная вычислительная платформа уже формируется. Параллельно Пекин рассматривает инвестиции примерно в $295 млрд в национальную сеть дата-центров, где не менее 80% технологий должны поставляться китайскими компаниями. Технологическая независимость может оказаться для Китая важнее выпуска очередной frontier-модели. https://www.bloomberg.com/news/articles/2026-07-20/z-ai-completes-giant-data-center-with-chinese-chips-to-train-ai #ai #china #chips #datacenter #nvidia

287 942

📌 WAIC 2026 Ежегодная Всемирная конференция по ИИ прошла с 17 по 20 июля, и, впервые за всю историю проведения, открывал её лично Си Цзиньпин. Всего было больше 1100 компаний, свыше 3000 экспонатов, 300+ мировых премьер на рекордных 100 000 квадратных метров. WAIC в этом году сменил акцент - перестал быть парадом бенчмарков и стал витриной внедрения: роботы едут на заводы, агенты - в телефоны, чипы собираются в кластеры без Nvidia. Фон для всей конференции задал свежий Stanford AI Index.

К марту 2026 лучшая американская модель опережала лучшую китайскую всего на 2,7% (2 года назад отрыв мерили десятками процентных пунктов).

🟡Железо Гвоздь компьют-зала - Huawei Atlas 950 SuperPoD, супернода на картах Ascend. В полной сборке версии соединяются в Atlas 950 SuperCluster на 500 000 ускорителей. Вторым номером шёл кластер Sugon Dawn 8000 scaleX на 100 000 карт. Следом - решения Alibaba Zhenwu M890 и ZTE OEX SuperPoD. 🟡Модели и агенты MiniMax показала мультимодальную M3 с контекстом до 1 миллиона токенов с упором на длинный ризонинг, код и агентские сценарии. StepFun представила Step Agent OS, которую называет первой в мире агентной операционной системой, где пользователь описывает цель словами, а система сама раскидывает её по агентам на телефоне, ПК, в машине и роботах. 🟡Роботы Unitree показала GD01 - по её словам, первую в мире управляемую мехо-платформу, которая на ходу переключается между человекоподобной и четвероногой формой. Fourier привезла настольного робота-компаньона GR Nano. SenseTime развернула магазин SenseMart Go, которым роботы управляют сами - раскладывают товар, ведут инвентаризацию и разруливают нештатные ситуации, а покупатель заходит по QR-коду. 🟡Витрина новой волны Первый в мире агентный смартфон от Nubia (сделан с ByteDance Doubao и Huaqin), который работает на Step Agent OS. Телефон подаётся как личный ассистент, который сам доводит многошаговые задачи до конца. @ai_machinelearning_big_data #news #ai #ml

287 942

Cloud ru выложил в опенсорс Guardrails Filter — инструмент для защиты данных при работе с LLM Работает как слой между приложением и моделью: перед отправкой запроса маскирует персональные данные, API-ключи, пароли и другую конфиденциальную информацию синтетическими значениями, а после ответа модели восстанавливает оригиналы. Вы можете развернуть Guardrails Filter внутри своей инфраструктуры и самостоятельно управлять сервисом через личный кабинет. Что внутри: — стандартные и кастомные правила детекции (например, под внутренние ID, номера договоров) — логирование событий безопасности — тестовый режим Ghost Mode, который позволяет проверить работу сервиса до включения защиты На публичном бенчмарке pii-bench инструмент показал 93,1 по F1 и 99,9% точности срабатываний. GitVerse | GitHub

287 942

✔️ Alibaba откроет код альтернативы CUDA Полупроводниковое подразделение Alibaba (T-Head) анонсировало открытие исходного кода стека SAIL для фирменных ИИ-ускорителей Zhenwu. Проект анонсировали на Всемирной конференции по ИИ в качестве открытой альтернативы экосистеме Nvidia CUDA. По заявлению T-Head, адаптация SAIL под популярные ML-фреймворки занимает менее 7 дней. Флагманом линейки выступает процессор Zhenwu M890, представленный в мае и спроектированный для работы с ИИ-агентами. Alibaba ранее сообщала об отгрузке более 560 тысяч таких чипов сотням корпоративных клиентов. scmp.com ✔️ Moonshot приостановил оформление подписок на Kimi K3 Стартап временно остановил продажу подписок на модель Kimi K3 из-за нехватки вычислительных мощностей. Действующие пользователи работают без ограничений, доступ новым клиентам откроют по мере масштабирования инфраструктуры. Для балансировки нагрузки на кластеры компания меняет систему монетизации и делит единую подписку на 2 тарифа. В план Kimi Membership входят веб-версия, мобильное приложение и стандартные сценарии использования. Для инженеров вводится Kimi Code Membership - ресурсы этого тарифа выделены только под генерацию и анализ кода. Такое разделение потоков должно стабилизировать работу сервиса. Kimi в сети Х ✔️ ИИ-вендоры всерьез присматриваются к чипам AMD Microsoft расширит использование ускорителей AMD в инфраструктуре Azure. Во второй половине 2026 года компания запустит вычислительную платформу AMD Helios, оптимизированную для крупных моделей. Сатья Наделла объяснил расширение партнерства ценовой политикой Nvidia и конкуренцией со стороны TPU. Параллельно аппаратное обеспечение AMD тестирует Anthropic. По данным SemiAnalysis, AMD присвоила разработчику Claude высший приоритет поддержки наравне с Amazon. Ожидается, что компании официально анонсируют партнерство на конференции Advancing AI после решения проблем с оптимизацией программного стека. microsoft.com ✔️ ИИ спроектировал компоновку невидимого в полете одномоторного дрона Корпус аппарата Phantom Twist в полете вращается со скоростью до 25 оборотов в секунду, делая его почти невидимым за счет эффекта размытия. А процессе создания дрона ИИ сгенерировал 20 тысяч вариантов дизайна и симулировала их работу на фоне реальных пейзажей. Пропеллер и рама Phantom Twist крутятся в противоположных направлениях - в конструкции нет статичных деталей. Аппарат в 10 раз сложнее заметить, чем классический квадрокоптер. Авторы позиционируют устройство как инструмент для мониторинга дикой природы и осмотра инфраструктуры. northwestern.edu ✔️ Нил Бломкамп выпустил короткометражку, полностью сгенерированную в ИИ Известный по "Району №9" режиссер представил 13-минутный научно-фантастический хоррор Nightborne, полностью созданный с помощью видеомодели Seedance 2.0. Сюжет стилизован под документальное кино о военной программе, возвращающей в строй погибших солдат. Бломкамп управлял процессом покадрово, выстраивая сцены через промпты на основе концепт-артов, подготовленных художниками. Для генерации лиц и озвучки студия лицензировала биометрию 32 человек, чтобы избежать проблем с авторскими правами. Режиссёр заявил о планах снять полнометражный ИИ-фильм. Для реализации этих амбиций он уже открыл новую компанию, ориентированную на нейросетевой продакшен, которая придет на смену его классической студии Oats Studios. Neill Blomkamp в сети Х @ai_machinelearning_big_data #news #ai #ml

287 942

✔️ Google хочет «вшить» архитектуру Gemini прямо в кремний По данным The Information, Google разрабатывает серверный ИИ-чип под неофициальным названием Frozen v2. Часть архитектуры Gemini планируют реализовать непосредственно на аппаратном уровне. Ожидаемый результат: - в 6–10 раз выше энергоэффективность по сравнению с последними TPU - больше обработанных токенов при том же энергопотреблении - снижение дефицита вычислительных мощностей Google - возможное развёртывание уже с 2028 года Цена такой эффективности — потеря гибкости. Если ключевые элементы модели зафиксированы в кремнии, будущие версии Gemini должны сохранять совместимую архитектуру. Крупное изменение модели может потребовать разработки нового чипа. TPU уже снизили зависимость Google от Nvidia. Frozen v2 способен связать модели и инфраструктуру ещё теснее: Gemini будет проектироваться под конкретный кремний, а кремний — под Gemini. Проект пока находится на ранней стадии и официально не представлен. #google #gemini #ai #hardware #tpu https://www.theinformation.com/articles/google-plans-new-frozen-chip-run-ai-models-efficiently

287 942

✔️ В Roblox можно будет собрать игру по текстовому описанию Игровая платформа анонсировала функцию Build, которая превращает простой запрос в готовую базу игры. Под капотом целый набор ИИ-моделей, открытых и собственных - они отвечают за игровые механики, окружение, персонажей, визуальный стиль и звук. В геймдеве опасаются, что когда порог входа падает до текстового запроса, платформу зальёт поток AI-слопа, а авторам придётся конкурировать с ИИ-контентом, который штампуется в разы быстрее ручной работы.

Общее настроение индустрии при этом тревожное - по свежему опросу конференции GDC, 52% профессионалов игровой отрасли считают, что генеративный ИИ вредит геймдеву.

Ответ Roblox - ранжирование по удержанию игроков, как и для обычных игр. То есть если в игру никто не играет, её никто и не найдёт. Публичное альфа-тестирование Build стартует 28 июля в Новой Зеландии для пользователей от 9 лет с подтверждённым возрастом. Публиковать свои творения на глобальную аудиторию смогут те, кому исполнилось 16. Будет бесплатная базовая версия и платные тарифы. Roblox также готовит ИИ-агентов, которые помогут авторам с плейтестами и аналитикой, а ещё с ноября прошлого года обучает модель, генерирующую редактируемые 3D-сцены. На этом фоне компания закрывает видеозвонки через аватаров Roblox Connect, запущенные в 2023 году. Приоритеты, судя по всему, расставлены. @ai_machinelearning_big_data #news #ai #ml

287 942

Команда GigaChat зовёт на вечеринку для AI-разработчиков и исследователей 🎉 29 июля, Сбер.Среда, пространство «Оригинал» (м. «Курская», ул. Земляной Вал, 9А) Без докладов, презентаций и официальных дискуссий – только общение с коллегами по индустрии, обсуждение рабочих задач и болей, новые знакомства и летний вечер на веранде. Регистрация и подробности Надеемся на хорошую погоду 🥳 До встречи!

287 942

Repost from Kali Linux

Автономный ИИ-агент взломал Hugging Face, а закрытые модели не смогли помочь расследованию Hugging Face раскрыла инцидент, который хорошо показывает будущую асимметрию кибербезопасности. Атака началась с вредоносного датасета, эксплуатировавшего два пути выполнения кода в системе обработки данных. Затем автономный агент получил доступ к нодам, собрал облачные и кластерные учётные данные и перемещался между внутренними кластерами. За одни выходные система выполнила тысячи действий через краткоживущие sandbox-среды. В журналах осталось более 17 000 событий. Самая показательная часть началась во время расследования. Команда Hugging Face попыталась анализировать реальные эксплойты, команды и C2-артефакты с помощью передовых моделей через коммерческие API, но safety-фильтры блокировали запросы. Модели не смогли отличить работу специалиста по реагированию на инциденты от действий атакующего. В итоге анализ перенесли на самостоятельно размещённую open-weight модель GLM 5.2. Это позволило изучать вредоносный код без блокировок и не отправлять журналы, данные атакующего и упомянутые credentials внешнему провайдеру. Возникает опасная асимметрия: - атакующие запускают агентов без ограничений; - защитники могут столкнуться с блокировками именно в критический момент; - чувствительная телеметрия не всегда должна покидать инфраструктуру компании. У команды безопасности должна быть заранее подготовленная модель, которую можно запустить локально и использовать во время реального инцидента. Автономные кибератаки уже перестали быть сценарием из презентаций. Теперь вопрос в том, готовы ли защитные инструменты работать с той же скоростью. https://huggingface.co/blog/security-incident-july-2026 #ai #cybersecurity #opensource #llm #huggingface @linuxkalii

287 942

✔️ Клавиатура Codex Micro доступна для заказа Спустя 2 недели после анонса, OpenAI в коллаборации с производителем клавиатур Work Louder представила контроллер Codex Micro, который переводит управление агентами в Codex с экрана на физические кнопки, регуляторы и джойстик.

Смысл гаджета в том, чтобы разработчик реже набирал однотипные запросы вручную.

Типовые операции запускает аналоговый джойстик. Отдельные командные клавиши позволяют принять результат, отклонить его, включить голосовой ввод по нажатию или открыть новый чат, не отрываясь от клавиатуры. Кнопки программируются прямо в ChatGPT Codex, а в комплекте идёт набор из 32 сменных клавиш с символами платформы. За состоянием агентов можно следить по подсветке - клавиши в реальном времени меняют цвет в зависимости от того, простаивает агент, думает, ждёт ввода, сообщает об ошибке или закончил работу. Ещё одна деталь - физическое колесо, которым регулируется глубина ризонинга модели. Для простых задач её можно убавить ради скорости, для сложных - прибавить одним поворотом. Корпус выточен из поликарбоната и алюминия с анодированным основанием. Механические переключатели из пластиков POM и POK рассчитаны на 50 млн нажатий. К компьютеру устройство подключается по Bluetooth или кабелем USB-C. Официально поддерживаются Windows и macOS, а пользователям Linux предлагают костыль решение, созданное сообществом Work Louder. Устройство продаётся ограниченным тиражом по цене в 230 долларов, доставка идёт по всему миру, кроме России и Бразилии. @ai_machinelearning_big_data #news #ai #ml

287 942

⚡️ Создатель XLNet, который вернулся в Китай и построил Moonshot AI На GTC 2026 выступил Ян Чжилинь, 34-летний основатель и CEO Moonshot AI, компании, стоящей за моделями Kimi. Его путь начинался в Университете Цинхуа. Затем Ян получил PhD в Carnegie Mellon, стажировался в Google Brain и Meta AI, работал с Куоком Ле и Джейсоном Уэстоном. Его исследования пересекались с работами Йошуа Бенжио и Яна Лекуна. Широкую известность ему принесли Transformer-XL и XLNet. Обе работы пытались решить одну из ключевых проблем языковых моделей: потерю информации из далёкого контекста. Статью про XLNet впоследствии процитировали более 10 000 раз. После учёбы Ян мог продолжить карьеру в американском Big Tech, но вернулся в Китай. Он участвовал в развитии крупных китайских ИИ-проектов, основал Recurrent AI, а в 2023 году запустил Moonshot AI в Пекине. Исследования длинного контекста стали основой продуктов компании: - Kimi K2 получила MoE-архитектуру на 1 трлн параметров - Kimi K3 добавила нативное зрение, контекст на 1 млн токенов и 16 активных экспертов - компания сделала ставку на программирование, агентов и работу с большими объёмами информации Moonshot AI привлекла инвестиции Alibaba, Tencent и других крупных компаний. За несколько лет стартап превратился в одного из заметных участников китайской гонки frontier-моделей. Ян объяснял возвращение просто: он боялся всю жизнь сожалеть, если не попробует создать собственную компанию. Опыт, полученный в глобальной исследовательской среде, может быстро превратиться в технологическое преимущество целой страны. Его полное интервью можно посмотреть здесь: https://www.youtube.com/watch?v=CwePo4847ho @ai_machinelearning_big_data #Moonshot #kimi

287 942

🚀 Qwen3.8 скоро выйдет в open-weight Новая модель Alibaba получит 2,4 трлн параметров. Разработчики называют её одной из самых мощных моделей на рынке и ставят рядом с ведущими frontier-моделями. Предварительную версию Qwen3.8-Max-Preview уже можно протестировать через Alibaba Token Plan, Qoder и QoderWork. Полный релиз и открытые веса обещают в ближайшее время. Token Plan: - Международная версия: https://www.qwencloud.com/pricing/token-plan - Китай: https://platform.qianwenai.com/pricing/token-plan #AI #LLM #Qwen #OpenWeight

287 942

✔️ OpenAI предлагает бизнесу отказаться от подсчета токенов в пользу новой метрики Финдиректор Сара Фрайар предложила новый метод для оценки ROI от внедрения ИИ. Вместо цены за тысячу токенов бизнесу предлагают ориентироваться на метрику "полезный интеллект на доллар". Подход опирается на объем полезной работы, стоимость успешно закрытой задачи, надежность результата и рост отдачи при масштабировании. В OpenAI уверены, что дешевые токены создают иллюзию экономии. Более дорогие модели на практике могут обходиться дешевле, поскольку выдают рабочий результат с первой попытки и исключают долгий цикл исправлений. openai.com ✔️ Китай создал Всемирную организацию по сотрудничеству в сфере ИИ В Шанхае подписали соглашение о создании организации, в которую вошли 29 стран. Инициативу Китая поддержали Россия, Беларусь, Бразилия, Сербия и государства Африки и Азии. Задача альянса - сформировать международные стандарты управления искусственным интеллектом. Таким образом, конкуренция в ИИ выходит за пределы технологий и смещается в сторону взаимодействия государств. Китай планирует снизить порог входа в отрасль для стран Глобального Юга. Для этого участникам альянса предоставят доступ к открытым китайским моделям, а также запустят программы технической подготовки локальных ML-инженеров и разработчиков. reuters.com ✔️ Винт Серф разработает открытый стандарт идентификации агентов на базе DNS Один из создателей базовых протоколов интернета Винт Серф ушел из Google после 20 лет работы, чтобы присоединиться к Innovation Labs. В статусе советника он займется проектированием открытого стандарта DNSid для авторизации и аудита ИИ-агентов. DNSid привяжет цифровую личность агента к существующей инфраструктуре доменных имен. История регистраций и авторизация каждого бота будут фиксироваться с помощью криптографических доказательств. Единый механизм верификации разрабатывают для перехода индустрии от изолированных систем к агентам, взаимодействующим друг с другом в глобальной сети. Стандарт позволит инфраструктуре определять, какой именно бот делает запрос и кто несет ответственность за его действия. techcrunch.com ✔️ Decart AI обновил модель Lucy до версии 2.5 Спустя полгода стартап представил обновление модели редактирования FullHD-видео в реальном времени. Новинка всё так же работает при 30 fps и позволяет на лету менять персонажей, окружение и эффекты через текстовые промпты или референсные изображения. Lucy 2.5 получила механизм Self-Anchoring. В начале сессии она делает слепок генерации и использует его как базовый ориентир для фиксации изменений, в результате чего объекты сохраняют заданный облик и учитывают динамику сцены, даже когда выходят за пределы кадра и возвращаются обратно. Также снизилась задержка инференса за счет перевода вычислений в форматы квантования MXFP8 и NVFP4, что дало четырехкратный прирост скорости генерации. Сам инференс был оптимизирован алгоритмом sparse attention и за счёт kernel fusion, который снижает расходы на запуск процессов и разгружает память. decart.ai ✔️ Сотрудники Baidu получают по $150 на тестирование сторонних ИИ-решений Китайский техгигант ежемесячно выделяет сотрудникам 1000 юаней (~$150) на подписки к любым LLM-продуктам на рынке. Вице-президент Шэнь Доу пояснил, что инициатива не привязана к KPI - компания рассчитывает на естественное формирование привычки у инженеров, а принудительное внедрение считает неэффективным. По прогнозам Baidu, к концу 2026 года до 90% рабочих задач будут выполняться с участием ИИ. Следующие 3 года компания называет "золотым окном" до окончательной фиксации иерархии на технологическом рынке. В рамках стратегии компания выстраивает полный цикл от собственных процессоров Kunlun до LLM и переходит на новую метрику DAA для оценки реальной пользы ИИ-агентов. Доля ИИ-направления в выручке компании в этом году достигла 52%. huxiu.com @ai_machinelearning_big_data #news #ai #ml

287 942

📌 Физики создали память на механических колебаниях для квантового компьютера Группа из Швейцарской высшей технической школы Цюриха экспериментально продемонстрировала квантовые вычисления, в которых рабочая память построена на механических колебаниях, а не на электромагнитных состояниях. Архитектура скопирована с классического компьютера, где процессор и оперативная память разделены. Роль процессора играет сверхпроводящий кубит, а роль памяти - крошечные механические резонаторы внутри квантового чипа, элементы, отдалённо похоже на гитарные струны, которые при записи информации начинают колебаться на частотах за пределами слышимого. Для вычисления кубит обращается к колебанию в памяти, обрабатывает и изменяет его состояние, а затем записывает обратно. Такое разделение вычислений и хранения отличает подход от многих существующих квантовых схем, где обработка и память тесно переплетены. 🟡Ставка на механику объясняется двумя ограничениями Сегодня квантовую память чаще всего делают электромагнитной в связке со сверхпроводящими кубитами - обе технологии хорошо изучены и позволяют считывать и менять квантовые состояния с высокой точностью. Но такие элементы относительно громоздки, что мешает превращать лабораторные установки в практические машины. Механические резонаторы заметно компактнее, а главное - ёмче (как струна может звучать разными тонами, резонатор поддерживает множество мод колебаний, и каждая мода работает как отдельная ячейка памяти). Вдобавок, по данным группы, механические состояния дольше остаются стабильными - информация не затухает так быстро, как в электромагнитных аналогах. 🟡Работоспособность проверили на реальных задачах Первая - квантовое преобразование Фурье, базовая процедура, на которую опираются многие квантовые алгоритмы, включая знаменитый алгоритм Шора для разложения чисел на множители. Вторая - поиск периода функции, продемонстрировавший применение этой процедуры на практике. Обе задачи требуют одновременно и точно управлять множеством квантовых состояний, хранить их и связывать между собой, не разрушая их хрупкую природу. Авторы говорят, что их схема в принципе способна выполнять все базовые операции, необходимые для произвольного квантового вычисления, то есть годится как основа универсального программируемого квантового компьютера. 🔜 Почитать полную статью можно в в журнале Science @ai_machinelearning_big_data #news #ai #ml

287 942

📌 Как дотянуть компактную модель до уровня гигантов посттрейном AI-подразделение китайского производителя электромобилей Lixiang опубликовало интересную работу о том, как они оптимизацией насыщали компактную модель доменными знаниями.

Mach-Mind-4-Flash - итоговая MoE-модель на 35 млрд общих 3 млрд активных параметров на базе Qwen3.5-35B-A3B.

Проблема, от которой Li Auto отталкивались, состоит в том, что если учить одну модель с подкреплением сразу на смеси наград (математика, код, агентные задачи), то появляются качели - подтянули одно, просело другое. Решение - разделить этапы и области знаний. Сначала независимо обучили более десятка RL-экспертов, каждого в своём домене: математика, код, текст, безопасность, поиск, работа с инструментами. Каждый эксперт получил свои данные, свои проверяемые награды и свою стратегию обучения. Дальше самое интересное - как собрать экспертов обратно в одну модель. Для этого использовали методику MOPD, которую взяли у Xiaomi.

Это мультиучительская дистилляция на собственных генерациях ученика, где каждый обучающий пример по ключу маршрутизации уходит к "своему" замороженному эксперту, и тот через reverse-KL на уровне токенов подтягивает распределение ученика к своему.

Агентные навыки эксперты осваивали в исполняемых песочницах - там модель читает файлы, правит код, запускает тесты, видит ошибки и продолжает с их учётом. Масштаб сред - более 190 предметных областей с сохранением состояния, свыше 3,5 тыс. интерфейсов инструментов, траектории программных задач до 300 шагов при контексте 256 тыс. токенов. 🟡Работает ли слияние? И да и нет. Следование инструкциям сохранилось целиком, а на агентных бенчах ClawBench и ClawEval итоговая модель даже обошла отдельных экспертов. Но на SWE-bench Verified результат просел с 73,80 у эксперта до 71,10 у модели.

Предполагают, что узкоспециализированное поведение в длинных задачах кодинга при дистилляции смазывается.

Финальный штрих - HMPO, собственная механика Li Auto, которая следит, чтобы модель не увлекалась в цепочках рассуждений.

Бюджет длины CoT берётся из медианы правильных ответов в группе, награду получают только верные и при этом более короткие решения, а награда собирается умножением (короткий, но неверный ответ получает строгий 0, что закрывает лазейку для взлома награды).

На выходе HMPO получается сокращение длины генерации на 19–46% при потере точности не более 0,7%, причём обучение шло только на математике, а эффект перенёсся на код и другие задачи. Правда пока это работает только для одношаговых рассуждений, к многоходовым агентным траекториям его ещё предстоит адаптировать. 🟡Итоги 92,7 на AIME'26 - тут отстает от триллионной Kimi-K2.5 меньше чем на пункт; 82,8 на IFBench - первое место с большим отрывом, ближайший конкурент Qwen3.5-122B; 75,8 на BFCL-v4 - второе место после MiMo-V2-Flash, при этом лучше чем Qwen3.5-122B и Kimi-K2.5. Можно сказать, что результаты на уровне куда более крупных моделей. К сожалению, планы по публикации модели неизвестны, но возможно мы просто почувствуем её в следующих поколениях электромобилей Lixiang. 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Optimisation #RL #LiAuto

287 942

🎓 Хотите в ШАД, но не знаете, с чего начать? На курсе ShadHelper мы помогаем выстравивать подготовку по понятному плану: закрывать необходимые темы по математике и алгоритмам, разбирать задачи вступительных и получать обратную связь преподавателей. Новый поток курса «Подготовка к ШАД» уже начался, но сейчас идёт вводная часть. Поэтому до 19 июля включительно ещё можно присоединиться к группе без сильного отставания. На время добора мы открыли бесплатный тестовый доступ к материалам и занятиям текущего потока. Вы сможете посмотреть: - как выстроена программа подготовки; - какие темы и задачи разбирают на курсе; - как преподаватели дают обратную связь; - подходит ли вам темп и формат обучения. Если формат вам подойдёт, сможете присоединиться к текущей группе и продолжить обучение. 👉 Посмотреть курс изнутри Реклама ООО "ШВМ", ИНН: 5638076560 Erid: 2VtzqxUcqML

287 942

🌟 ReactBench: инструмент оценки агентов при работе с кодом на React Команда Million, известная инструментами React Doctor, React Scan и Million.js, представила тест для агентов, пишущих код на React. Актуальность ReactBench зеркальна реальному положению дел - около 70% сайтов на JavaScript используют React, а мелкие ошибки в сгенерированном коде тиражируются в огромных масштабах.

Например, сбой Cloudflare в сентябре 2025 года - панель управления и API компании легли из-за одной неверной зависимости в useEffect, которую не поймали ни ревью, ни тесты.

Философия проекта в том, что общие кодинг-бенчмарки проверяют лишь поведение по принципу "тесты прошли - задача засчитана". В ReactBench каждое решение должно ещё и пройти проверку React Doctor, анализатора с более чем 400 правилами, который ищет в коде лишние перерисовки, сломанные эффекты, проблемы с доступностью и сопровождаемостью. 🟡Набор состоит из задач двух типов Write React - реализовать настоящую функцию. Задания этого типа собраны из принятых PR в открытых репозиториях. Агент получает кодовую базу и описание задачи, а скрытые тесты и эталонное решение видит только проверяющая система. Fix React - найти и исправить все баги в существующем компоненте, обнаруженные React Doctor, не создавая при этом новых проблем. Причём агента еще и лишают доступа к линтерам. 🟡Результаты прогонов Само собой, созданием бенча не ограничились и запустили его на топовых моделях. Тут важен небольшой дисклеймер: Бенчмарк сравнивает не модели в чистом виде, а связки модель+агентская оболочка (Codex CLI, Claude Code и другие), и оболочка влияет на итог. По итогам лидируют с минимальным отрывом GPT-5.6 Sol (43,1%) и Fable 5 (41,2%), но важнее разница в цене - прогон Fable 5 обходится в среднем в 5,8 раза дороже, чем Sol. Оптимальным по соотношению стоимость-качество авторы называют GPT-5.6 Terra на средних настройках. Замыкают таблицу GLM 5.2, Sonnet 5, GPT-5.6 Luna и Kimi K2.7 Code. Набор полностью открыт на Github. @ai_machinelearning_big_data #AI #ML #Agents #Benchmark #ReactBench #Million

287 942

✔️ Anthropic переработала команду code-review в Claude Code Команда получила уровни Low, Medium, High, X-high и Ultra.

И это не один и тот же промпт с разным временем на ризонинг - на каждом уровне процесс построен по-своему.

Уровень подхватывается из настроек сессии автоматически, но его можно задать руками командой /code-review high. 🟢Low делает один быстрый проход по диффу. 🟢Medium читает изменённый код в контексте проекта, прогоняет несколько поисковых проходов под разными углами и перепроверяет находки перед выдачей. 🟢High выносит поиск и верификацию в субагентов с чистым контекстом, чтобы проверяющие не были заякорены на рассуждениях агента, который этот код только что писал. 🟢X-high дополнительно ищет, как изменения влияют на код за пределами самого диффа. 🟠Ultra - верхняя ступень, где ревью выполняется в облачной песочнице, куда Claude Code выгружает состояние репозитория или клонирует PR с GitHub. Там запускается целый парк агентов, и каждая находка независимо воспроизводится и верифицируется. Ultra находится в статусе research preview и оплачивается отдельно от подписки - Pro и Max подписчикам дают 3 бесплатных запуска, дальше каждый прогон списывается из кредитов на дополнительное использование стоит примерно от 5 до 20 долларов в зависимости от размера изменений. Качество новой системы подкрепляют замерами Opus 4.8 на открытом датасете с ручной разметкой ошибок. Уровень Low нашёл 17% размеченных багов, Medium - 22%, High - 24%, X-high - 25%. У "конкурента" (компания его не называет) - те же уровни дали от 8 до 12%.

Anthropic утверждает, что использует Ultra-режим на каждом пулл-реквесте в собственной разработке.

@ai_machinelearning_big_data #news #ai #ml

287 942

MWS Cloud первой в России развернула GLM 5.2 в собственном облаке MWS Cloud расширила каталог сервиса MWS GPT Model Hub до 17 больших языковых моделей. Главным обновлением стала GLM 5.2 — опенсорс-модель от Z.AI, которую компания первой в России развернула на собственной облачной инфраструктуре. Модель ориентирована на сценарии, где важны качество рассуждений, глубокий анализ текстов и обработка многошаговых запросов. Теперь все запросы к GLM 5.2 обрабатываются на серверах MWS Cloud внутри страны. Это означает, что данные и вычисления не покидают юрисдикцию РФ и не зависят от зарубежных провайдеров. Помимо GLM 5.2, в каталоге появились Kimi K2.6 от Moonshot AI. Модель подходит для обработки сложных пользовательских запросов, анализа документов, генерации развёрнутых ответов и построения AI-ассистентов. Кроме того, в MWS GPT Model Hub появились Qwen3.6, Gemma 4, GPT OSS и другие модели. Сервис получил поддержку распознавания и синтеза речи, а также реранкеров, которые улучшают качество поиска и RAG-сценариев. Все 17 моделей доступны через единый OpenAI-совместимый API, что позволяет разработчикам быстрее тестировать и внедрять AI-функции в свои продукты без развёртывания собственной инфраструктуры. @ai_machinelearning_big_data #news