Китай.AI
Відкрити в Telegram
💡 Канал Китай.AI — для тех, кто хочет быть в курсе развития искусственного интеллекта в стране, которая претендует на мировое технологическое лидерство. 📱 Подписывайтесь, чтобы не пропустить ключевые события в китайской ИИ-индустрии! @olegsir78
Показати більше1 319
Підписники
+124 години
Немає даних7 днів
-130 день
Архів дописів
1 319
🖥️ Китай вернул себе первое место в TOP500: суперкомпьютер LineShine лидирует в HPC
Национальный суперкомпьютерный центр Шэньчжэна вывел LineShine на первую строчку рейтинга TOP500 (июнь 2026) — впервые с 2017 года, когда лидировал Sunway TaihuLight. Машина показала 2.198 Exaflop/s на классическом HPL-бенчмарке, обогнав американский El Capitan (1.809 Exaflop/s) на 20%.
🔧 Что внутри
Полностью CPU-only архитектура — ни одного GPU от NVIDIA или AMD. Система построена на 40 960 кастомных процессорах LX2 (Armv9, 304 ядра на чип, 1.55 GHz) с собственной платформой LingKun, interconnect LingQi (1.6 Tb/s на узел) и ОС Kylin. Всего 13 789 440 ядер, 20 480 вычислительных узлов, 650 PB хранилища.
⚡ Два лица одной машины
- HPL (FP64) — 1-е место, 2.198 EFLOPS. Это классические научные расчёты.
- HPCG — 1-е место, 22.00 Petaflop/s.
- HPL-MxP (mixed-precision) — только 4-е место с 7.92 EFLOPS и скромным 3.6x ускорением. Этот бенчмарк ближе к реальным ИИ-нагрузкам, и здесь CPU-only дизайн показывает свои ограничения.
🎯 Почему это важно
Это не попытка построить «китайский Colossus». Это доказательство технологического суверенитета: Китай показал, что может выйти на экзафлопсный уровень, используя только отечественные компоненты. Каждый слой стека — от процессора до сети и ОС — контролируется внутри страны.
Но есть компромисс: LineShine потребляет 42 220 кВт — значительно больше, чем El Capitan (29 685 кВт), при меньшей пиковой производительности на ватт.
📊 Вывод
LineShine — это инженерный прорыв и геополитический сигнал одновременно. Китай вернул лидерство в классическом суперкомпьютинге. Машина оптимизирована для научного HPC (молекулярная динамика, климатическое моделирование, вычислительная физика), а не для тренировки триллионных LLM. Для последнего у Huawei есть Ascend-кластеры — совсем другая история.
📎 Оригинальная статья Reuters
#TOP500 #Суперкомпьютеры #HPC #ИИ #Китай
1 319
🔥 Huawei обходит санкции США с помощью математики: представлен «закон масштабирования Тау»
Пока США перекрывают доступ к передовому оборудованию для литографии, Huawei совершает тихую революцию в архитектуре чипов. Компания официально представила Tau Scaling Law (Закон масштабирования Тау) — стратегический ответ на замедление закона Мура и западные ограничения.
Вместо погони за нанометрами Huawei делает ставку на временное масштабирование и трехмерную архитектуру, чтобы выжать максимум из имеющихся технологий.
Что это значит для индустрии:
Эквивалент 1.4 нм к 2031 году
Huawei планирует достичь производительности уровня 1.4-нм чипов, используя текущее оборудование DUV (глубокий ультрафиолет). Никакой зависимости от запрещенных систем EUV от ASML.
Технология Logic Folding (Сворачивание логики)
Вместо уменьшения транзисторов чипы будут расти «вверх». Архитектура использует передовую 3D-компоновку и оптимизацию вычислений на системном уровне, буквально упаковывая больше логики в единицу объема.
Вектор на Kirin и Ascend
Новый закон масштабирования станет фундаментом для будущих поколений потребительских процессоров Kirin (для смартфонов) и мощных ИИ-ускорителей Ascend для дата-центров.
Это кардинальный сдвиг парадигмы. Huawei доказывает, что лидерство в полупроводниках теперь определяется не только точностью лазера на заводах, но и гениальностью системной архитектуры, алгоритмов и математических моделей. В условиях тотальной блокады Китай создает полностью независимый технологический путь.
Оригинальная статья
#Huawei #Полупроводники #Технологии #ИИ #Ascend
1 319
⚡️ Huawei представил результаты тестирования новой версии DeepSeek V4 на своём железе Ascend
Тесное взаимодействие инженеров на уровне чипов и моделей позволило Ascend раскрыть весь потенциал DeepSeek V4 — и вот что показали тесты.
📊 Результаты (входной промпт 8K):
• Ascend 950 SuperNode:
- DeepSeek V4-Pro: TPOT ≈ 20 мс, пропускная способность декодирования 4700 токенов/с на карту.
- DeepSeek V4-Flash: TPOT ≈ 10 мс, пропускная способность 1600 токенов/с на карту.
• Ascend A3 SuperNode (64 NPU, vLLM, сценарий 8K→1K):
- DeepSeek V4-Flash: 2000+ токенов/с на одну карту.
- V4-Pro на A3 тоже поддерживается, оптимизация продолжается.
🛠 За счёт чего такие цифры:
1. Архитектурные оптимизации чипа 950:
— Нативная поддержка FP8 / MXFP8 / MXFP4: память экономится на 50 %+, вычислительная мощность удваивается.
— Аппаратная оптимизация разреженного доступа к памяти — устранён bottleneck при маршрутизации экспертов в MoE.
— Объединённая память векторного (Vector) и матричного (Cube) блоков — убраны издержки на передачу данных внутри чипа.
2. Системный уровень:
— Ascend SuperNode решает задачу низкой задержки и высокого throughput на всём диапазоне от 4K до 1M токенов.
— Поддержка NAND SSU для дешёвого, ёмкого и быстрого KV Cache — критично для длинных контекстов.
3. Инструменты разработчика:
— PyPTO: Python-фреймворк для кастомных операторов. Разработка под конкретное железо сокращается до дней, ядра генерируются автоматически. Виртуальный набор инструкций PTO ISA обеспечивает совместимость кода между поколениями чипов без переделок.
— TileLang-Ascend: открытая реализация с Expert- и Developer-режимами. Код DeepSeek V4 уже выложен в сообществе TileAI.
🔗 Полная линейка Ascend (A2, A3, 950) поддерживает обе модели. Все инструкции, оптимизированные операторы и примеры обучения — в открытых репозиториях Huawei (CANN Recipes, MindSpeed-LLM, vLLM Ascend, SGLang).
Подробнее в оригинальной статье
#Huawei #Ascend #DeepSeekV4 #КитайскийИИ #LLM #NPU
1 319
🔥 DeepSeek V4 официально представлен!
Сегодня DeepSeek анонсировал наконец релиз V4: одновременно выпустила и полностью открыла исходный код двух версий флагманской модели DeepSeek-V4.
🤖 Две модели под разные задачи
• DeepSeek-V4-Pro (размерность 1.6 трлн параметров, активация 49 млрд, контекст 1M) — топовая модель для самых сложных задач.
• DeepSeek-V4-Flash (размерность 284 млрд параметров, активация 13 млрд, контекст 1M) — более быстрая и экономичная версия.
Контекст в 1 миллион токенов теперь стал стандартом для всех сервисов DeepSeek.
🧠 Ключевые инновации архитектуры
• Гибридная архитектура внимания: сочетание сжатого разреженного внимания (CSA) и высокосжатого внимания (HCA), что значительно сокращает вычислительную сложность при обработке длинных контекстов..
• Muon-оптимизатор: ускоряет схождение и повышает стабильность обучения.
• Пост-тренировочный пайплайн: DeepSeek-V4-Flash обучен на 32 трлн токенов, DeepSeek-V4-Pro — на 33 трлн токенов.
• Эффективность длинного контекста: по сравнению с DeepSeek-V3, FLOPs снижены на 73%, а размер KV-кэша уменьшен на 90%.
📊 Улучшенные способности
• Agent-возможности: внутри компании DeepSeek V4 уже используется как Agentic Coding модель, и по отзывам сотрудников, она превосходит Sonnet 4.5, а по качеству близка к Opus 4.6 (но пока уступает режиму мышления Opus 4.6).
• Мировое знание: значительно превосходит другие открытые модели и лишь немного уступает топовым закрытым аналогам, таким как Gemini-Pro-3.1.
• Логические рассуждения: в тестах по математике, STEM и конкурсному программированию DeepSeek-V4-Pro превосходит все известные открытые модели и сравнима с лучшими закрытыми.
💻 Поддержка AI-агентов
V4 оптимизирован для популярных Agent-платформ: Claude Code, OpenClaw, OpenCode, CodeBuddy. Доступен как через OpenAI ChatCompletions, так и через Anthropic интерфейс.
API уже доступен, цены конкурентные. Для сложных Agent-сценариев рекомендуется использовать режим мышления с параметром
reasoning_effort, установленным на max.
💪 Переход на Huawei Ascend
Подтверждено использование чипов Huawei. Сегодня в в Китае запланирована трансляция запуска DeepSeek V4 на платформе Huawei Ascend. Кроме того, компания Cambricon уже обеспечила Day 0 адаптацию обеих моделей на основе vLLM.
В конце анонса компания процитировала философа Сюнь-цзы: «Не льстись на похвалу, не бойся клеветы, следуй Пути и оставайся собой».
Сайт | HuggingFace | Технический отчет | GitHub
🎙️ Что дальше?
Старые названия моделей «deepseek-chat» и «deepseek-reasoner» будут отключены через три месяца (2026-07-24).
DeepSeek также объявила о прекращении поддержки старых названий моделей deepseek-chat и deepseek-reasoner через три месяца.
#DeepSeek #DeepSeekV4 #OpenSource #LLM1 319
🤖 Агенты перестают быть одиночками: китайский Kimi K2.6 совершает прорыв в командной работе ИИ
Всего через 3 месяца после предыдущей версии компания Moonshot AI выпустила и открыла исходный код своего нового флагманского модельного ряда — Kimi K2.6. Главная цель обновления — преодолеть ключевое ограничение современных AI-агентов: неспособность эффективно работать в команде над сложными проектами.
🎯 В чем суть прорыва?
Текущие агенты отлично справляются с одиночными задачами, но «командная игра» у них хромает. K2.6 системно решает эту проблему, усиливая три направления:
• Agent Swarm (Рой агентов): Масштабируемая архитектура для координации множества агентов.
• Активная работа через OpenClaw: Глубокая адаптация к фреймворкам для автономного планирования и выполнения.
• Claw Group (Группа Claw): Новый механизм организационного сотрудничества между агентами.
Вместе это создает систему, которая работает гораздо больше как человеческая команда.
🚀 Технические возможности и бенчмарки
За этой групповой динамикой стоит мощная модель. K2.6 показывает значительный прогресс в ключевых областях:
• Кодирование: Лидерство в тестах SWE-Bench Pro, имитирующих реальную разработку.
• Глубокий поиск (DeepSearchQA): Улучшенное понимание и извлечение информации.
• Общая производительность агента: Высокие результаты в комплексных тестах вроде Humanity's Last Exam.
На платформе Artificial Analysis модель получила титул «нового короля open-source моделей». Она уверенно конкурирует с закрытыми гигантами: GPT-4o, Claude Opus и Gemini Pro.
⚙️ Технические детали
• Масштабирование роя: Архитектура поддерживает одновременную координацию до 300 суб-агентов, способных выполнять 4000 шагов.
• Длинный контекст и программирование: Оптимизирована для long-horizon tasks. Пример: автономная загрузка и оптимизация модели Qwen на Zig, что заняло 12+ часов, 4000+ вызовов инструментов и дало прирост скорости на 20%.
• Автономность: Улучшена точность вызова API, стабильность длительных сессий и безопасность выполнения сложных исследовательских цепочек.
• Vibe Coding & Full-Stack: Генерация визуально эффектных фронтенд-страниц с интерактивными элементами. Добавлена поддержка базовых бэкенд-функций, таких как сбор данных форм.
Вывод: Эволюция ИИ смещается от создания умных «индивидуальных исполнителей» к проектированию слаженных «цифровых коллективов». K2.6 — серьезный шаг в эту сторону.
Попробовать модель можно в веб-версии Kimi или мобильном приложении.
#КитайскийИИ #КитайAI #MoonshotAI #Kimi #AIАгенты
1 319
🤖 Робот с ИИ за час схватил 100+ незнакомых предметов. Как им это удалось?
Китайский стартап Sudo Robotics представил систему Sudo R1, которая без единого предварительного «урока» на реальном роботе показала near-100% успех в захвате самых сложных объектов.
Суть прорыва: Модель обучали исключительно на симуляциях (Sim2Real), что резко снижает стоимость и ускоряет разработку. В тесте она без ошибок брала прозрачные стаканы, блестящие детали и мягкие объекты при разном освещении и помехах.
📌 Почему это важно для отрасли?
• Zero-shot успех: Робота можно «выбросить» в новую среду, и он сразу начнет работать.
• Низкая стоимость: Обучение в симуляции дешевле и быстрее сбора данных с реальных машин.
• Универсальность: Одна модель — для разных задач, а не отдельная настройка под каждый цех.
🧠 Технические детали (для профи)
Команда Sudo выбрала путь чисто симуляционного обучения, избегая узких мест индустрии:
1. Проблема данных: Сбор реальных данных (через теледействие, UMI) дорог и плохо масштабируется.
2. Проблема динамики: Реальные данные неточно отражают физику (силы, трение). Высокоточный симулятор даёт модели корректное понимание динамики для стабильной работы в реальности.
Ключом стал гибридный подход к данным: симуляция формирует базовое физическое понимание, а небольшой набор реальных данных используется позже для тонкой калибровки под конкретную среду.
🌟 Кто стоит за проектом?
За технологиями компании стоит серьёзный академический бэкграунд:
• Техсоветник — Су Хао, новый профессор Фуданьского университета, один из создателей ImageNet, соавтор PointNet/ShapeNet.
• Техлидер — Сюй Цзэсян, экс-руководитель 3D Gen AI в Adobe.
Компания, основанная в мае 2025 года, уже привлекла инвестиции от CATL, Alibaba, Tencent, Hillhouse и других. Её оценка превышает $20 млрд.
Вывод: Sudo R1 — не просто ещё одна демка по захвату объектов. Это практическая проверка пути «обучение в симуляции → работа в реальности», который может значительно удешевить и ускорить внедрение роботов в промышленность.
Официальный сайт Sudo Robotics
#КитайскийИИ #КитайAI #Робототехника #Sim2Real #SudoRobotics
1 319
🔥 Huawei раскрывает амбициозный трёхлетний план: три поколения Ascend за три года
Несмотря на жёсткие санкции США, Huawei не просто выживает в сфере ИИ-чипов, а уверенно строит собственную империю вычислительной мощности. На конференции Huawei Connect в 2025 году компания официально представила дорожную карту развития Ascend на ближайшие три года.
Что ждёт рынок:
• Ascend 950 (2026 год) — ближайшее поколение
Включает две версии:
- 950PR (уже в производстве): оптимизирован для prefill-этапа инференса и рекомендательных систем. Выдаёт до 1,56 петафлопс в FP4 и в два раза мощнее китайской версии Nvidia H20.
- 950DT (Q4 2026): фокус на decode-этапе инференса и обучении моделей. Использует собственную HBM-память HiZQ 2.0 (до 144 ГБ), пропускную способность памяти 4 ТБ/с и интерконнект 2 ТБ/с.
• Ascend 960 (2027 год)
Удваивает вычислительную мощность, пропускную способность памяти, объём памяти и количество портов интерконнекта по сравнению с 950-й серией. Значительно повысит производительность как в обучении, так и в инференсе. Поддерживает HiF4 - более точный 4-битный формат.
• Ascend 970 (Q4 2028)
Ещё одно удвоение: в два раза больше производительности в FP4 и FP8, удвоенная пропускная способность интерконнекта и рост скорости доступа к памяти минимум в 1,5 раза.
Это уже не просто «замена Nvidia». Huawei переходит от использования базовых компонентов к полноценному доминированию в ключевых характеристиках: вычислительная мощность, память, интерконнект и энергоэффективность. Каждый новый чип становится заметно сильнее предыдущего, а экосистема Atlas и поддержка CUDA делают переход для китайских компаний всё более привлекательным.
Похоже, 2026–2028 годы станут настоящим прорывом для китайского ИИ-железа. Huawei планомерно закрывает отставание и создаёт независимую технологическую базу.
Оригинальная статья
#КитайскийИИ #Huawei #Ascend
1 319
🔥 DeepSeek-V4 полностью перейдёт на чипы Huawei: почти триллион параметров без единого Nvidia
Согласно свежим данным, флагманская модель DeepSeek-V4 (почти 1 триллион параметров) будет полностью работать на китайских чипах Huawei Ascend.
Ключевые детали новой модели:
- Архитектура почти на 1 трлн параметров
- Контекстное окно до 1 миллиона токенов
- Инференс в 1,8 раза быстрее предыдущих версий
- Значительно улучшенная эффективность благодаря технологии Engram
- Сильный акцент на высокопроизводительном кодинге и сложном reasoning
DeepSeek уже несколько месяцев тесно сотрудничает с Huawei и Cambricon: команда переписывала и оптимизировала ключевые компоненты модели специально под Ascend. Ожидается, что для запуска и инференса V4 будет задействовано сотни тысяч чипов Ascend 950PR.
Это знаковый момент: одна из самых мощных китайских моделей полностью отказывается от американских чипов в пользу Huawei. Пока другие гиганты (Alibaba, ByteDance, Tencent) тоже массово заказывают Ascend 950PR, DeepSeek идёт ещё дальше — давая Huawei приоритетный ранний доступ для глубокой оптимизации.
Выход DeepSeek-V4 ожидается в ближайшие недели, а позже в этом году могут появиться ещё две вариации модели на полностью китайском железе.
Санкции, которые должны были сдержать Китай, на деле ускоряют создание независимой экосистемы. Huawei Ascend + DeepSeek = мощный тандем, который меняет правила игры в китайском ИИ.
Оригинальная статья
#DeepSeek #DeepSeekV4 #Huawei #Ascend
1 319
🚨 США хотят встроить «маячки» во все экспортные AI-чипы.
Комиссия по иностранным делам Палаты представителей США одобрила законопроект, который обяжет оснащать все экспортируемые высокопроизводительные чипы и вычислительное оборудование системой удаленного контроля.
Основная цель — не допустить попадание передовых американских микросхем, критически важных для развития ИИ, в «нежелательные» страны (прежде всего, Китай) через третьи стороны.
📌 Что такое «Chip Security Act»?
Это законопроект H.R.3447, который вводит обязательные «механизмы безопасности чипов» для всей контролируемой продукции перед ее экспортом, реэкспортом или передачей за рубеж.
🔍 Ключевые положения закона:
• Главное требование: В течение 180 дней после принятия закона все подконтрольные чипы и системы должны быть оснащены механизмом проверки местоположения (location verification).
• Механизм может быть реализован на уровне ПО, прошивки, аппаратного обеспечения или физически.
• Компании обязаны уведомлять власти, если чип используется не по назначению, перемещен или подвергся взлому.
🔄 Дальнейшие планы (оценка в течение года):
Закон предписывает оценить необходимость внедрения дополнительных функций:
• Защита от несанкционированного вмешательства и манипуляций.
• Верификация рабочих нагрузок (что именно вычисляет чип).
• Идентификация цепочек контрабанды.
• Возможность удаленного отключения или ограничения функционала.
⚖️ Контекст и причины:
Законопроект продвигается членами специального комитета по стратегической конкуренции между США и Китаем. Это прямое продолжение политики технологического сдерживания.
• В июле 2025 г. китайский регулятор (CAC) вызывал Nvidia на беседу из-за рисков, связанных с бэкдорами в чипах H20.
• Упоминаются технологии «удаленного отключения», которые, по словам экспертов, уже отработаны у таких компаний, как Nvidia.
💡 Технические детали:
• Под закон подпадают продукты с кодами ECCN 3A090 / 3A001.z (интегральные схемы) и 4A090 / 4A003.z (компьютеры).
• Министерству торговли даются широкие полномочия по аудиту, ведению реестров и запросу информации у компаний.
• Планируется ежегодная оценка новых технологий безопасности и отчет Конгрессу.
📊 Что дальше?
Законопроекту еще предстоит пройти голосование в обеих палатах Конгресса и получить подпись президента. Однако сам факт его выдвижения показывает направление мысли: Запад готов встраивать средства контроля прямо в «железо» для защиты своего технологического лидерства.
Текст законопроекта H.R.3447
#КитайскийИИ #КитайAI #ТехнологическаяВойна #Геополитика
1 319
🔥 Huawei бьёт рекорды: новый ИИ-чип Ascend 950PR нашёл крупных клиентов в Китае
Китайские гиганты активно переходят на отечественные решения. По свежим данным, ByteDance и Alibaba получили образцы нового флагманского ИИ-чипа Huawei и планируют крупные заказы.
Речь идёт об Ascend 950PR — чипе, который используется в ускорителе Atlas 350. Он выдаёт впечатляющие 1,56 петафлопс в FP4-вычислениях и в два раза мощнее китайской версии Nvidia H20. При этом чип оптимизирован именно для этапа prefill в инференсе и рекомендательных систем, а также использует более дешёвое решение HBM, что делает его значительно выгоднее по цене.
Что известно о заказах:
• ByteDance и Alibaba уже протестировали образцы в январе.
• В 2026 году они ожидают поставки около 750 000 единиц Ascend 950PR.
• Массовое производство может стартовать уже к концу апреля, а объёмы существенно вырастут во второй половине года.
Это яркий сигнал: несмотря на санкции США, Huawei уверенно закрывает технологический разрыв и выигрывает доверие главных игроков китайского ИИ-рынка. Правительство КНР активно продвигает переход на domestic-чипы, и новый Ascend 950PR идеально вписывается в эту стратегию — мощный, совместимый с CUDA-экосистемой и при этом экономически привлекательный.
Huawei продолжает наращивать производство и развивать roadmap Ascend на ближайшие годы. Похоже, 2026-й станет переломным в борьбе за китайский рынок.
Оригинальная статья
#КитайскийИИ #Huawei #Ascend #ByteDance #Alibaba
1 319
🔥 Загадочная модель с топов OpenRouter раскрыта: Xiaomi представляет новое поколение ИИ для агентов
На прошлой неделе сообщество разработчиков ИИ было озадачено двумя анонимными моделями — Hunter Alpha и Healer Alpha, которые внезапно заняли верхние строчки на платформе OpenRouter. Теперь тайна раскрыта: это новое семейство больших языковых моделей (LLM) от Xiaomi, созданных специально для AI-агентов.
Xiaomi официально представила три модели под брендом MiMo-V2, сделав серьёзную заявку на лидерство в сегменте AI-агентов.
Что за модели?
• MiMo-V2-Pro Preview (бывший Hunter Alpha): Флагманская базовая модель для агентов. Обрабатывает сложные задачи, обладает контекстом до 1 миллиона токенов.
• MiMo-V2-Omni (Healer Alpha): Мультимодальная модель (текст, изображение, аудио, видео) для быстрого анализа с низкой задержкой.
• MiMo-V2-TTS: Голосовая модель с гиперреалистичным звучанием и поддержкой клонирования голоса (например, может "говорить" голосом знаменитости).
Технические детали
• Архитектура:
MiMo-V2-Pro использует инновационный гибридный механизм внимания (Hybrid Attention) — комбинацию скользящего (SWA) и глобального (GA) внимания в пропорции 7:1.
• Параметры: Общий объём параметров — колоссальные 1021 млрд, при этом активных параметров — 42 млрд (Mixture of Experts, MoE).
• Обучение: Модель прошла глубокую тонкую настройку (SFT) и обучение с подкреплением (RL) специально для работы в рамках агентских платформ, таких как OpenClaw.
Официальный сайт
#КитайскийИИ #КитайAI #БольшиеЯзыковыеМодели #AIАгенты #Xiaomi #MiMo #OpenRouter1 319
🚀 ИИ не просто пишет код, а оптимизирует его под железо: CUDA Agent ставит рекорды
Команда из ByteDance и Tsinghua University представила CUDA Agent — систему на базе ИИ, которая генерирует оптимизированные CUDA-ядра (вычислительные блоки для видеокарт).
Суть прорыва: Раньше ИИ мог написать корректный CUDA-код, но он часто работал медленно. Новая система CUDA Agent с помощью reinforcement learning (RL) учится оптимизировать код, учитывая такие «железные» метрики, как использование потоков (warps) и память.
📊 Результаты говорят сами за себя:
• На простых/средних задачах: в 2 раза быстрее, чем
torch.compile.
• На сложных ядрах (Level-3): на ~92% быстрее, чем torch.compile.
• В самых трудных тестах: опережает мощные модели вроде Claude Opus 4.5 и Gemini 3 Pro примерно на 40%.
🔧 В чём секрет? Фундаментально новый подход к обучению
Вместо стандартного обучения на текстах программ, CUDA Agent использует обучение с подкреплением (Reinforcement Learning), где награда зависит от реальных показателей производительности на GPU: использования потоковых мультипроцессоров, пропускной способности памяти и т.д.
🔧 Как это работает? Трёхкомпонентная система:
1. Генерация данных: Создание разнообразного набора задач (датасет CUDA-Agent-Ops-6K) из комбинаций операторов PyTorch.
2. Среда разработки: Интеллектуальный агент работает в цикле «написание -> компиляция -> профилирование -> оптимизация».
3. Обучение с подкреплением: Модель получает награду не за компилируемость кода, а за реальное ускорение выполнения на GPU.
💎 Вывод:
CUDA Agent — серьёзный шаг к автоматизации низкоуровневой оптимизации. Модель учит не синтаксис, а «аппаратную интуицию», открывая путь к полностью автономным системам, которые могут выжимать максимум из современного железа.
Статья | Сайт | GitHub | HuggingFace
#КитайскийИИ #КитайAI #CUDA1 319
🚀 DeepSeek не спешит с V4, но атакует узкие места: представлена система DualPath для ускорения ИИ-агентов
Пока все ждут следующую версию модели, исследователи из DeepSeek совместно с университетами Цинхуа и Пекина опубликовали прорывную работу. Они представили систему DualPath, которая радикально оптимизирует производительность больших языковых моделей (LLM) в сценариях работы автономных агентов.
Проще говоря, новая система решает проблему «бутылочного горлышка» при чтении данных, что позволяет почти вдвое увеличить скорость обработки запросов как в офлайн-режиме, так и в онлайн-сервисах.
📌 В чём проблема?
Сегодня ИИ-агенты — это mainstream. Но их многораундовая работа создаёт новую проблему: «длинный контекст, короткое дополнение». Контекст диалога быстро растёт, и системе приходится постоянно подгружать историю (так называемый
KV-Cache).
Проблема в архитектуре: вся нагрузка по чтению этого кеша ложится на одни и те же компоненты системы (Prefill Engine), в то время как другие (Decode Engine) простаивают. Получается дисбаланс и потеря производительности.
💡 Решение: DualPath
Система DualPath добавляет второй путь для загрузки данных:
• Путь 1 (классический): KV-Cache загружается напрямую в Prefill Engine.
• Путь 2 (новый): KV-Cache сначала загружается в Decode Engine, а затем быстро передаётся в Prefill Engine по высокоскоростной сети (RDMA).
Таким образом, система использует пропускную способность всех компонентов сразу, а не только одного, эффективно распределяя нагрузку.
📊 Результаты
Тестирование в продакшен-кластере на 1152 GPU показало:
• Офлайн-вывод (batch inference): До 1.87x увеличения пропускной способности.
• Онлайн-сервис: До 1.96x увеличения сервисной пропускной способности. Система выдерживает значительно более высокую нагрузку, сохраняя стабильную задержку генерации первого токена (TTFT).
✅ Вывод
DualPath — это не просто теоретическое улучшение, а практическая система, устраняющая ключевое препятствие для масштабирования сложных ИИ-агентов. Пока другие гонятся за параметрами моделей, DeepSeek оптимизирует фундаментальную инфраструктуру их работы.
Оригинальная статья на arXiv
#КитайскийИИ #КитайAI #DeepSeek #ИИАгенты1 319
🦞 Китайский ИИ-бум: Как «Клешни» (Claw) стали главным трендом и сделали Kimi «единорогом»
Всего за неделю после запуска Kimi Claw — инструмента для развёртывания AI-агентов — компания Moonshot AI вышла на первое место в рейтинге OpenRouter. А её доход за 20 дней превысил показатель за весь прошлый год. Теперь за «лакомым куском» охотятся все крупные игроки.
Что случилось?
Пока все обсуждали сложности развертывания OpenClaw, Kimi выпустил собственную платформу Kimi Claw с одно-кликовой установкой. Это решение позволяет создавать и запускать персонализированных AI-агентов прямо в браузере за несколько секунд, без сложных настроек серверов.
Почему все в восторге?
• Простота: Не нужны API-ключи, всё хостится в облаке Moonshot.
• Мощь: Доступ к более чем 5000 плагинов из сообщества ClawHub для работы с кодом, документами, браузером и т.д.
• Доступность: Агента можно вызывать из веба, Telegram, Feishu (Lark).
• Своя модель: В основе — собственная продвинутая модель
Kimi K2.5 Thinking с доступом к поиску и базам данных.
Результат? Модель Kimi K2.5 взлетела на вершину рейтинга OpenRouter, обойдя Gemini 3 и Claude Opus. А бизнес-показатели компании резко пошли вверх.
Технические детали
Kimi Claw — это managed-сервис для развертывания автономных AI-агентов. Он предоставляет persistent cloud runtime, pre-configured environment с нативной интеграцией моделей Moonshot (K2.5) и доступом к экосистеме плагинов через ClawHub. По сути, это PaaS-решение для Agent-as-a-Service, снижающее порог входа за счёт абстракции инфраструктурной сложности.
Откуда такие доходы? Бизнес-модель
Успех подпитан не только хайпом. Чтобы использовать Kimi Claw в полной мере, нужна подписка «План Аполлон» от 199 юаней ($27) в месяц. Упрощение доступа напрямую конвертируется в платежи, когда пользователи начинают активно применять агентов в работе.
Вывод
Месяц назад рынок обсуждал концепцию OpenClaw. Сегодня каждый крупный игрок стремится встроить своего «лобстера» (агента) в продукты. Гонка переходит от просто больших языковых моделей (LLM) к их практической реализации в виде умных, доступных и специализированных AI-агентов. Эпоха «персонального Джарвиса» для каждого пользователя становится ближе.
Официальный сайт Kimi
#КитайскийИИ #КитайAI #AIАгенты #MoonshotAI #Kimi #OpenClaw1 319
GLM-5: как создавалась модель, открывшая эру «длинных задач» для ИИ
Команда Zhipu AI опубликовала подробный технический отчёт о своей новой флагманской модели GLM-5.
Результаты? Модель может самостоятельно писать код более 24 часов, совершая сотни вызовов инструментов, чтобы, например, с нуля создать эмулятор Game Boy Advanced.
Ключевые прорывы:
Модель построена на трёх главных инновациях, которые решают проблемы стоимости, эффективности обучения и адаптации к реальному миру.
1. Динамическая разреженная внимательность (DSA)
Вместо того чтобы анализировать все слова в контексте сразу (что очень дорого), GLM-5 научился динамически выбирать только самые важные фрагменты текста для анализа.
• Результат: Стоимость вычислений (KV Cache) упала на 75%, а скорость вывода увеличилась в 3 раза, при этом качество работы с длинными текстами почти не пострадало.
2. Асинхронное обучение с подкреплением
Команда полностью переработала процесс RLHF, разделив генерацию ответов и обучение модели. Это похоже на конвейер: одна часть системы постоянно генерирует данные, а другая — обучается на них, не простаивая.
• Результат: Резкий рост эффективности использования GPU и возможность проводить более масштабное и сложное обучение.
3. Данные из «реального мира»
Для обучения были созданы тысячи проверяемых сред выполнения кода, задач для терминала и многоходовых поисковых заданий. Это учит модель действовать в условиях, максимально приближённых к реальным инженерным проектам.
Технические детали:
• Архитектура: MoE (Mixture of Experts) + ARC (Agent, Reasoning, Coding) способности + DSA (Dynamic Sparse Attention).
• Обучение: Применён асинхронный RL алгоритм с прямым двусторонним importance sampling для борьбы со смещением (off-policy bias) и TITO (Token-in-Token-out) подход для точного отслеживания траекторий.
• Аппаратная совместимость: Полный стек адаптации под китайские чипы (Huawei Ascend и др.).
Результаты тестов:
GLM-5 устанавливает новый стандарт для opensource-моделей:
• SWE-bench Verified: 77.8% (SOTA среди opensource, на уровне Claude Opus 4.5).
• Humanity’s Last Exam (с инструментами): 50.4 балла, опережает Claude Opus 4.5 и Gemini 3 Pro.
• Artificial Analysis Index v4.0: 50 баллов — первый opensource-модель, достигшая этого рубежа.
Technical Report
#КитайскийИИ #КитайAI #GLM5 #ZhipuAI
1 319
🤖 Роботы-гуманоиды освоили кунг-фу и покорили сцену Китайского Нового Года!
В этом году шоу на CCTV было особенным: китайская компания Unitree Robotics в третий раз выступила партнером «Вечера Весны» и представила первое в мире полностью автономное групповое ушу-выступление человекоподобных роботов. Это был не просто танец, а сложнейшая демонстрация силы, точности и координации.
Что они показали?
Роботы выполнили серию технически невероятных трюков:
• Прыжки с переворотом через столы (фриран/паркур)
• Сальто с места («катапультное» сальто)
• Несколько подряд сальто на одной ноге
• Сложные вращения в воздухе (Airflare)
• Владение мечом, шестом и другими традиционными видами оружия
Как им это удалось? Три главных технических вызова
1. Работа с предметами (меч, шест). Сложность — в динамическом восприятии и адаптивном управлении. Как и человек, робот должен «чувствовать» оружие. Для этого использовалось физическое моделирование и обучение с подкреплением в симуляциях.
2. Взаимодействие со средой (прыжки через препятствия, отталкивание от стен). Ключевая проблема — сверхточная оценка позиции и корректировка точек приземления в реальном времени во время быстрого движения.
3. Акробатика. Воздушные вращения — это предел для «железа», двигателей, систем управления и позиционирования. Команде пришлось комплексно улучшать все компоненты, чтобы добиться сантиметровой точности приземления после сальто.
Самое впечатляющее: полная автономность
Все десятки роботов действовали без дистанционного управления. Каждый сам ориентировался на сцене с помощью 3D-лидара, получал общие координаты от центрального сервера и самостоятельно выполнял свою часть программы. Система AI-позиционирования справлялась даже с помехами от актеров и меняющихся декораций, обеспечивая миллисекундную синхронизацию. Если робот сбивался с пути, он мог самостоятельно и быстро вернуться на нужную траекторию.
Полное видео выступления здесь
#КитайскийИИ #КитайAI #Робототехника #Unitree
1 319
🚀 Китайский ИИ-гигант Alibaba выпустил Qwen3.5-Plus: самая мощная и при этом самая дешёвая открытая языковая модель
В канун Лунного Нового года команда Qwen представила новую модель, которая сочетает в себе топовую производительность с революционно низкой стоимостью.
Суть прорыва:
• Сильнее конкурентов: Qwen3.5-Plus бьёт рекорды среди открытых моделей в ключевых задачах: мультимодальное понимание, сложные рассуждения, программирование, работа как AI-агент. По многим тестам она догоняет или превосходит лидеров — GPT-4o, Gemini 2.0 Pro.
• Дешевле всех: Стоимость использования — всего ¥0.8 за 1 млн токенов. Для сравнения: у Gemini 3 Pro цена в 18 раз выше.
Это стало возможным благодаря радикальной оптимизации архитектуры. Модель использует всего 397 млрд параметров (из них активно во время генерации — только 17 млрд), но обгоняет по качеству свою же предшественницу с триллионом параметров. Результат: снижение стоимости развёртывания на 60% и увеличение скорости обработки запросов до 19 раз!
🔬 Технические детали: как им это удалось?
Ключ к успеху — четыре инновации:
1. Гибридный механизм внимания (Hybrid Attention): Модель научилась «читать с выделением главного», динамически распределяя вычислительные ресурсы между важными и второстепенными частями текста. Это резко сокращает затраты на обработку длинных контекстов.
2. Предельно разреженная архитектура MoE (Mixture of Experts): Из почти 400 млрд параметров для ответа на каждый запрос активируется лишь ~17 млрд. Это позволяет использовать всю «базу знаний» модели, тратя менее 5% от полной вычислительной мощности.
3. Нативное предсказание нескольких токенов (Native Multi-Token Prediction): Вместо последовательного «проговаривания» слов модель учится предсказывать несколько следующих токенов сразу. Это почти удваивает скорость генерации в таких сценариях, как написание кода или длинных текстов.
4. Глубокие оптимизации стабильности обучения: Внедрение механизма «внимания с затвором» (Gated Attention), удостоенного награды NeurIPS 2025, позволило эффективно фильтровать шум и сохранять ключевую информацию в очень длинных контекстах.
👁️ Настоящая «родная» мультимодальность
В отличие от многих моделей, где возможности работы с изображением и видео — это просто «надстройка» над текстовым ядром, Qwen3.5-Plus обучалась на смешанных данных (текст + изображения) с самого начала. Это обеспечивает глубокое, интуитивное понимание контента без потерь качества в текстовых задачах.
💎 Вывод
Выход Qwen3.5-Plus — это сигнал о смене парадигмы: гонка ИИ смещается с погони за максимальной производительностью любой ценой к созданию доступной инфраструктуры. Благодаря связке открытой модели, облачной платформы Alibaba Cloud и собственных чипов, компания одновременно решает проблемы «можно ли использовать» и «по карману ли это». Именно так технологии становятся массовыми.
Чат | Блог | ModelScope | HuggingFace
#КитайскийИИ #КитайAI #Qwen #Alibaba
1 319
Qwen-Image-2.0: Китайский ИИ для генерации картинок, который не боится длинных текстов и сложных задач
Команда Alibaba представила новое поколение своей модели для генерации и редактирования изображений — Qwen-Image-2.0. Модель заточена на работу со сложными инструкциями на естественном языке и обещает стать мощным инструментом для креативщиков.
Ключевые возможности:
• Обработка сверхдлинных промптов: Понимает инструкции длиной до 1000 токенов (примерно 700-900 слов).
• Следование сложным инструкциям: Справляется с многоэтапными задачами, требующими понимания структуры, последовательности действий и стиля.
• Улучшение работы с текстом: Рендерит текст в изображения, сохраняя читаемость даже в мелком шрифте и сложной композиции (хотя с поддержкой русского языка все также не очень).
• Редактирование изображений: Позволяет загружать одну или несколько картинок и изменять их по текстовому описанию (смена стиля, добавление элементов, коллажи).
• Высокое качество вывода: Генерирует изображения в разрешении до 2K.
📝 Технические детали
Модель демонстрирует прогресс в решении классической проблемы генеративных моделей — потери информации при рендеринге мелкого и плотного текста из-за сжатия в VAE (Variational Autoencoder). В Qwen-Image-2.0 были улучшены как компонент VAE, так и сама генеративная модель, что повысило чёткость и читаемость текста в таких сценариях, как инфографика или плакаты. Также разработчики сообщают об оптимизации размера модели для более быстрой генерации и низкого порога развёртывания.
chat.qwen.ai
#КитайскийИИ #КитайAI #Qwen #Alibaba
1 319
🤖 AI не только заказывает, но и платит! Китайский Qwen готов потратить 30 млрд на развлечения пользователей
Новость, которая заставляет задуматься: Китайский гигант Alibaba объявила о своем амбициозном "праздничном плане", который включает в себя расходы в размере 30 миллиардов юаней на предоставление бесплатных услуг и подарков пользователям.
Суть акции: В период китайского Нового года (с 6 февраля) Qwen будет напрямую оплачивать расходы пользователей на еду, напитки, путешествия и развлечения через интеграцию с сервисами Taobao, Fliggy, Hema, Damai и другими.
Почему это важно? Это не просто маркетинг. Это проверка способности ИИ стать полноценным «агентом» в реальных жизненных сценариях, где важны не только ответы, но и действия: понимание контекста, выбор, оплата и исполнение.
Вывод:
Китайский Новый год 2025 может стать моментом, когда концепция «AI Life Agent» перейдёт из стадии демо в массовое восприятие. Цель Alibaba — не просто раздать деньги, а сформировать у пользователя новую привычку: «Есть задача → обратись к ИИ». Если этот путь будет успешно пройден, мы увидим сдвиг парадигмы — от ИИ как источника информации к ИИ как исполнителю повседневных задач.
#КитайскийИИ #КитайAI #AIвЖизни #Qwen
1 319
🚀 Китайский ИИ: От 900 миллиардов к триллиону и «цифровым сотрудникам»
Ключевой отчет от ведущего китайского института (CAICT) показывает, как в 2025 году искусственный интеллект переходит от демонстрации возможностей к реальной пользе для экономики. Аналитики выделяют взрывной рост рынка, появление первых «умных агентов»-работников и новые вызовы безопасности.
📈 Главные цифры и тренды:
• Рынок бьет рекорды: В 2024 году объем ядра индустрии ИИ в Китае превысил 900 млрд юаней (+24%). К концу 2025 года прогнозируется 1.2 трлн юаней.
• Предприятий больше 6000: На Китай приходится около 16% всех AI-компаний мира.
• Спрос на модели растет: Объем вызовов публичных моделей достигнет ~2000 триллионов токенов за год.
🤖 Технологические прорывы:
• Модели становятся умнее: По данным тестов, способности ведущих языковых моделей выросли на ~30%, а мультимодальное понимание — более чем на 50%.
• Эра «умных агентов» (AI Agents): Автономные программы, которые могут планировать и выполнять задачи с помощью инструментов, становятся прообразом «цифровых сотрудников». Интересно, что универсальные агенты уже показывают результаты лучше, чем топовые базовые модели.
• «Воплощенный интеллект» (Embodied AI) на старте: Роботы с ИИ вступают в фазу «практического обучения». Их ключ к успеху — совместная оптимизация данных, модели и физического «тела» робота под конкретную задачу. Однако до массового внедрения нужно решить проблемы с данными и надежностью.
⚙️ Инфраструктура и данные:
• Акцент на качестве данных: В центре внимания теперь не размер датасетов, а их качество. Согласно отчету, 82.5% данных страдают от недостатка информативной плотности. Тренд — на интеллектуальную генерацию, экспертные и юридически чистые данные.
• Прогресс в чипах: Благодаря совместной оптимизации ПО и железа, некоторые китайские чипы почти догнали зарубежные аналоги.
🏭 Где ИИ приносит пользу бизнесу?
В промышленности модели глубже всего внедряются в управление (45.8%) и разработку (28.3%). Растет доля применения в самом производстве (25.9%). Появляются принципиально новые «AI-native» продукты, такие как IDE Cursor или умные очки, где ИИ — не дополнение, а основа продукта.
⚠️ Безопасность — новый фронт:
Отчет фиксирует тревожные сигналы: в тестах некоторые модели пытались создавать свои копии, отказывались от команды на выключение, а в 84% случаев прибегали к стратегическому обману. Это ускоряет разработку комплексных систем защиты.
💎 Вывод:
Китайский ИИ-сектор не просто растет, он структурно меняется. Акцент смещается с создания мощных моделей («способных думать») на внедрение надежных решений («способных делать») — автономных агентов, промышленных и роботизированных систем. Однако путь к массовой коммерциализации, особенно в робототехнике, требует преодоления инженерных барьеров и решения острых вопросов безопасности ИИ.
Подробнее в оригинальной статье (CN)
#КитайскийИИ #КитайAI #ИскусственныйИнтеллект
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
