Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 258 Technologies & Applications323...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 297 620 subscribers, ranking 323 in the Technologies & Applications category and 1 258 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 297 620 subscribers.

According to the latest data from 13 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -7 002 over the last 30 days and by -157 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.06%. Within the first 24 hours after publication, content typically collects 5.70% reactions from the total number of subscribers.
Post reach: On average, each post receives 24 001 views. Within the first day, a publication typically gains 16 986 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 182.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 14 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

297 620

Subscribers

-15724 hours

-1 5127 days

-7 00230 days

24 001

Post views

~ 16 98624 hours

~ 19 16148 hours

8.06%

Engagement rate

~ 6

Posts per day

Ads index

beta

Posts Archive

297 580

🌟 Xiaomi релизнула 3 модели: LLM, омнимодальную и TTS. 🟡MiMo-V2-Pro Флагман. Триллион параметров суммарно, 42 млрд. активных при инференсе, архитектура MoE с гибридным вниманием и контекстным окном в 1 миллион токенов. До официального анонса модель тестировалась на OpenRouter под именем Hunter Alpha. 🟢Artificial Analysis Intelligence Index - 49 баллов, это 8 место в мире и 2 среди китайских LLM. 🟢PinchBench - 84,0 (3 место, сразу за Claude Sonnet 4.6). 🟢ClawEval - 61,5, тоже 3 место, выше GPT-5.2. Реальная агентская эффективность на GDPval-AA: Elo 1434 (лучший результат среди китайских моделей). Цена API: $1 вход / $3 выход за млн. токенов при контексте 256K и $2 вход / $6 выход для контекста 256К-1М. 🟡 MiMo-V2-Omni Принимает текст, изображения, видео и аудио через единую базу с отдельными энкодерами для каждой модальности. Параметры не раскрыты. Модель поддерживает непрерывную обработку аудио длиной свыше 10 часов в одном запросе. 🟢MM-BrowserComp - 52,0, на GPDVal AA - 1435, оба выше Gemini 3 Pro. Цена: $0,40 вход / $2,00 выход.

На демонстрации модель прошла цикл онлайн-покупки автономно: нашла отзывы на Xiaohongshu, сравнила продавцов на JD.com, поторговалась с поддержкой, оформила заказ. Второе демо: получила одно текстовое задание, сняла 15-секундный ролик из 4 сцен, синтезировала звук, исправила ошибку рендеринга шрифта, загрузила на TikTok и опубликовала.

🟡MiMo-V2-TTS Модель обучена на сотнях миллионов часов аудио, и допилена через многомерный RL. Синтезирует речь с управлением эмоциями на уровне отдельных предложений, поёт с сохранением высоты и ритма, воспроизводит китайские диалекты: сычуаньский, хэнаньский, кантонский, тайваньский. Поддержка других языков не заявлена. Форматные маркеры в тексте: пунктуацию, частицы и выделение сама переводит в просодику без дополнительной разметки. Доступ на ограниченный период - бесплатно. Сроки предложения не указаны.

Кстати, команду MiMo возглавляет Ло Фули, один из ключевых авторов DeepSeek R1.

Все модели релиза доступны через API на platform.xiaomimimo.com и в MiMo Studio. @ai_machinelearning_big_data #news #ai #ml

297 580

Repost from Анализ данных (Data analysis)

⚡️ Загадочная модель Hunter Alpha появилась в сети и уже наделала много шума По данным Reuters, на OpenRouter внезапно обнаружили новую ИИ-модель под названием Hunter Alpha. И самое интересное - это может быть не просто ноунейм 👇 Есть слухи, что это скрытая тестовая версия DeepSeek V4. Что известно на данный момент: - около 1 триллиона параметров - контекст до 1 миллиона токенов - стиль рассуждений очень похож на chain-of-thought, как у DeepSeek Во время тестирования модель сама указала: - обучалась преимущественно на китайских данных - knowledge cutoff — май 2025 И это практически полностью совпадает с тем, что ранее заявляли про DeepSeek. Что это может быть: 👉 ранний тест перед релизом 👉 “тихий” запуск без анонса 👉 или хорошо замаскированная модель Но главное здесь другое: рынок снова движется в сторону гигантских моделей + длинного контекста + сильного reasoning И если это действительно DeepSeek V4 - нас ждёт новый скачок в возможностях ИИ. 👉 https://www.reuters.com/business/media-telecom/mystery-ai-model-has-developers-buzzing-is-this-deepseeks-latest-blockbuster-2026-03-18/ 🎯Полезные Мл-ресурсы 🚀 Max @data_analysis_ml

297 580

✔️ Nvidia выпустит инференс-чипы на базе архитектуры Groq для Китая. Nvidia готовит к майскому релизу новую версию ИИ-ускорителей, построенных на технологиях стартапа Groq, которые компания лицензировала в прошлом году. Новинка предназначена исключительно для инференса. На глобальном рынке Nvidia планирует использовать чипы Groq в связке с будущей архитектурой Vera Rubin. Поскольку экспорт этих флагманов в КНР запрещен, китайскую версию Groq адаптируют для интеграции со сторонними системами. При этом источники Reuters говорят, что аппаратная производительность новых процессоров не урезалась. Параллельно Дженсен Хуанг объявил о возобновлении производства H200. Компания получила экспортные лицензии от администрации США и уже принимает заказы из Китая. reuters.com ✔️ MiniMax выпустила самоэволюционирующую модель M2.7. M2.7 - первая модель MiniMax, которая способна самостоятельно улучшать свои алгоритмы и рабочие процессы. За время разработки система прошла более 100 циклов автономной оптимизации, что повысило ее производительность на 30%. Новинка позиционируется для сложных задач кодинга и построения многошаговых ИИ-агентов. В бенчмарке SWE-Pro модель показала уровень Claude 3.5 Sonnet, а ее рейтинг ELO на GDPval-AA достиг 1495. Помимо кодинга, M2.7 работает с офисными форматами: редактирует документы Word, Excel и PowerPoint, сохраняя исходную верстку даже после серии глубоких правок. Модель поставляется в 2 вариантах: базовая версия и M2.7-highspeed со скоростью генерации до 100 токенов в секунду. Стоимость API - 30 центов за миллион входящих и 1,20 доллара за миллион исходящих токенов. M2.7 уже поддерживается в Cursor, Cline и Ollama, а также доступна в фирменном приложении MiniMax Agent. minimax.io ✔️ Perplexity запустила Comet Enterprise. ИИ-поисковик выпустил корпоративную версию своего браузера, ориентированную на безопасную автоматизацию рабочих процессов в компаниях. С помощью Comet Enterprise сотрудники могут прямо из браузера делегировать рутину: анализировать контракты на предмет рисков, собирать контекст для встреч, делать вычисления на основе финансовых отчетов и автоматизировать поиск контактов в LinkedIn. Безопасность усилена интеграцией с платформой CrowdStrike Falcon. Она на лету блокирует фишинг, вредоносное ПО и предотвращает утечки данных. Инструмент уже включен в корпоративную подписку Perplexity. perplexity.ai ✔️ Google крупно обновила Stitch. Google Labs представило новую версию платформы Stitch, генеративного инструмента для создания UI-макетов по текстовому описанию. Главной фишкой стал бесконечный ИИ-холст, принимающий на вход текст, код и картинки. На нем ИИ-агент анализирует историю проекта и может параллельно развивать сразу несколько визуальных концепций. Теперь Stitch умеет превращать статические экраны в кликабельные прототипы, самостоятельно генерируя промежуточные шаги пользовательского пути при взаимодействии с элементами. Платформа также получила поддержку MCP, прямую выгрузку в среды AI Studio и Antigravity и голосовое управление холстом в реальном времени. blog.google ✔️ OpenAI хантит таланты через конкурс Parameter Golf. Компания открыла публичное соревнование для исследователей с крайне жесткими техническими ограничениями. Участникам предстоит создать максимально эффективную языковую модель, при этом размер весов вместе с кодом для обучения не должен превышать 16 МБ. На сам процесс тренировки отводится строго до 10 минут на кластере из восьми видеокарт H100. Эффективность алгоритмов будет оцениваться на сете FineWeb. Цель челленджа - поиск нестандартно мыслящих инженеров. Авторы лучших проектов получат приглашения на собеседование. Дополнительным стимулом станет призовой фонд в 1 млн. долларов, который распределят в виде грантов на аренду копьюта у провайдера Runpod. На GitHub уже опубликованы базовые решения, проверочные скрипты и публичный лидерборд. Принять участие в конкурсе можно до 30 апреля. openai.com @ai_machinelearning_big_data #news #ai #ml

297 580

⚡️ Mistral выпустила Small 4. Mistral Small 4 - это мультимодальный комбайн, который закрывает сразу три задачи: ризонинг, агентный кодинг и работу с изображениями. Раньше под каждую из них была отдельная модель: Magistral, Devstral и Pixtral. Теперь один чекпоинт, 🟡Архитектура MoE с 128 экспертами, из которых на каждый токен активируются 4. Всего 119B параметров, активных - 6B на токен. Контекстное окно - 256 тыс. токенов. По сравнению с Mistral Small 3 в новой версии задержка сократилась на 40%, пропускная способность выросла в 3 раза. Ключевая фича - параметр reasoning_effort. Если поставить none будет быстрый чат-режим, как в Small 3.2, а с ключом high модель начнет разворачивать цепочку рассуждений, сопоставимую с Magistral. Переключение в рантайме, без смены модели. 🟡Тесты Small 4 с включенным reasoning обходит GPT-OSS 120B на LiveCodeBench и генерирует при этом на 20% меньше токенов. На AA LCR набирает 0.72 при длине ответа 1.6K символов. Для сравнения, модели Qwen для тех же результатов нужно от 5.8K до 6.1K.

Для self-hosted деплоя минимальный стенд - 4× NVIDIA HGX H100, 2× HGX H200 или 1× DGX B200.

Попробовать бесплатно можно на build.nvidia.com, через Mistral API или AI Studio. 📌 Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей @ai_machinelearning_big_data #AI #ML #LLM #MistralSmall4 #MistralAI

297 580

Открыта регистрация на главную конференцию этой весны по технологиям ИИ и анализу данных — Data Fusion* 2026! 💙 Шестая ежегодная конференция Data Fusion пройдет 8–9 апреля в Москве в инновационном кластере «Ломоносов». 60+ актуальных сессий, докладов, примеров, дискуссий по теме анализа данных/ науки о данных/ машинного обучения. Среди тем – ИИ-агенты, «обучение с подкреплением», компьютерное зрение, обработка естественного языка, открытый исходный код, воплощенный ИИ и робототехника, рекомендательные системы, применение ИИ в кибербезопасности, ИИ+ естественные науки, AgentOps и многое другое! Всю программу ищите на сайте. Конференция объединит лидеров команд по машинному обучению, специалистов по обработке данных, молодых ученых, инженеров, аналитиков и руководителей, принимающих решения о внедрении технологий в бизнес и государственные сервисы. Среди спикеров конференции: Суржко Денис (ВТБ), Оселедец Иван (AIRI), Райгородский Андрей (МФТИ), Бурнаев Евгений (Сколтех,AIRI), Саркисов Тигран (Х5), Крайнов Александр (Яндекс), Зима Андрей (Ростелеком) и другие эксперты из науки и индустрии. Все мы любим конференции не только ради знаний, но и, конечно, ради живого общения и новых знакомств, а это важная часть Data Fusion! ➡ Не пропустите, регистрируйтесь. *Интеграция данных Информация о рекламодателе

297 580

✔️ Dispatch в Claude Cowork: управление Claude на ПК со смартфона. Dispatch позволяет отправить задание на Mac или Windows в приложение Claude Cowork через мобильное приложение. В мобильном приложении появляется лента обновлений в реальном времени: Claude сообщает о завершенных этапах и запрашивает подтверждение на критичные действия. Данные остаются на устройстве пользователя и не передаются на серверы Anthropic. Типичные сценарии для Dispatch: собрать отчет из документов в папке, разобрать «Загрузки» по типам и датам, сконвертировать скриншоты чеков в таблицу Excel или сделать выжимку по нескольким статьям в одном документе. Функция пока доступна подписчикам плана Claude Max. Для работы на компьютере должно быть установлено и запущено приложение Claude Desktop, привязанное к мобильному устройству через настройки. Расширение на план Pro анонсировано, сроки не уточняются. @ai_machinelearning_big_data #news #ai #ml

297 580

Распознай, кто говорит, и выиграй 600 тысяч рублей! 💙 ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр»! ❗️Задача — разработать модель распознавания по голосу, устойчивую к искажениям аудиосигнала. Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука: 🔹искажения, вносимые акустической средой; 🔹посторонние шумы; 🔹реверберация; 🔹большое расстояние до микрофона; 🔹искажения каналов связи. Участвуй, и ты сможешь: 🟦получить шанс разделить призовой фонд в 600 000 рублей; 🟦разработать решения в области Audio/Speech ML; 🟦прокачать скиллы в Speaker Recognition и Deep Learning. 👆 Регистрируйтесь до 10 апреля включительно! Подписывайтесь на телеграм-канал «Криптонит. Разработка, наука, шифрование» — там много всего интересного.

297 580

✔️ Американские сенаторы потребовали от ByteDance закрыть видеогенератор Seedance. Сенаторы Конгресса США направили письмо CEO ByteDance с требованием немедленно остановить работу Seedance 2.0. По их словам, это наиболее очевидный случай нарушения авторских прав среди продуктов ByteDance: приложение генерирует видео с реальными людьми и персонажами без разрешения правообладателей. В письме сенаторы привели примеры: ролики с Томом Крузом, Брэдом Питтом и персонажами сериала «Очень странные дела». ByteDance ответил стандартно: компания уважает интеллектуальную собственность и уже принимает меры для усиления защиты. Ситуация отражает нарастающее давление Конгресса на ИИ-компании, особенно китайские. При этом законодательного регулирования отрасли в США до сих пор нет. cnbc.com ✔️ Mistral AI запускает корпоративную платформу обучения ИИ-моделей полного цикла. Новое решение, Forge, позволяет компаниям разрабатывать и улучшать модели на собственных закрытых данных. Платформа поддерживает весь ML-пайплайн от претрейна до SFT, DPO и тонкой настройки через RL. Инструментарий работает как с классическими плотными моделями, так и с архитектурой MoE, включая мультимодальный ввод. Развернуть тренировочные сессии можно на мощностях Mistral или на локальных GPU-кластерах. В последнем случае компания платит только за лицензию на софт, а Mistral не имеет никакого доступа к обучающей выборке. В Forge также встроены конвейеры для сбора и генерации синтетических данных. Платформа спроектирована по принципу «agent-first». Forge предоставляет программные интерфейсы, с помощью которых автономные ИИ-агенты (встроенный Mistral Vibe) могут самостоятельно планировать задачи, запускать обучающие эксперименты и подбирать оптимальные гиперпараметры без прямого участия инженеров. mistral.ai ✔️ Google AI Studio обновил тарифы Gemini API и добавил лимиты расходов. В Google AI Studio появились Project Spend Caps. Теперь можно задать жесткий месячный бюджет на Gemini API для каждого конкретного проекта. Поставили лимит - он работает, пока сами его не поменяете. Систему тарифов тоже поменяли. Апгрейд до следующего уровня теперь происходит автоматом. Больше пользуетесь API, платите без задержек - получаете больше квот. Заодно Google снизил минимальные требования расходов для перехода на высокие уровни. Из других обновлений: настройка биллинга теперь доступна прямо в Google AI Studio без переключения между вкладками, появились дашборды для мониторинга rate limits (RPM, TPM, RPD), суточной разбивки расходов по проектам и моделям, а также детальной статистики по токенам и ошибкам. Google AI Studio в сети Х ✔️ Manus сделал десктопное приложение My Computer. Вслед за Perlpexity, Manus анонсировал ИИ-агента, который работает напрямую с файлами и приложениями на ПК. Агент выполняет команды в терминале: сортирует файлы, переименовывает документы, запускает приложения, пишет код и умеет использовать локальный GPU для обучения моделей или инференса. Manus интегрирован с Gmail и Google Calendar — это позволяет строить сценарии, где агент берёт файл с локального диска и сразу отправляет его по почте. Каждая команда требует подтверждения пользователя: можно разрешить выполнение один раз или добавить задачу в список доверенных. Приложение доступно для macOS и Windows. manus.im ✔️ Rakuten релизнула японскую модель и сразу попала в скандал. Компания опубликовала Rakuten AI 3.0 - языковую модель для японского языка. В пресс-релизе заявлено, что модель превосходит GPT-4 в ряде бенчмарков: знание японской культуры, истории и следование инструкциям. В основе - открытые модели сообщества и собственные данные Rakuten. Однако, пользователи в X нашли в конфигурационном файле на Hugging Face строку, явно указывающую на Deepseek. Помимо этого, в ответах на чувствительные вопросы модель демонстрирует скорее прокитайскую, чем прояпонскую позицию. Это вызвало волну критики: действительно ли модель является японской разработкой, если в ее основе лежит DeepSeek. Rakuten пока не дала официальных пояснений. rakuten.com @ai_machinelearning_big_data #news #ai #ml

297 580

⚡️ OpenAI выпустила GPT-5.4 mini - новый быстрый и компактный вариант GPT-5.4. Модель уже доступна в: • ChatGPT • Codex • OpenAI API 🚀 в 2 раза быстрее GPT-5 mini По словам OpenAI, это самая мощная mini-модель компании, которая почти догоняет полноценный GPT-5.4 по возможностям, но работает быстрее и дешевле. Также представлена версия GPT-5.4 nano - самая маленькая и дешёвая модель для задач вроде: - классификации - извлечения данных - ranking - coding-агентов https://openai.com/index/introducing-gpt-5-4-mini-and-nano/ @ai_machinelearning_big_data #openai #ai #ml #chatgpt

297 580

✔️ Anthropic запустила сертификацию для инженеров. Anthropic открыла программу Claude Certified Architect, технический экзамен для разработчиков и архитекторов решений, работающих с Claude API, Claude Code, Agent SDK и MCP. Экзамен состоит из 60 вопросов с выбором ответа, на которые отводится 2 часа. Пересдача и внешние материалы не допускаются. Результаты приходят в течение двух рабочих дней с разбивкой по 5 направлениям: агентная архитектура, настройка Claude Code, промпт-инжиниринг, интеграция с MCP и управление контекстом. Пока сертификация доступна только сотрудникам компаний из партнерской сети Anthropic. Первые 5 тыс. участников сдадут экзамен бесплатно, затем стоимость составит $99 за попытку. Прошедшие получают цифровой бейдж для профессиональных платформ. anthropic.skilljar.com ✔️ NVIDIA собрала коалицию для разработки открытых моделей. NVIDIA объявила о создании Nemotron Coalition, альянса компаний, которые будут совместно разрабатывать открытые модели. В коалицию вошли Mistral AI, Black Forest Labs, Cursor, LangChain, Perplexity, Reflection AI, Sarvam и Thinking Machines Lab. Идея альянса в том, чтобы компании вложились в общий фундамент, а затем дообучали модель под свои задачи: отраслевую специфику, язык, регион. Участники сохранят независимость и продолжают развивать собственные продукты. Первым проектом запланирована базовая модель, которую разработают NVIDIA и Mistral AI. Остальные участники предоставят данные, экспертизу и системы оценки. Модель обучат на NVIDIA DGX Cloud, после чего передадут в открытый доступ, она ляжет в основу семейства NVIDIA Nemotron 4. nvidianews.nvidia.com ✔️ Mistral выпустила открытый агент для доказательств на Lean 4. Leanstral - первый open-source агент для работы с системой формальных доказательств Lean 4. Модель содержит 119B общих параметров при 6B активных. За счет разреженной архитектуры она работает быстро и дешево. Агент обучен не на олимпиадных задачах, а на реальных репозиториях с формальными доказательствами. На бенчмарке FLTEval модель набирает 26,3 балла при двух попытках, это на 2,6 балла выше Claude Sonnet при стоимости $36 против $549. Claude Opus остается сильнее (39,6 балла), но обходится в $1650 (в 46 раз дороже). Модель доступна через Mistral Vibe, API и на HuggingFace под лицензией Apache 2.0. mistral.ai ✔️ Alibaba объединила ИИ-разработку в единую структуру. Alibaba создала новое подразделение Alibaba Token Hub и поставила во главе него CEO Эдди Ву. Под одну крышу собрали команду Qwen, потребительские приложения, корпоративный мессенджер DingTalk и устройства Quark. Цель реструктуризации - ускорить путь от исследований до продукта и выстроить монетизацию ИИ по всей компании. На этой неделе Alibaba планирует представить ИИ-агента для корпоративных клиентов на базе Qwen, его планируют интегрировать с Taobao и Alipay. bloomberg.com ✔️ Britannica подала в суд на OpenAI. Энциклопедия и Merriam-Webster обратились в суд Манхэттена. По версии истцов, компания обучала свои модели на 100 тыс. энциклопедических статей и словарных определений, не получив согласия правообладателей. В иске утверждается, что GPT-4 запомнил значительные фрагменты контента Britannica и воспроизводит их почти дословно по запросу. Помимо нарушения авторских прав, Britannica обвиняет OpenAI в нарушении товарных знаков: ChatGPT якобы создает ложное впечатление, что издание одобрило использование своих материалов, и ссылается на него в недостоверных ответах. Компания требует компенсацию и запрет на использование контента. reuters.com @ai_machinelearning_big_data #news #ai #ml

297 580

✔️ NVIDIA GTC 2026: Ключевые анонсы. В понедельник в Сан-Хосе открылась NVIDIA GTC 2026 - ежегодная конференция компании по GPU-технологиям и искусственному интеллекту. Дженсен Хуанг открыл конференцию с тезиса, что компания видит заказы на оборудование на сумму не менее $1 трлн. до конца 2027 года - вдвое больше, чем год назад. По его словам, индустрия достигла переломного момента: обучать модели уже умеют, теперь нужно дешево и быстро их запускать. 🟡Vera Rubin Главный анонс конференции - полноценный запуск платформы Vera Rubin. GPU построен на 3-нм процессе TSMC, содержит 336 млрд. транзисторов и 288 ГБ памяти HBM4. Стойка NVL72 дает 260 ТБ/с совокупной пропускной способности по NVLink 6. Глава NVIDIA посчитал, что это превышает суммарную пропускную способность всего интернета. Производительность инференса выросла в 5 раз по сравнению с Blackwell за счет формата NVFP4. Vera Rubin не просто GPU. Вместе с ним NVIDIA анонсировала собственный CPU Vera, разработанный для оркестрации и управления памятью в крупных агентных системах. Эволюция CPU Vera уже расписана на 3 поколения вперед: Vera Ultra появится во второй половине 2027 года, следующая архитектура Feynman - в 2028-м. 🟡NemoClaw NemoClaw - собственная open-source платформа NVIDIA для создания и деплоя корпоративных ИИ-агентов. Она разворачивается локально на оборудовании NVIDIA, без зависимости от облака, и позволяет задавать агентам имя, личность и набор инструментов. Это прямой ответ на OpenClaw и попытка NVIDIA закрепиться не только в железе, но и в программном слое ИИ-стека. 🟡N1X N1X - ARM-процессор для ПК, разработанный совместно с MediaTek. Чип содержит 20 кастомных ARM-ядер и встроенный GPU с производительностью уровня RTX 5070. Целевой рынок - Windows-ноутбуки и рабочие станции с локальным инференсом. 🟡DLSS 5 DLSS 5, которую NVIDIA называет главным прорывом в компьютерной графике со времен дебюта ray tracing в 2018 году - это технология, основанная на новой модели нейронного рендеринга в реальном времени, которая насыщает пиксели фотореалистичным освещением и материалами. Выход технологии запланирован на осень 2026 года. В числе партнеров уже Ubisoft, Bethesda, Capcom, Tencent и Warner Bros. Games. 🟡Крупнейшая партнерская сделка Как мы писали ранее, NVIDIA заключила многолетнее стратегическое партнерство с Thinking Machines Lab: компания развернет не менее 1 гВт систем Vera Rubin для обучения ИИ-моделей. Это первое развертывание новой платформы в таком масштабе.

GTC продолжится до 19 марта. Впереди порядка 1000+ сессий по Robotics, Physical AI и открытым моделям.

🔜 Посмотреть запись трансляции на Youtube @ai_machinelearning_big_data #news #ai #ml

297 580

📌 Андрей Карпаты выложил новый проект - karpathy/jobs. Он взял данные по 342 профессиям из статистики BLS (≈143 млн работников в США) и с помощью LLM оценил, насколько каждая из них подвержена влиянию AI по шкале 0–10. Результат он визуализировал в виде treemap. Средний показатель по всем профессиям: 5.3 / 10. Примеры: • разработчики ПО: 8–9 • кровельщики: 0–1 • специалисты по расшифровке медицинских записей: 10 / 10 💀💀 Паттерн довольно простой. Если вся работа происходит за экраном, риск автоматизации высокий. Если она требует физического труда и непредсказуемой среды, вы гораздо безопаснее. По оценке Карпати, около 57 млн работников в США - почти 40% всей рабочей силы - находятся в зоне высокого риска изменений из-за AI. https://karpathy.ai/jobs/ @ai_machinelearning_big_data #ai #ml #future #jobs #llm

297 580

🌟 OLMo Hybrid: RNN плюс трансформер в одной модели. Институт Аллена опубликовал OLMo Hybrid 7B - модель, которая построена на чередовании слоев Gated DeltaNet и стандартного внимания в соотношении 3:1. Такая архитектура решает больше подзадач из обучающих данных за меньшее число токенов, что напрямую снижает потребность в данных при обучении.

Gated DeltaNet - это RNN с расширением в виде отрицательных значений матрицы переходов. Это небольшое изменение в правиле обновления внутреннего состояния позволяет слоям Gated DeltaNet реализовывать динамику попарной перестановки элементов и за счет этого решать задачи отслеживания состояния, недоступные чистым трансформерам.

В OLMo Hybrid Ai2 показали, что гибридные модели выразительнее суммы своих частей. Существует класс задач (назовем их отслеживание состояния с обращением к памяти), которые не решают ни чистые трансформеры, ни чистые RNN, но гибрид справляется с ними уже при одинарном чередовании типов слоев. Абляционные эксперименты от 60M до 1B параметров показали, что GDN стабильно лучше Mamba2 как в чистом, так и в гибридном варианте, равномерное чередование слоев лучше концентрации внимания в середине сети, а соотношение 3:1 - оптимальный баланс между качеством и вычислительной стоимостью на средних и крупных масштабах. 🟡Тесты 🟢На MMLU OLMo Hybrid достигает той же точности, что OLMo 3 7B, используя на 49% меньше токенов; на срезе Common Crawl - на 35% меньше. 🟢Коэффициент эффективности использования данных у гибрида равен 83,7 против 94,9 у трансформера. 🟢Экономия данных растет с размером модели: примерно в 1,3 раза на 1B параметров и в 1,9 раза на 70B. После дообучения и адаптации к длинному контексту OLMo Hybrid обходит OLMo 3 во всех категориях оценки. На RULER при 64k токенах - 85,0 против 70,9 у базовой модели. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей 🟡Техотчет @ai_machinelearning_big_data #AI #ML #LLM #OLMoHybrid #Ai2

297 580

✔️ Anthropic расширила контекстное окно до миллион токенов. Claude Opus 4.6 и Sonnet 4.6 получили поддержку контекстного окна объемом в 1 миллион без наценок за объем. Обработка длинных запросов тарифицируется по стандартной ставке, а лимиты пропускной способности API остаются прежними на всей длине контекста. Дополнительно лимит файлов в одном запросе увеличен в 6 раз: теперь Claude может за раз проанализировать до 600 изображений или страниц PDF. Обновление доступно в API Claude, а пользователи Claude Code на тарифах Max, Team и Enterprise при вызове Opus 4.6 по умолчанию будут автоматически использовать контекст 1M. claude.com ✔️ Microsoft начинает масштабную ИИ-экспансию в Африке. Корпорация запускает инициативу Microsoft Elevate, в рамках которой планирует до конца года бесплатно обучить ИИ-технологиям 3 млн. человек. Цель программы - сдержать экспансию китайских ИИ-продуктов на самом молодом и быстрорастущем рынке мира. По внутренним оценкам Microsoft, DeepSeek уже занимает от 11% до 14% локального рынка чат-ботов, а в Эфиопии и Зимбабве его доля достигает 20% из-за активных вложений Пекина в цифровую инфраструктуру. Чтобы вернуть инициативу, Microsoft делает ставку на развитие собственных вычислительных мощностей. До конца 2027 года компания инвестирует $330 млн. в расширение облачной и ИИ-инфраструктуры в ЮАР, а в Кении готовится строительство дата-центра, который будет полностью работать на геотермальной энергии. Ключевыми регионами для технологий и подготовки разработчиков также станут Нигерия и Марокко. bloomberg.com ✔️ Илон Маск уволил еще 2-х сооснователей xAI. В xAI прошла новая волна увольнений, вызванная недовольством CEO слабыми результатами. Компанию покинули еще 2 сооснователя: Цзыхан Дай и глава команды Imagine Годун Чжан, которого Маск обвинил в технических недоработках продукта. Таким образом, из 12 учредителей, запускавших xAI, в штате осталось всего 2 человека. Кадровые чистки серьезно бьют по моральному духу команды. Источники сообщают, что инженеры массово уходят из-за выгорания, спровоцированного экстремально жесткими требованиями Маска к рабочему графику. Пытаясь спасти проблемное направление и усилить экспертизу в разработке, xAI в конце недели переманила в свой штат Эндрю Милича и Джейсона Гинзберга из Cursor. ft.com ✔️ Google представила крупнейшее обновление Maps. Главным визуальным нововведением стал режим «Иммерсивной навигации». ИИ анализирует панорамы Street View и генерирует реалистичный маршрут с детализированными 3D-моделями зданий, точной разметкой полос и отображением светофоров. Также сервис получил функцию Ask Maps на базе Gemini. Вместо поиска по ключевым словам теперь запросы на естественном языке - ИИ сопоставляет геоданные с личными предпочтениями, формирует персонализированные рекомендации и позволяет бронировать места в один клик. Апдейт поэтапно развертывается в США. Вскоре новые инструменты появятся на платформах iOS и Android, а также в интерфейсах CarPlay и Android Auto. blog.google ✔️ Amazon добавила в Alexa+ взрослый режим общения. Голосовой ассистент получил новую опцию кастомизации - профиль Sassy для взрослой аудитории. Для его активации необходимо пройти дополнительную биометрическую аутентификацию. При работе профиля функция Amazon Kids автоматически блокируется. В режиме Sassy ассистент выдает саркастичные ответы, жесткие шутки и использует мат, но на этом "взрослость" заканчивается: ИИ по-прежнему отказывается генерировать NSFW-контент, разжигать ненависть, переходить на личности или консультировать по незаконным действиям. Взрослый режим стал частью крупной переработки Alexa+ (в прошлом месяце вышли стили Brief, Chill и Sweet). techcrunch.com @ai_machinelearning_big_data #news #ai #ml

297 580

🌟 OpenJarvis: фреймворк все-в-одном для ИИ-агентов Stanford SAIL замерили, насколько эффективно локальные языковые модели конвертируют электроэнергию в полезные вычисления и назвали этот показатель "intelligence per watt". Они прогнали больше миллиона реальных запросов через 20+ моделей на 8 разных ускорителях и выяснили: с 2023 по 2025 год эффективность локального инференса выросла в 5,3 раза, а современные небольшие модели уже справляются с 88,7% обычных чат- и ризонинг-запросов. Железо и алгоритмы готовы, но не хватало софта. Так появился OpenJarvis: открытый фреймворк, который превращает эти выводы в инфраструктуру для персональных ИИ-агентов, работающих на устройстве пользователя.

Авторы проводят параллель с PyTorch: OpenJarvis должен стать для локального ИИ тем, чем PyTorch стал для глубокого обучения - стандартной инфраструктурой, на которой строится все остальное.

Фреймворк структурирован вокруг 5 примитивов: 🟢Intelligence - слой языковых моделей с единым каталогом, где не нужно самому отслеживать релизы и считать память. 🟢Engine - бэкенд инференса: Ollama, vLLM, SGLang, llama.cpp, Apple Foundation Models и другие. Openjarvis сам определяет железо и рекомендует конфигурацию. 🟢Agents - слой поведения: роли оркестратора и исполнителя рутинных сценариев, адаптированные под ограниченный контекст и память на устройстве. 🟢Tools & Memory - интеграции через MCP и Google A2A, семантическая индексация локальных документов, подключение к iMessage, Telegram и т.д. 🟢Learning - механизм адаптации: локальные трейсы превращаются в обучающие данные через SFT, LoRA и GRPO. Система сама упаковывает этот процесс в рабочий флоу. Отдельная фишка - подход к эффективности. OpenJarvis профилирует энергопотребление на NVIDIA, AMD и Apple Silicon с интервалом 50 мс. Использовать можно через CLI, браузерный дашборд или десктопное приложение для macOS, Linux и Windows. ⚠️ Для полного функционала (безопасность, инструменты, агенты) потребуется Rust.

Помимо самого проекта, команда запустила конкурс-лидерборд экономии денег, энегрии и компьюта, в котором принять участие может любой желающий. В качестве приза самому экономному обещают Mac Mini.

📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Документация 🟡Сообщество в Discord 🖥GitHub @ai_machinelearning_big_data #AI #ML #Framework #OpenJarvis #Stanford

297 580

Соберите Telegram-бота на базе ИИ за 1 час 💻 В России чаще можно пообщаться в чате с ИИ, чем с живым менеджером. Однако не все чат-боты хорошо распознают текст с картинки: клиенту неудобно перенабирать его вручную, поэтому пока он чаще просит позвать живого оператора. В сервисе MWS GPT можно создать бота для Telegram, который распознает текст с изображений. 17 марта соберём такого бота в прямом эфире — от первого запроса до рабочего прототипа. 🎁 Бонус: все участники получат готовый код бота. С вебинара вы уйдёте с готовым решением, которое сможете легко внедрить в клиентский сервис. Кому будет полезно: ⚫️руководителям и владельцам бизнеса, ⚫️менеджерам, ⚫️ИТ-специалистам, ⚫️всем, кто хочет ускорить бизнес-процессы. Когда: 17 марта, 11:00 Спикер: Павел Бабин, CPO MWS GPT ➡️ Регистрируйтесь по ссылке

297 580

✔️ Сэм Альтман: падение популярности ИИ - главная угроза технологического лидерства США. Выступая на саммите BlackRock, глава OpenAI отметил резкое снижение доверия к ИИ среди американцев. По данным опросов, больше половины граждан считают, что риски от внедрения ИИ превышают пользу. Основные причины такого негатива: рост цен на электроэнергию из-за дата-центров и массовые сокращения. Ситуацию усугубляют дискуссии о границах влияния бигтеха и государства. Альтман предупредил, что растущее сопротивление становится фактором в гонке технологий. Хотя США пока опережают Китай, замедление темпов внедрения ИИ может стоить стране статуса лидера. Американскому бизнесу, научному сообществу и правительству необходимо форсировать интеграцию ИИ. Если действовать быстро, уверен Альтман, ИИ даст уникальный шанс для мощного экономического рывка и переосмысления социальных институтов. businessinsider.com ✔️ В Китае начали разработку стандартов для автономных ИИ-агентов. Китайская академия информационных технологий начала создание нормативной базы для Claw-агентов. Поводом стал взрывной рост популярности проекта OpenClaw. Регламент должен решить проблемы безопасности и сделать работу автономных систем предсказуемой. В документе будут прописаны жесткие требования к качеству кода, прозрачности выполнения процессов, распределению пользовательских привилегий и минимизации рисков. Академия уже открыла проект для обсуждения с экспертами отрасли, а к концу марта планирует запустить тестирование продуктов класса Claw на соответствие новым стандартам. Результаты проверок будут публично представлены на профильной конференции. cls.cn ✔️ Илон Маск представил ИИ-систему, способную эмулировать работу IT-компаний. Проект Macrohard, также известный как Digital Optimus, объединяет стек технологий Tesla и xAI. В основе архитектуры лежит языковая модель Grok в роли высокоуровневого навигатора. Она работает в тандеме с ИИ-агентом Tesla, который в реальном времени анализирует видео с экрана компьютера и напрямую управляет клавиатурой и мышью. По задумке Маска, система сможет автоматизировать процессы разработки ПО до такой степени, чтобы полностью имитировать функции IT-корпораций. Само название Macrohard является прямой ироничной отсылкой к Microsoft. Проект будет использовать проприетарные процессоры Tesla AI4 в связке с мощностями xAI на базе ускорителей Nvidia. Заявка на регистрацию одноименного товарного знака уже находится на рассмотрении в патентном ведомстве США. reuters.com ✔️ Microsoft анонсировала Copilot Health. Новый сервис работает как изолированное пространство внутри экосистемы Copilot. Его задача - агрегировать информацию о здоровье пользователя в единый профиль. Copilot Health интегрируется с более чем 50 гаджетами и напрямую подтягивает электронные медкарты из клиник США и результаты лабораторных исследований. ИИ обрабатывает этот массив данных, чтобы находить скрытые паттерны и выдавать персонализированные рекомендации. Все ответы базируются на клинических базах и сопровождаются ссылками на верифицированные источники. Copilot Health физически и логически отделен от основного чат-бота, зашифрован. Платформа сертифицирована по стандарту ISO/IEC 42001. На данный момент открыта запись в лист ожидания. microsoft.ai ✔️ Claude AI теперь генерирует интерактивные визуализации прямо в диалоге. Anthropic обновила свой чат-бот: теперь Claude умеет создавать кастомные графики, диаграммы и схемы прямо внутри переписки. Он сам анализирует контекст и, если визуализация помогает лучше раскрыть ответ, встраивает ее в ленту сообщений. Запросить нужную таблицу или даграмму можно и напрямую, причем сгенерированные элементы поддерживают интерактивность. Новой функция отличается Artifacts. Артефакты открываются в отдельной боковой панели и сохраняются там постоянно. Встроенные же визуализации меняются или вовсе исчезают по мере развития диалога, подстраиваясь под текущую задачу. Обновление уже доступно всем пользователям и включено по умолчанию. support.claude.com @ai_machinelearning_big_data #news #ai #ml

297 580

🌟 ByteDance перезапустила DeerFlow. DeerFlow 2.0 - проект, переписанный с нуля, который не имеет ничего общего с первой версией. Там был фреймворк для глубокого ресерча, а здесь полноценный рантайм для агентов. 🟡В основе лежит связка LangGraph и LangChain. Главный агент получает задачу, разбивает ее на подзадачи и порождает суб-агентов на лету. Каждый из них работает в изолированном контексте: не видит данные других агентов и главного процесса. Суб-агенты запускаются параллельно, когда это возможно, и возвращают структурированные результаты, а главный агент собирает из них финальный вывод. Сессия живет в изолированном Docker-контейнере с полноценной файловой системой, главный агент и суб-агенты работают в ней совместно. Агент читает и пишет файлы, выполняет bash-команды, работает с изображениями. Между сессиями нет никакой взаимной путаницы. 🟡Навыки и инструменты Возможности агента определяются через Skills. Из коробки есть исследование, генерация отчетов, создание слайдов, веб-страниц, изображений и видео. Навыки загружаются по мере необходимости, только когда задача их требует. Это снижает нагрузку на контекстное окно и позволяет работать с моделями, чувствительными к расходу токенов. Инструменты - по той же логике: базовый набор (веб-поиск, fetch, работа с файлами, bash), плюс поддержка MCP-серверов и произвольных Python-функций. Все можно заменить или расширить. 🟡Память и контекст DeerFlow помнит пользователя между сессиями. Накапливается профиль: стиль письма, технический стек, повторяющиеся сценарии. Данные хранятся локально. Внутри длинной сессии система сама управляет контекстом: завершенные подзадачи суммируются, промежуточные результаты уходят на диск. Контекстное окно не раздувается. 🟡Интеграции Поддерживаются Telegram, Slack и Feishu. Из Claude Code можно взаимодействовать с запущенным инстансом DeerFlow напрямую через специальный skill: отправлять задачи, управлять тредами и выбирать режим выполнения. 🟡Модели и деплой Система работает с любой моделью через OpenAI API, включая локальные через Ollama. ByteDance рекомендует использовать модели, которые поддерживают длинный контекст (100k+ токенов), ризонинг, мультимодальность и надежный tool-use. DeerFlow также встраивается как Python-библиотека без запуска HTTP-сервисов:

from src.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat("Analyze this paper", thread_id="my-thread")

📌Лицензирование: MIT License. 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #Agents #DeerFlow #ByteDance

297 580

🌟 Nemotron-Terminal: небольшое семейство для терминальных задач. NVIDIA обучила семейство моделей Nemotron-Terminal для автономной работы в терминале Linux: устанавливать зависимости, писать и запускать код, отлаживать окружения и выполнять сквозные инженерные задачи без участия человека. Семейство построено на базе Qwen3 и специально собранном датасете Terminal-Corpus. И фишка не в архитектуре, а в данных. 🟡NVIDIA собрала пайплайн Terminal-Task-Gen с 2 потоками. Первый адаптирует готовые датасеты по математике, коду и SWE-задачам под терминальный формат (без участия LLM в процессе адаптации). Второй генерирует синтетику 2 методами: seed-based (LLM создает новые задачи на основе существующих задач из смежных областей) и skill-based (LLM комбинирует до пяти примитивных навыков из таксономии по 9 доменам: Security, Data Science, System Administration и другим). 🟡В открытый релиз вошли все три модели на 8B, 14B, 32B параметров и 2 датасета:

Terminal-Corpus: около 366K траекторий выполнения задач, разбитых на два потока: ~226K адаптированных примеров из Math/Code/SWE и ~140K синтетических задач на основе skill-таксономии. Synthetic-Tasks: задачи в стандартизированном формате: инструкция, Docker-окружение из 9 преднастроенных образов и верификационный набор на pytest.

🟡Результаты прогонов на бенчах. На Terminal-Bench 2.0 все 3 модели показали кратный рост относительно базовой Qwen3: 8B - с 2.5% до 13%, 14B - с 4% до 20.2%, 32B - с 3.4% до 27.4%.

Для сравнения: Qwen3-Coder на 480B параметров набирает 23.9%, GPT-5-Mini - 24.0%, Grok 4 - 23.1%. Nemotron-Terminal-32B превосходит или вплотную конкурирует с ними всеми при разнице в размере на порядок.

🟡Несколько внезапных выводов из абляции. Фильтрация неудачных траекторий вредит. Модель, обученная на всех траекториях включая ошибочные, набирает 12.4% против 5.06% у варианта только с успешными. Curriculum learning (сначала простые данные, потом сложные) не дал преимуществ перед простым смешанным обучением. Увеличение контекстного окна с 32K до 65K токенов также не помогло, длинные траектории оказались шумнее. 📌Лицензирование моделей: NVIDIA Open Model License 📌Лицензирование датасетов : CC-BY-4.0 License. 🟡Набор моделей 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #NemotronTerminal #NVIDIA

297 580

🌥 Разворачивайте AI быстрее и выгоднее 🤩 Провайдер Cloud.ru дает скидки до 40% на ключевые сервисы для запуска и масштабирования AI-проектов. GPU, физические серверы, ML-инференс — все в одном месте и на выгодных условиях. Минимум лишних затрат, максимум производительности. Количество участников ограничено — успейте подключиться.