ru
Feedback
Machinelearning

Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 295 712 подписчиков, занимая 332 место в категории Технологии и приложения и 1 273 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 295 712 подписчиков.

Согласно последним данным от 23 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 330, а за последние 24 часа — -217, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.94%. В первые 24 часа после публикации контент обычно набирает 5.68% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 23 490 просмотров. В течение первых суток публикация набирает 16 791 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 190.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Благодаря высокой частоте обновлений (последние данные получены 24 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

295 712
Подписчики
-21724 часа
-1 4607 дней
-6 33030 день
Архив постов
✔️ OpenAI расширяет свое присутствие в кибербезопасности Компания выпустила специализированную модель GPT-5.5-Cyber для ИБ и обновление плагина Codex Security. Доступ к GPT-5.5-Cyber предоставляется только верифицированным пользователям. Модель настроена на сниженную частоту отказов при обработке специфических запросов по безопасности. Обновленный Codex Security сканирует кодовую базу, анализирует векторы атак, проверяет достижимость уязвимого кода и генерирует патчи. Инструмент поддерживает обработку баг-репортов от внешних сканеров и экспорт данных через SARIF-файлы или запросы CodeQL. Совместно с HackerOne и Trail of Bits компания запустила инициативу Patch the Planet для автоматизированной защиты open-source проектов. К программе присоединились cURL, Python и Go. openai.com ✔️ Google запустила ИИ-акселератор для бывших сотрудников Корпорация представила программу для сообщества бывших сотрудников, создающих ИИ-проекты. Инициатива призвана не допустить оттока талантов к конкурентам. ИТ-гигант стремится захватить новые проекты на максимально ранней стадии, чтобы привязать будущих лидеров рынка к инфраструктуре Google Cloud. В первый 12-недельный этап отберут 10–20 команд. Каждая получит до 100 тысяч долларов прямого финансирования и грант на 350 тысяч долларов для оплаты облачных мощностей. Участникам также предоставят доступ к моделям Google до их публичного релиза. Партнерами проекта выступили венчурная студия Key Studio и платформа Xoogler.co, объединяющая более 35 тысяч экс-сотрудников корпорации по всему миру. Менторскую поддержку окажут опытные топ-менеджеры, в том числе бывший CEO Yahoo Марисса Майер. bloomberg.com ✔️ NVIDIA представила платформу безопасности для физического ИИ Halos for Robotics - аппаратно-программная платформа для безопасного взаимодействия автономных машин и людей на промышленных объектах. Аппаратная база состоит из модуля IGX Thor и шлюза Holoscan Sensor Bridge для обработки данных с датчиков. Программная часть построена на Halos OS с ядром Halos Core и поддерживает работу с сертифицированными ОСРВ, включая BlackBerry QNX. Компания выложила открытый референсный дизайн схемы безопасности, которая использует внешние камеры предприятия для контроля слепых зон робота. Для тестирования решений на соответствие нормативам NVIDIA запустила собственную лабораторию инспекции ИИ с аккредитацией ANSI. Первым интегратором стала Agility Robotics, она внедряет компоненты Halos в роботов Digit. nvidia.com ✔️ ElevenLabs выпустила инструмент для локализации рекламы Ads Engine - движок автоматического перевода рекламных креативов на 50 языков. Система интегрируется с кабинетами рекламных сетей, забирает исходные материалы, локализует их и загружает обратно. Инструмент работает на технологии Dubbing V2, которая переводит аудиодорожку и клонирует голос диктора с сохранением оригинальных интонаций. Попутно, сам Ads Engine адаптирует видеоряд - переводит текстовые оверлеи и меняет композицию кадров. В платформу встроен мониторинг эффективности, который отслеживает падение конверсии и предупреждает о необходимости замены креатива. Функция мониторинга и ручное ревью материалов доступны на тарифе Scale. Базовые возможности Ads Engine входят в подписку Pro (есть лимиты рекламные аккаунты, языки и генерации). Инструмент доступен только через веб, API не предусмотрен. elevenlabs.io ✔️ Oracle сократила 21 тысячу сотрудников на фоне реструктуризации бизнеса вокруг ИИ Корпорация уменьшила штат на 13% (со 162 до 141 тысячи сотрудников). Согласно годовому отчету, увольнение 21 тысячи человек связано с внедрением ИИ во внутренние процессы и перераспределением ресурсов. Затраты на выходные пособия и сопутствующие издержки составили 1,8 млрд долларов, что в 5 раз больше, чем компания потратила на реорганизацию годом ранее. Сэкономленные средства пойдут на строительство дата-центров. Корпорация продолжит менять структуру инженерных подразделений с фокусом на облачные сервисы и ИИ-продукты. bbc.com @ai_machinelearning_big_data #news #ai #ml

LLM в поддержке: от шаблонов к точной работе с документами компании ✅ На открытом уроке разберём, как устроены современные ре
LLM в поддержке: от шаблонов к точной работе с документами компании ✅ На открытом уроке разберём, как устроены современные решения на базе LLM, почему они не просто генерируют текст, а используют знания компании для подготовки ответов, и как такие инструменты помогают ускорять обработку обращений. На практических примерах покажем, как документы превращаются в базу знаний для ИИ, как происходит поиск информации по запросу клиента и каким образом LLM помогает оператору поддержки готовить ответы. Также поговорим о том, как подобные решения применяются в бизнесе уже сегодня. Урок пройдёт 6 июля в 20:00 МСК в преддверии старта курса «LLM-инженер». Это возможность познакомиться с современным подходом к созданию интеллектуальных сервисов, задать вопросы эксперту и понять, как внедрять подобные решения в реальные процессы компании. ➡️ Регистрация открыта: https://otus.pw/vn5P/?erid=2W5zFHNdyn1 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

📌 ICYML: главные анонсы Cursor на Compile 26 Cursor начал выкладывать на свой канал запись прошедшей на прошлой не
+1
📌 ICYML: главные анонсы Cursor на Compile 26 Cursor начал выкладывать на свой канал запись прошедшей на прошлой неделе конференции Compile 26.
Если коротко: Cursor окончательно перестал быть умным редактором кода и превратился в экосистему, где ИИ - полноценный кодер-коллега, а не просто продвинутый автокомплит.
🟡Релиз Cursor 3 Сооснователь Майкл Труэлл начал с интересной статистики: сейчас около 95% пользователей Cursor взаимодействуют с ним в первую очередь как с агентом, такие запросы превышают использование классического автокомплита в 5 раз. Ответом на это стал Cursor 3. Редактор переписали с нуля, сделав его полностью агентным. Интерфейс переработали под взаимодействие с ИИ-командами, появилась поддержка рекурсивных субагентов (это когда агент может вызывать других агентов). Отдельная фича - Design Mode: теперь можно буквально ткнуть агента в нужный элемент UI на экране, и он сам найдет и поправит соответствующий код. 🟡Cursor SDK Стартап уходит от концепции закрытого проприетарного продукта и выпускает SDK, позволяющий расширять функционал среды под себя. Помимо этого, прокачали CLI. Всего более 50 QoL-улучшений от комьюнити. Теперь Cursor можно интегрировать с внутренними инструментами компаний, базами данных, а также использовать сторонние API и протокол MCP. Платформа открыта для плагинов от сообщества. 🟡Cloud Agents Продакт-лид Кевин Нипарко уверяет, что Cursor хочет, чтобы ваши ИИ-коллеги работали 24/7, даже когда вы спите, катаете в фифу или общаетесь с клиентами. На помошь в этом приходят облачные агенты. Под капотом - инфраструктура с изолированными виртуалками, у которых есть свои клонированные репозитории, терминал, браузер, зависимости и т.д. Агенты могут сами запускать тесты, верифицировать работу и делать скриншоты для отчета.
Кевин привел кейс: компания Amplitude сейчас использует эту автоматизацию для миграции 20 000 React-компонентов на Tailwind.
🟡 Origin: замена GitHub В январе 2026 года Cursor купили стартап Graphite, и его сооснователь Томас Реймерс представил новую агентную Git-платформу Origin. Томас посетовал что классические Git и CI/CD сценарии ломаются под скоростью и объемом кода, который генерирует сейчас ИИ. Origin построен с учетом реалий: 🟢держит нагрузки от тысяч одновременно работающих агентов (синхронизация по всему миру <400 мс, 99.9% аптайм); 🟢агенты в Origin умеют самостоятельно резолвить merge-конфликты, чинить упавшие CI-тесты и отвечать на комментарии в PR, тегая кожаного только в крайнем случае. Полноценный релиз для всех запланирован на осень этого года, пока можно постучаться в вейтлист. 🟡Cursor Mobile на iOS Чтобы управлять агентами отовсюду, выкатили мобильное приложение, в котором видно, над чем сейчас трудится ИИ, можно аппрувить PR, разблокировать зависшие таски и просматривать скриншоты. Если агент где-то затроил, достаточно прямо на скрине с телефона обвести проблему, написать коммент и отправить переделывать. Бета-версия под iOS в TestFlight уже доступна. Но мест уже нет 🟡Модель на 1.5T+ параметров Cursor развивал свою линейку моделей Composer, фокусируясь на скорости и дешевизне. Но пришло время идти ва-банк. На подходе новая модель, которая обучается прямо сейчас: 🟠1.5+ триллиона параметров (уровень GPT-4 / ClaudeOpus); 🟠Учат с нуля на кластере из более чем 100 000 GPU (привет, SpaceX); 🟠На инференс выделят в 10–20 раз больше компьюта, чем во всех предыдущих моделях; 🟠Модель проектируется для сложного планирования, архитектурных решений и использования тулзов. Релиз состоится в ближайшие пару недель. @ai_machinelearning_big_data #news #ai #ml

📌 Mistral AI представила OCR 4. Модель превращает документ в структуру: • выделяет блоки через bounding boxes • понимает тип
+1
📌 Mistral AI представила OCR 4. Модель превращает документ в структуру: • выделяет блоки через bounding boxes • понимает типы элементов: заголовок, таблица, формула, подпись • показывает confidence score по страницам и словам • работает на 170 языках Главная польза не в «распознать текст», а в том, чтобы дальше нормально использовать документы в RAG, enterprise search, редактировании, проверке человеком и агентных пайплайнах. Mistral заявляет, что OCR 4 обошла конкурентов в слепом сравнении на 600+ реальных документах и набрала 85.20 на OlmOCRBench. Модель можно запускать self-hosted в одном контейнере, чтобы документы не покидали вашу инфраструктуру. Цена через API: $4 за 1000 страниц, через Batch API: $2 за 1000 страниц. https://mistral.ai/news/ocr-4/

🔍 Baidu выпустила Unlimited OCR - модель для распознавания длинных документов за один проход. У модели 3B параметров, но акт
🔍 Baidu выпустила Unlimited OCR - модель для распознавания длинных документов за один проход. У модели 3B параметров, но активируются только 500M. При этом она показывает новые SOTA-результаты на OmniDocBench v1.5 и v1.6. Главная фишка - Reference Sliding Window Attention. Модель держит в фокусе: • исходный документ • недавний контекст • следующие слова А всё лишнее постепенно «забывает», чтобы не раздувать вычисления. За счёт постоянного размера KV Cache и более дешёвого attention Unlimited OCR может распознавать 40+ страниц за один forward pass, не теряя контекст и не замедляясь. GitHub: https://github.com/baidu/Unlimited-OCR Hugging Face: https://huggingface.co/baidu/Unlimited-OCR #ocr #baidu

Вау, вот это скорость разработки! 🚀 На GitVerse появилось зеркало PyPI — теперь Python‑пакеты доступны, даже если upstream P
Вау, вот это скорость разработки! 🚀 На GitVerse появилось зеркало PyPI — теперь Python‑пакеты доступны, даже если upstream PyPI упадёт или станет недоступен. Ставьте зеркало как основной источник или держите как резерв. Рассказали, как это сделать, здесь!

📌 Kapwing: 59% видео в ленте новых аккаунтов TikTok - низкокачественный ИИ-контент Платформа для создания и редактирования в
+2
📌 Kapwing: 59% видео в ленте новых аккаунтов TikTok - низкокачественный ИИ-контент Платформа для создания и редактирования видео Kapwing опубликовала результаты исследования, согласно которому значительная часть роликов, показываемых новым пользователям TikTok, сгенерирована ИИ и относится к категории AI slop.
Это низкокачественный контент, который создаётся автоматически ради накрутки просмотров и подписок либо влияния на мнения.
По данным Kapwing, из первых 500 видео в рекомендациях у нового аккаунта TikTok таким контентом оказались 294 ролика (59%). В аналогичном тесте с новым аккаунтом в YouTube Shorts доля составила 21% (104 из 500), то есть на TikTok подобных видео было примерно втрое больше.
Справедливости ради - лента TikTok подстраивается под пользователя по мере просмотра, а тест отражает опыт первых часов использования.
Отдельно Kapwing вручную проанализировала 10 742 ролика по популярным тегам в 20 категориях. Наибольшая доля сгенерированных видео пришлась на категорию для детей - 57,4% (1147 из 2000 роликов), далее следуют "Наука и образование" (35%), "Здоровье" (33,8%) и "История" (33,5%). Меньше всего ИИ-слопа в категориях "Фитнес" (1,6%), "Музыка" (1,5%) и "Мода" (1,3%). Под тегом cartoonkids, по подсчётам платформы, лишь 3 из 100 видео были сняты людьми.
Для контекста, сам TikTok в 2025 году говорил, что многим нравится контент, созданный с помощью ИИ, и ввёл настройку, позволяющую регулировать долю таких роликов в ленте, а также объявил о фонде в 2 млн долларов на просветительские проекты об ИИ.
По собственным данным TikTok, к ноябрю 2025 года платформа пометила как сгенерированные 1,3 млрд видео. @ai_machinelearning_big_data #news #ai #ml

Хочешь заниматься наукой, но не отрываться от реальных индустриальных задач? МФТИ при поддержке Т-Банка набирает студентов в
Хочешь заниматься наукой, но не отрываться от реальных индустриальных задач? МФТИ при поддержке Т-Банка набирает студентов в очную магистратуру по направлениям AI и Computer Science. Это формат, где учеба совмещается с работой в научной лаборатории. Ты не просто слушаешь лекции, а участвуешь в исследованиях, которые могут стать основой для публикаций, докладов на топовых конференциях и будущей карьеры в R&D. Что дает программа: * работа над индустриальными задачами * официальное трудоустройство в лаборатории и зарплата * исследования в AI и Computer Science * диплом МФТИ * возможность продолжить путь в аспирантуре, R&D или AI-центре Т-Банка Магистратура длится 2 года. Нагрузка: 52 часа в неделю. * 30 часов: работа в научной лаборатории * 22 часа: лекции и занятия в университете Подать заявку можно до 6 июля.

✔️ Alibaba обновила видеомодель HappyHorse Версия HappyHorse 1.1 обрабатывает промпты объемом свыше 2500 символов, выстраивает от 6 до 8 последовательных сцен на базе одного запроса в разрешении до FullHD и умеет генерировать мультиязычный липсинк. Предусмотрено 4 режима: генерация по тексту, на основе изображения, перенос персонажа по референсам и редактирование видео. Модель доступна по API через Alibaba Model Studio и Qwen Cloud. Тарификация: 14 центов за секунду в HD и 18 центов за 1080p. В первые 2 недели действует скидка 40% на генерацию. Alibaba в сети Х ✔️ Anthropic и Micron займутся совместным проектированием архитектуры памяти Компании заключили соглашение. в рамках которого будут исследовать поведение систем памяти при обучении и инференсе LLM. По условиям многолетнего контракта, Micron поставит Anthropic память HBM, DRAM и SSD-накопители. Anthropic развернет у чипмэйкера модели семейства Claude для генерации кода и автоматизации производственных процессов. Аналитиков тревожит зацикленность финансовой стороны партнерства. Схема предполагает, что Micron вкладывает средства в стартап, который тратит их на закупку оборудования самого инвестора. Подобные круговые сделки искажают реальную оценку спроса на рынке железа для ИИ. Производитель чипов также выступил инвестором в последнем раунде финансирования Anthropic. micron.com ✔️ Interactions API вышел в релиз Google перевела экосистему Gemini на Interactions API. Новый интерфейс вышел в общий доступ и заменил метод generateContent по умолчанию в Google AI Studio. Старый метод пока поддерживается, но будущие возможности для агентов будут реализовываться только через Interactions. В API отказались от ролей user и model. Теперь каждый пользовательский ввод или вызов функции фиксируется как отдельный типизированный шаг. Обновление добавило: управляемых агентов, фоновое выполнение тяжёлых задач, интеграцию с поиском и картами, а также генерацию медиаконтента. Плюс появились новые режимы выполнения запросов - Flex позволяет снизить расходы на 50%, а Priority обеспечивает максимальную скорость отклика. blog.google ✔️ Canonical добавит распознавание голоса в десктопную версию Ubuntu Компания анонсировала интеграцию инструмента под кодовым названием Myna, функции преобразования речи в текст. Инструмент появится в релизе Ubuntu 26.10 для работы с Wayland в окружении GNOME. Позже планируется поддержка других графических оболочек. Myna работает автономно после загрузки весов модели. Архитектура состоит из 3 узлов: аудио-адаптер захватывает звук с микрофона, очищает его от шума и нарезает поток на фрагменты, оркестратор управляет сессией и передает данные в изолированную песочницу, где происходит сам процесс распознавания. В первых версиях Myna не будет поддерживать фоновое прослушивание и голосовой ввод паролей. ubuntu.com ✔️ Контент Getty Images появятся в поисковой выдаче ChatGPT Крупнейший фотобанк и OpenAI заключили многолетнее лицензионное соглашение. Фотографии из каталога сервиса будут интегрированы в поисковую выдачу ChatGPT. Ранее Getty выступала против использования своих данных для тренировки ИИ и подала иск против Stability AI за нарушение авторских прав. Позже фотобанк выпустил собственный генератор изображений. Параллельно компания ожидает одобрения регуляторов на поглощение конкурента Shutterstock, что может сделать объединенную структуру доминирующим поставщиком легальных визуальных датасетов. Финансовые детали контракта не раскрываются. Также неизвестно, получила ли OpenAI право использовать архивы фотобанка для обучения моделей. gettyimages.com @ai_machinelearning_big_data #news #ai #ml

🌟 LOGOS: универсальная модель для естественных наук Alibaba Group выложила в открытый доступ код и веса модели LOGOS для нуж
+2
🌟 LOGOS: универсальная модель для естественных наук Alibaba Group выложила в открытый доступ код и веса модели LOGOS для нужд химиков, биологов и разработчиков лекарств. Это первая модель, которая в рамках единой архитектуры объединяет работу с белками, антителами, малыми молекулами, химическими реакциями и материалами. LOGOS умеет предлагать молекулы-лиганды, способные связываться с заданным белком, находить на белке участки связывания, предсказывать, из каких исходных веществ можно собрать нужное соединение, генерировать новые материалы, дорабатывать белки под нужные свойства и проектировать антитела. Главная идея проекта в том, чтобы одна модель справлялась со всеми этими задачами сразу, тогда как обычно под каждую делают отдельную узкоспециализированную программу. Чтобы это стало возможным, разные объекты и их взаимодействия (белки, молекулы, реакции, материалы) были закодированы в общее дискретное пространство токенов. LOGOS согласовывает предсказание следующего токена во время обучения с целями генерации в последующих задачах.
Этот метод назвали "научной грамматикой", он дал подлинную интероперабельность и синергию знаний между модальностями.
Корпус обучения составил 44 млрд токенов из 7 типов научных данных. 🟡 Тесты 🟢LOGOS-1B превзошла модель NatureLM (8×7B) в задаче генерации молекул; 🟢LOGOS-8B в генерации металл-органических каркасов обошла профильные решения по всем метрикам, а в проектировании участков антител заняла 1 место по точности восстановления аминокислот. 🟡В релизе 4 модели 🟠Три базовые претрейн-версии на 1, 3 и 8 млрд параметров; 🟠LOGOS-8B - версия после SFT под прикладные задачи. 📌Лицензирование: Apache 2.0 License 🟡Arxiv 🟡Набор моделей 🖥GitHub @ai_machinelearning_big_data #AI #ML #LSLM #LOGOS #TongyiLab

Мы часто обсуждаем инструменты и метрики, но почти не говорим о том, с чего на самом деле начинается внедрение AI в разработке. А начинается она, в том числе, с привычки и руководителя. Об этом я узнал из доклада Артура Василова из Яндекс Браузера на Mobile Runtime. Доклад оказался интересным именно своей приземлённостью: это не рассказ про «магический AI», а довольно честный разбор того, как команда Браузера идёт к AI-first-разработке. Цель у них прикладная — получить прирост производительности в исследовании, проектировании, коде и дебаге. По замерам команды, именно в процессе продумывания решения и написания кода прирост скорости сейчас около 20% к началу полугодия, но быстрее стала именно разработка, а не весь путь фичи до продакшена. При этом проникновение уже очень высокое: почти вся команда использует агентские сценарии на ежедневной основе. Самое полезное в докладе — разложение внедрения на слои. Сначала нужно просто приучить людей решать реальные рабочие задачи с агентами, а не сводить всё к разовым вопросам в чат. Для этого нужны общий AI-чат, амбассадоры в командах, живые демо и внятная настройка инструментов, чтобы люди не застревали на этапе интеграции агентов с Xcode, Android Studio и корпоративным окружением. Отдельно подчёркивается роль руководителей: там, где лидер сам регулярно работает с AI, использование в команде заметно выше, чем при формальном внедрении сверху. Следующий уровень — это уже не привычка, а инфраструктура: AGENTS.md, системные промпты, MCP и скиллы под повторяющиеся задачи. Логика простая: нужно давать агенту как можно больше инструментов и знаний для решения задач самостоятельно и удобно, а не чтобы разработчик вёл его за руку. На этой базе появляются и более тяжёлые сценарии, например: Swiftization, то есть массовый перевод старого Objective-C-кода на Swift, и частичная автоматизация релизного дежурства, где агент берёт на себя рутинные операции, анализ состояния релиза и первичную работу с новыми крешами и багами, а инженер уже проверяет результат. При этом сам Артур прямо говорит, что без автоматизации соседних функций — менеджмента, постановки задач, тестирования — влияние на time to market останется ограниченным.

✔️ OpenAI стала платиновым участником Rust Foundation Компания Сэма Альтмана выделит $600 000 на развитие языка. Средства, ид
✔️ OpenAI стала платиновым участником Rust Foundation Компания Сэма Альтмана выделит $600 000 на развитие языка.  Средства, идущие сверх ежегодного членского взноса, направят на поддержку целей проекта Rust, инновационной лаборатории, а также на прямое финансирование разработчиков открытого ПО. Интересы OpenAI в совете директоров фонда будет представлять Предраг Груевски, технический специалист OpenAI и разработчик инструмента проверки совместимости версий cargo-semver-checks. За 2 дня до официального вступления в фонд OpenAI распределила $160 000 через GitHub Sponsors. Целевые гранты получили разработчики открытых проектов, от которых зависят Astral и Codex. @ai_machinelearning_big_data #news #ai #ml

Sakana AI представила Fugu Ultra - оркестрационный слой, который собирает и распределяет подзадачи между пулом моделей через
Sakana AI представила Fugu Ultra - оркестрационный слой, который собирает и распределяет подзадачи между пулом моделей через единый OpenAI-совместимый endpoint. На большинстве бенчмарков он показывает производительность на уровне Fable и Mythos. Fugu - это обученная модель-координатор внутри мультиагентной системы. «Sakana Fugu сама является LLM, обученной вызывать разные LLM из пула агентов, включая рекурсивные экземпляры самой себя. Fugu динамически оркестрирует лучшие модели мира для решения сложных многошаговых задач». Когда вы отправляете промпт, Fugu решает, отвечать самому или передать части задачи другим моделям. Затем он собирает результаты и выдаёт один финальный ответ. 🐡 Попробовать можно здесь: https://sakana.ai/fugu

Собираем всех на первый летний open‑air по кибербезу 🥰 17 июля CyberCamp выходит из онлайна в парк: встречаемся в «Берёзы Па
Собираем всех на первый летний open‑air по кибербезу 🥰 17 июля CyberCamp выходит из онлайна в парк: встречаемся в «Берёзы Парк Строгино» у воды. Что вас ждёт: 🔹доклады и практические кейсы по ИИ, атакам, DFIR, Bug Bounty; 🔹киберучения и TableTop‑сценарии; 🔹турнир по настольному теннису, D&D, крафтовые деревянные игры и квест по социнженерии; 🔹пуфики, гамаки и чилл у воды вместо душного зала. Отдельный кайф — научпоп от астронома Владимира Сурдина «Заблуждения и мифы о Вселенной» 🤩 Онлайн‑трансляции не будет, только живой офлайн. 📅 17 июля, Москва, Берёзы Парк Строгино 🚌 Бесплатный трансфер от м. «Щукинская» 🎟 Билеты доступны по ссылкам: Стандартный Студенческий 📣Едете от компании? Билеты можно оформить по счёту на юридическое лицо.

🌟 MolmoMotion: модель прогнозирования движения объектов в трёхмерном пространстве Институт Аллена (Ai2) выпустил MolmoMotion - модель, которая предсказывает, как отмеченный в кадре объект будет двигаться в ближайшие секунды. На вход подаётся кадр или короткая видеоистория, на видимом в сцене предмете отмечаются опорные точки, и добавляется текстовая инструкция (например, "подвинь и поверни деревянную миску с фруктами"). На выходе модель строит траекторию этих точек в трёхмерном пространстве, в метрах относительно камеры. Под капотом - модель Molmo 2 на 4 млрд параметров. Институт обучил 2 версии: 🟢Авторегрессионный вариант, который достраивает траекторию по шагам; 🟠Версию на основе flow-matching для случаев, когда у действия есть несколько вероятных продолжений. 🟡В открытый релиз вошли только 2 AR-чекпойнта 🟢H3-F30 для типичного видео: 3 кадра истории и прогноз примерно на 2 секунды при 15 FPS; 🟢H1-F32 - когда доступен лишь один кадр. 🟡Помимо моделей опубликованы датасет и бенчмарк MolmoMotion-1M - набор из 1,16 млн видео, который охватывает 736 типов движения и около 5,6 тыс. объектов. PointMotionBench состоит из 2,7 тыс. размеченных людьми видеоклипов из сетов DAVIS, HOT3D и WorldTrack.
По замерам Ai2, на этом бенче MolmoMotion точнее всех методов, с которыми его сравнивали, включая генераторы видео и более простые базовые модели.
В симуляции система управления на базе MolmoMotion успешно выполняла 76,3% операций "взять и переставить" против 56,0% у аналога на Molmo 2, а при генерации видео модель улучшила движение по всем пяти измеряемым показателям.
Среди ограничений авторы называют использование лишь 8 точек на объект при обучении. Этого достаточно для общей траектории, но мало для точного описания сложных деформаций. 📌Лицензирование: Apache 2.0 License 🟡Блогпост 🟡Релиз на HuggingFace 🟡Техотчёт 🖥Github @ai_machinelearning_big_data #AI #ML # #MolmoMotion #Ai2

✔️ Exa запустила агентную платформу для веб-поиска и парсинга данных Компания открыла доступ к Agent API, инструменту для ресёрча и обогащения данных из интернета. По словам Exa, выполнение задач обходится вдвое дешевле по сравнению с GPT 5.5 и Claude Opus. Платформа работает на базе собственного движка, LLM и алгоритма извлечения текста Highlights. При парсинге объемных данных система разбивает процесс на подзадачи и запускает субагентов для параллельного сканирования доменов. В ходе поиска Agent API маршрутизирует запросы между разными моделями в зависимости от сложности, а алгоритм Highlights собирает только целевые фрагменты страниц. Механизм снижает расход токенов на 94%. В профильном бенчмарке WideSearch инструмент обошел Perplexity Agent по метрике row-level F1. API поддерживает кастомные JSON-шаблоны для вывода структурированных таблиц и загрузку пользовательских списков для автозаполнения недостающих данных. В тарифной сетке доступно несколько режимов: базовый стоит $0,012 за запрос, стандартный - $0,10, максимальный - $1. Плюс есть автоматический режим балансировки нагрузки. @ai_machinelearning_big_data #news #ai #ml

✔️ Бывший советник по ИИ Белого Дома возглавит новую команду в OpenAI Аналитик Дин Болл рассказал в личном блоге, что в начал
✔️ Бывший советник по ИИ Белого Дома возглавит новую команду в OpenAI Аналитик Дин Болл рассказал в личном блоге, что в начале июля присоединится к OpenAI на должность главы Strategic Futures, нового подразделения, которое займётся вопросами политики в сфере ИИ. Strategic Futures - небольшая команда с высокой степенью самостоятельности, которая будет подчиняться директору по стратегии OpenAI Джейсону Квону. В сферу её ответственности он включает катастрофические риски, рекурсивное самоулучшение моделей, влияние ИИ на рынок труда, а также отношения между ИИ-лабораториями, государствами и обществом. Экспертиза в ML или политике в сфере ИИ при этом не обязательна, Дин рассчитывает собрать команду из представителей разных дисциплин и сейчас открыт к обращениям кандидатов. Ранее Болл работал в Белом доме, где занимался вопросами политики в области ИИ. Своё решение перейти в OpenAI он объясняет собственными представлениями об управлении передовыми технологиями.
ИИ нуждается в регулировании, но одновременно сам становится новым инструментом управления, а наиболее значимые решения в этой области, вероятно, будут приниматься внутри лабораторий, а не внешними институтами. Чтобы вести содержательную работу по политике ИИ, технологию необходимо понимать изнутри.
@ai_machinelearning_big_data #news #ai #ml

✔️ В macOS-клиенте Codex появилась возможность создания сценариев OpenAI добавила функцию Record and Replay в Codex для автоматизации десктопной рутины. Инструмент записывает повторяющиеся действия пользователя и конвертирует их в структурированный алгоритм. Пользователь вручную управляет процессом записи. После захвата действий модель генерирует редактируемый сценарий. Его можно сохранить для запуска в будущем. Пока функция работает в виде опциональной настройки только в клиенте для macOS. Для её использования требуется активировать специальное разрешение Computer Use. Из-за региональных ограничений релиз недоступен на территории стран ЕЭЗ, Великобритании и Швейцарии. OpenAIDevs в сети Х ✔️ Artificial Analysis запустила бенчмарк для оценки работы ИИ в бизнес-проектах Тест AA-Briefcase был разработан совместно с Google, McKinsey и BCG. Он состоит из 91 задачи, симулирующей процессы в Data Science, управлении продуктами, банкинге и промышленности. Модели ранжируются по качеству аналитики, точности ответов и формату данных. Лидером рейтинга стала Fable 5, второе и третье место - Opus 4.8 и GLM-5.2. Показатели успешности остаются низкими, лидер достиг 100% результата лишь в 3% случаев и не набрал половины баллов в 31 задании. В опенсорс-сегменте GLM-5.2 уступила Opus 4.8 на 90 баллов при четырехкратной разнице в стоимости использования. Разброс цены за выполнение одной задачи составил от 4 центов у DeepSeek V4 до 31 доллара у Fable 5. Авторы бенчмарка зафиксировали, что для прохождения тестов моделям-литерам регулярно требовались инструменты визуального анализа. artificialanalysis.ai ✔️ Google DeepMind на этой неделе лишилась двух ИИ-звезд Команду покинул Джон Джампер, руководитель проекта AlphaFold и лауреат Нобелевской премии по химии 2024 года. После почти 9 лет работы в подразделении он принял решение перейти в Anthropic. Джампер получил мировое признание за создание алгоритма, совершившего революцию в предсказании трехмерной структуры белков, разделив награду с Демисом Хассабисом. Незадолго до этого о своем уходе в OpenAI объявил Ноам Шазир. Он занимал пост соруководителя разработки Gemini и был одним из ключевых создателей архитектуры ризонинга языковых моделей Google. Всего за несколько дней Anthropic и OpenAI удалось переманить двух важнейших специалистов, напрямую определявших развитие ИИ-продуктов поискового гиганта. John Jumper и Noam Shazeer в сети Х ✔️ Genesis AI показал складного колесного робота Стартап, поддерживаемый Эриком Шмидтом представил складного колёсного робота Eno на базе собственной модели GENE. В отличие от двуногих платформ, Eno передвигается на колёсном шасси с регулируемой стойкой из шарнирных панелей. Устройство меняет высоту на ходу и складывается до размеров чемодана. Робот получил руки с 20 активными степенями свободы и обратной связью. За управление отвечает модель GENE, которая работает как физический агент - анализирует обстановку и адаптируется к изменениям без запрограммированных сценариев. Genesis AI собрала несколько десятков предсерийных образцов. К концу года компания планирует запустить производство для складской логистики, а в перспективе вывести устройство в отели, больницы и потребительский сектор. genesis.ai ✔️ Норвегия запретила использование ИИ в начальных классах В конце августа страна закроет доступ к инструментам генеративного ИИ для учеников 1–7 классов (6–13 лет). В средней школе (14–16 лет) использование нейросетей допускается только под контролем учителей. Обучать работе с алгоритмами будут исключительно старшеклассников. Правительство считает, что ИИ позволяет школьникам обходить образовательные процессы, вредя базовому освоению чтения, письма и математики. Общее снижение успеваемости с 2015 года власти напрямую связывают с цифровизацией обучения. Помимо ограничений для ИИ, в классы вернут бумажные учебники. Ранее в Норвегии уже запретили использование смартфонов на уроках, а в ближайшее время планируется ввести запрет на доступ к социальным сетям для детей младше 16 лет. reuters.com @ai_machinelearning_big_data #news #ai #ml

✔️ DeepSeek раскатал Vision Mode в чат-боте DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддержи
✔️ DeepSeek раскатал Vision Mode в чат-боте DeepSeek запустил Vision Mode в веб-версии и мобильном приложении. Режим поддерживает визуальный CoT для сложных задач (геометрические выводы, анализ графиков и прямую конвертацию UI-скринов в HTML). В основе функции лежит работа Thinking with Visual Primitives, в которой авторы решили проблему восприятия MMLM при точной локализации и пространственных рассуждениях.
Координаты и граничные рамки используются как минимальные единицы мышления и встраиваются непосредственно в визуальную цепочку CoT. Это дает модели точную пространственную ориентацию в инференсе без опоры на описания естественным языком.
Vision Mode обрабатывает только статические изображения. Поддержки аудио, видео и генерации картинок нет. @ai_machinelearning_big_data #news #ai #ml

📌 DeepMind опубликовала архитектуру безопасности AI Control Roadmap Вслед за недавними размышлениями об эволюции AGI в ASI,
+1
📌 DeepMind опубликовала архитектуру безопасности AI Control Roadmap Вслед за недавними размышлениями об эволюции AGI в ASI, исследовательское подразделение Google представила внутренний регламент контроля высокоразвитых ИИ-агентов. Помимо привычного элайнмента модели, DeepMind добавляет отдельный слой системного контроля, пересобирая защиту исходя из худшего сценария.
За вводную берётся то, что система изначально враждебна, имеет скрытые цели и тайно работает против разработчиков.
Для систематизации таких угроз взяли за основу популярный фреймворк MITRE ATT&CK и создали на его базе TRAIT&R, новую таксономию тактик и методов обхода защиты. Она учитывает специфику ИИ и описывает векторы атак, недоступные людям: от незаметного саботажа научных исследований и внедрения бэкдоров до распределенных цепочек взлома, когда фрагменты вредоносного плана синхронно выполняются сотнями разных инстансов одного агента. Защита выстроена по принципу эскалации и делится на уровни D1–D4 для систем обнаружения и R1–R3 для механизмов реагирования. На базовых этапах безопасность обеспечивается анализом CoT агента в песочницах под присмотром более слабых, но надежных ИИ-супервизоров. По мере развития способностей модели начинают понимать факт слежки и учатся скрывать ход своих мыслей. Для контроля над такими системами (это уровень D4/R3) традиционные методы больше не работают. На этом этапе DeepMind планирует применят более затратные меры, вплоть до проверки внутренних состояний модели, использования изолированных копий самой недоверенной системы для аудита и инфраструктуры экстренной остановки агентов и запущенных ими процессов. Вместе с новой стратегией опубликован отдельный документ для индустрии о том, как сделать агентов безопасными по мере их распространения, и он разбит на 3 уровня: 🟡Безопасность отдельного агента
Как защитить одну систему от утечек данных, чужих манипуляций и от собственных ошибочных действий, и зачем для этого нужны общие стандарты.
🟡Риски взаимодействия агентов
Каскадные сбои, негласный сговор алгоритмов, ситуации, где за вред никто конкретно не отвечает, и атаки, рассчитанные сразу на сеть агентов.
🟡Общая кибербезопасность
Как помочь защитникам сохранить преимущество перед злоумышленниками (автоматический поиск и устранение уязвимостей, обмен сигналами об угрозах, обучение специалистов).
@ai_machinelearning_big_data #news #ai #ml