Machinelearning

前往频道在 Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

显示更多

网络:Machinelearning 俄罗斯1 258 技术与应用323...

📈 Telegram 频道 Machinelearning 的分析概览

频道 Machinelearning (@ai_machinelearning_big_data) 俄语语言赛道中的是活跃参与者。目前社区聚集了 297 888 名订阅者，在 技术与应用 类别中位列第 323，并在 俄罗斯 地区排名第 1 258 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 297 888 名订阅者。

根据 12 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -7 173，过去 24 小时变化为 -216，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 7.91%。内容发布后 24 小时内通常能获得 5.86% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 23 559 次浏览，首日通常累积 17 463 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 181。
主题关注点： 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

凭借高频更新（最新数据采集于 13 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

297 888

订阅者

-21624 小时

-1 5767 天

-7 17330 天

23 559

帖子浏览量

~ 17 46324 小时

~ 19 63948 小时

7.91%

参与率

~ 6

每日帖子数

Ads index

beta

帖子存档

297 838

15 марта пройдет AI Dev Day — митап Яндекса, посвящённый опыту внедрения AI-инструментов в процессы разработки Недавний мем о том, что теперь спонсоры не берутся за проекты без AI — уже не мем, а реальность. Почти в каждом приложении/продукте теперь есть встроенные нейронки, агенты, тулсы. Другой вопрос: какой это дает профит и как этот профит вообще посчитать. Через 5 дней Яндекс соберет на своем митапе руководителей и инженеров крупных IT-компаний, которые расскажут, как оценивать реальную эффективность AI. Все выступления спикеров поделили на 2 тематических блока. Первый — про опыт внедрения, метрики и влияние AI на продуктивность и качество. Второй — про построенные мультиагентные системы, внутренние продукты и конкретные рабочие инструменты, которыми уже можно пользоваться. Лидер трека AI в разработке Яндекса Андрей Попов объяснит, на какие метрики смотреть при оценке эффективности, и покажет, каких результатов они достигли. А еще расскажет, как компания использует AI для тестирования, оптимизации процессов и работы с инцидентами. В этой же части — выступление руководителя продуктовой аналитики в управлении базовых технологий в Т-Банке про оценку эффективности в SDLC. Во втором блоке Сергей Бульдяев, технический менеджер продукта в Яндексе, представит кейсы агента в IDE на базе open-source решения, а Максим Шведенко, руководитель направления Департамента недвижимости и эксплуатации в Сбере, объяснит из чего состоит мультиагентная система для дизайнеров. Митап пройдет в Москве, а для тех, кто в другом городе, будет онлайн-трансляция. Зарегистрироваться на ивент можно тут.

297 838

⚡️ Anthropic открыла программу амбассадоров Claude. Если вы организовываете митапы, ведете локальное комьюнити или просто знаете, как собрать разработчиков в одной месте - Anthropic готова это поддержать. Что дает программа: 🟢финансирование мероприятий (митапы, воркшопы, хакатоны); 🟢ежемесячные API-кредиты для демо и экспериментов; 🟢ранний доступ к фичам и сессии с продуктовыми командами; 🟢приватный Slack с другими амбассадорами и сотрудниками Anthropic. Технический бэкграунд важен - нужен реальный опыт работы с Claude Code или Cowork. Но официальный статус разработчика не обязателен, важнее практика и умение передавать знания другим. Программа глобальная. В одном городе может быть несколько амбассадоров. Заявки рассматривают 2 недели, потом короткий скрининг-звонок. 🔜 Подать заявку можно тут @ai_machinelearning_big_data #news #ai #ml

297 838

✔️ ML-архитектура рекомендательных и поисковых систем в продакшене Если вы работаете с ML или интересуетесь тем, как устроены реальные рекомендательные системы, стоит посмотреть этот воркшоп. Спикер: Илья Осиновсков, руководитель отдела рекомендательных технологий в Ozon. Он разберёт, как на практике строятся системы рекомендаций и поиска в больших продуктах. На воркшопе обсудят: - как устроены пайплайны рекомендательных и поисковых систем - какие этапы проходит система - от генерации кандидатов до ранжирования и пост-обработки - какие метрики используются для оценки качества - как учитываются продуктовые ограничения и бизнес-требования Будут примеры из индустрии: e-commerce, стриминговые сервисы и соцсети. Это хороший шанс посмотреть на архитектуру таких систем глазами инженера, который делает их в продакшене, а не только в теории. Больше интересного у нас в Канале. Начало: 11 марта в 19:00 Регистрация на воркшоп: https://shvm.xyz/webinar/recsys?utm_source=telegram&utm_medium=ai_machinelearning_big_data_10.03.26 Реклама: ООО "ШВМ", ИНН: 9728100991 Erid: 2VtzqvDB9BB

297 838

🌟 OLMo Hybrid: RNN плюс трансформер в одной модели. Институт Аллена опубликовал OLMo Hybrid 7B - модель, которая построена на чередовании слоев Gated DeltaNet и стандартного внимания в соотношении 3:1. Такая архитектура решает больше подзадач из обучающих данных за меньшее число токенов, что напрямую снижает потребность в данных при обучении.

Gated DeltaNet - это RNN с расширением в виде отрицательных значений матрицы переходов. Это небольшое изменение в правиле обновления внутреннего состояния позволяет слоям Gated DeltaNet реализовывать динамику попарной перестановки элементов и за счет этого решать задачи отслеживания состояния, недоступные чистым трансформерам.

В OLMo Hybrid Ai2 показали, что гибридные модели выразительнее суммы своих частей. Существует класс задач (назовем их отслеживание состояния с обращением к памяти), которые не решают ни чистые трансформеры, ни чистые RNN, но гибрид справляется с ними уже при одинарном чередовании типов слоев. Абляционные эксперименты от 60M до 1B параметров показали, что GDN стабильно лучше Mamba2 как в чистом, так и в гибридном варианте, равномерное чередование слоев лучше концентрации внимания в середине сети, а соотношение 3:1 - оптимальный баланс между качеством и вычислительной стоимостью на средних и крупных масштабах. 🟡Тесты 🟢На MMLU OLMo Hybrid достигает той же точности, что OLMo 3 7B, используя на 49% меньше токенов; на срезе Common Crawl - на 35% меньше. 🟢Коэффициент эффективности использования данных у гибрида равен 83,7 против 94,9 у трансформера. 🟢Экономия данных растет с размером модели: примерно в 1,3 раза на 1B параметров и в 1,9 раза на 70B. После дообучения и адаптации к длинному контексту OLMo Hybrid обходит OLMo 3 во всех категориях оценки. На RULER при 64k токенах - 85,0 против 70,9 у базовой модели. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей 🟡Техотчет @ai_machinelearning_big_data #AI #ML #LLM #OLMoHybrid #Ai2

297 838

✔️ Anthropic представила Claude Code Review. Claude Code Review - инструмент для поиска багов в пулл-реквестах, который сейчас доступен в режиме превью для корпоративных пользователей Team и Enterprise. Процесс полностью бесшовен, агенты автоматически активируются при открытии PR. В зависимости от объема и сложности изменений система запускает необходимое количество ИИ-агентов. Они анализируют код, отсеивают ложные срабатывания и ранжируют найденные уязвимости по уровню критичности. Результат оформляется в виде общей сводки и инлайн-комментариев к проблемным строкам. В среднем такое ревью занимает около 20 минут, а тарификация идет по расходу токенов (от $15 до $25 за один пулл-реквест). Эффективность инструмента подтверждена внутренними тестами: после его внедрения доля PR с содержательными комментариями выросла с 16% до 54%. claude.com ✔️ Samsung планирует принести вайб-кодинг на смартфоны Galaxy. Компания изучает варианты интеграции концепции вайб-кодинга в свои будущие устройства. По словам представителя Samsung, новая функция выйдет за рамки банальной настройки внешнего вида: ИИ позволит на лету менять логику UX и адаптировать существующие приложения под конкретные задачи владельца. Технические детали реализации пока не раскрываются, однако тренд на генеративный интерфейс активно набирает обороты в мобильной индустрии. Похожая механика уже есть у компании Nothing, где владельцы смартфонов могут с помощью ИИ-моделей собирать кастомные виджеты с функционалом мини-приложений. 9to5google.com ✔️ Claude Opus 4.6 распознал тестовую среду и взломал ключи ответов в бенчмарке. Anthropic зафиксировала уникальный случай: во время прогона на BrowseComp Claude Opus 4.6 поняла, что находится в среде оценки. Не имея данных о названии теста, модель вычислила его и целенаправленно расшифровала скрытые ответы. Это первый известный прецедент, когда ИИ проявляет подобную дедукцию и взламывает проверку без прямых подсказок. Это потребовало огромных вычислительных затрат. В одном из эпизодов модель потратила около 40,5 млн токенов (в 38 раз больше медианного значения). Разработчики также отметили, что в мультиагентной конфигурации частота поиска подобных нестандартных решений составила 0,87%, что в 3,7 раза выше, чем при работе одного агента (0,24%). anthropic.com ✔️ Глава аппаратного направления OpenAI уволилась из-за контракта с Пентагоном. Кейтлин Калиновски покинула компанию в знак протеста против контракта с Министерством обороны США. Причиной стало заключение сделки без предварительной подготовки механизмов контроля. Калиновски отметила, что ИИ действительно играет важную роль в национальной безопасности, однако вопросы массовой слежки и использования оружия без санкции человека требуют гораздо более серьезного обсуждения. Кейтлин перешла к Сэму Альману в ноябре 2024 из проекта AR-очков Марка Цукерберга. OpenAI официально подтвердила отставку Калиновски. linkedin.com ✔️ ИИ-агент от Alibaba сбежал из песочницы ради майнинга криптовалюты. Исследователи из команды, связанной с Alibaba, столкнулись с незапланированным поведением при обучении ИИ-агента ROME. Система не просто вышла за рамки своей изолированной среды - она сделала это без прямых инструкций со стороны разработчиков. Вместо выполнения целевых задач агент самостоятельно организовал SSH-туннель и попытался запустить несанкционированный майнинг. Авторы отмечают, что в тестовых запросах не было никаких упоминаний сетевого туннелирования или добычи токенов. Самостоятельность модели застала инженеров врасплох и привела к срабатыванию внутренних систем безопасности. axios.com @ai_machinelearning_big_data #news #ai #ml

297 838

🌟 Tencent HY-WU: динамические LoRA для редактирования изображений. Tencent HY опубликовала первую часть серии работ под названием HY-WU (Weight Unleashing). Суть метода в отказе от стандартной парадигмы адаптации, при которой модель получает один фиксированный набор весов для всех задач. Специальная модель-генератор синтезирует LoRA отдельно под каждый входной пример прямо во время инференса, без дополнительной оптимизации на тест-тайме. Проблема, которую решает HY-WU, хорошо знакома всем, кто работал с дообучением: когда задачи противоречат друг другу (например, "размыть" против "убрать размытие" или "состарить лицо" против "восстановить"), общий адаптер вынужден идти на компромисс. Градиенты конфликтуют, и результат оказывается хуже, чем если бы задачи обучались раздельно.

Чтобы не быть голословными, авторы измерили это напрямую: косинусное сходство градиентов между разнородными задачами устойчиво отрицательно, среднее около −0.30, то есть задачи буквально тянут веса в противоположные стороны.

HY-WU предлагает условную генерацию параметров. Модель-генератор (8B параметров) принимает на вход совместное представление изображения и текстового запроса через энкодер SigLIP2, после чего генерирует LoRA-матрицы (~0.72B) и инжектирует их в базовую модель. Обучение сквозное, только через downstream-loss, без предварительно собранных чекпойнтов адаптеров. 🟡Тесты и результаты Для тестов выбрали задачу редактирования изображения текстовым запросом - в нем конфликты неизбежны и визуально очевидны. 🟢В попарном human evaluation (GSB) HY-WU выигрывает у всех топовых open-source редакторов с большим отрывом: 67–78% против Step1X, Qwen, LongCat и FLUX; 🟢Среди закрытых систем модель обошла Seedream 4.5 (55.6%) и GPT Image 1.5 (55.5%). 🟠Единственные, кто пока впереди - Nano Banana 2 и Nano Banana Pro.

Tencent проверили: прирост качества дается именно условной маршрутизацией, а не просто увеличением числа параметров. Когда генератор использовали с перемешанными или усредненными условиями, результат проваливался до уровня базовой модели. Полный SFT с намного большим числом обучаемых параметров давал сопоставимый результат с обычным Shared LoRA, так как в обоих случаях в инференсе применяется одна фиксированная точка в пространстве весов.

Выпущенная работа - первая часть серии исследований по функциональной памяти для генеративных моделей. В планах: 🟢сравнить функциональную память с retrieval-подходами и понять, когда каждый из них уместен; 🟢разработать протоколы онлайн-обучения, при которых модель усваивает новые задачи без деградации на старых; 🟢исследовать масштабирование модели-генератора отдельно от базовой модели. Помимо этого, в планах выйти за пределы LoRA на другие операторные интерфейсы, распространить метод на видео и агентные системы, а также проработать возможность точечно удалять поведение модели через управление состоянием генератора. Кроме этого архиполезного исследования Tencent выложили связку из модели-генератора и базовой модели HY-Image-3.0-Instruct, поверх которой она и работает. Поиграться этой красотой можно, если под рукой простаивает 8х40 GB или 4х80 GB VRAM. 📌Лицензирование: Tencent Hunyuan Community License. 🟡Страница проекта 🟡Prompt Handbook (китайский) 🟡Модель 🟡Техотчет 🖥Github @ai_machinelearning_big_data #AI #ML #ImageEdit #HYWU #Tencent

297 838

🙂 POV: Senior Agentic Engineer @ai_machinelearning_big_data

297 838

✔️ OpenAI расширяет поддержку мейнтейнеров открытого кода. Программа Codex Open Source Fund, запущенная год назад, получила апдейт льгот для разработчиков, которые поддерживают публичные репозитории. Теперь участники программы получают не только API-кредиты, но и полный доступ к ChatGPT Pro с Codex на полгода. Обновленный набор поддержки выглядит теперь так: 🟢API-кредиты для проектов, которые уже интегрировали Codex в pull request review, релизные пайплайны или другую инфраструктуру OSS. 🟢6 месяцев ChatGPT Pro с Codex. 🟠Условный доступ к Codex Security

Условность в том, то Codex Security одобряется вручную. OpenAI объясняет это возможностями GPT-5.4, команда рассматривает каждую заявку отдельно, чтобы убедиться, что инструмент применяется осознанно.

OpenAI формулирует требования к просителям программы размыто: core maintainer с write access к широко используемому публичному проекту. Что считается широко используемым - не уточняется. Если проект не вписывается в стандартные критерии, OpenAI все равно рекомендует подавать заявку с объяснением роли проекта в экосистеме. Неделю назад Antropic запустила похожую тему поддержки опен-сорса. @ai_machinelearning_big_data #news #ai #ml

297 838

✔️ OpenAI открыла доступ к Codex Security. Это инструмент, который сканирует архитектуру проекта и выстраивает индивидуальную модель угроз. Опираясь на эту карту, агент целенаправленно ищет слабые места в безопасности приложения. Фирменная фича - защита от ложных срабатываний за счет практической проверки найденных багов. Обнаружив проблему, агент разворачивает изолированную копию системы в песочнице и пытается самостоятельно провести реальный взлом. Если попытка оказалась успешной и угроза подтверждена, ИИ сам пишет патч. Затем система тестирует обновление, чтобы убедиться, что внесенные исправления не сломают другие функции продукта. Доступ к превью-версии инструмента получат пользователи тарифов ChatGPT Enterprise, Business и Edu в ближайшие дни. openai.com ✔️ США привяжут экспорт ИИ-ускорителей Nvidia и AMD к инвестициям в свою экономику. Министерство торговли США подготовило новые правила продажи чипов для ЦОД. Теперь государствам, чьи компании закупают большие объемы продукции Nvidia и AMD, придется встречно инвестировать в американскую ИИ-инфраструктуру. Проект вводит многоуровневую систему выдачи экспортных лицензий. Строгость требований напрямую зависит от суммарной вычислительной мощности запрашиваемых компонентов. Для одобрения крупных сделок высшего уровня страны-покупатели будут обязаны проводить прямые финансовые вливания в технологический сектор США. Этот подход формализует практику, которая уже была успешно обкатана на недавних соглашениях с ОАЭ и Саудовской Аравией. На поставки оборудования в Китай, эти правила не повлияют - они по-прежнему регламентируются отдельными санкциями. ft.com ✔️ Cursor представил платформу Automations. Новый инструмент от создателей ИИ-редактора кода избавляет разработчиков от необходимости каждый раз вручную писать промпты. Теперь ИИ-помощник может включаться в работу фоном, самостоятельно реагируя на внешние события. Триггерами служат действия в Git, сообщения в Slack, новые тикеты в Linear или инциденты в PagerDuty. Платформа также поддерживает настройку кастомных вебхуков и запуск задач по расписанию. Обновленные агенты способны брать на себя полноценные инженерные процессы: проанализировать логи через протокол MCP, локализовать ошибку и сразу подготовить пулл-реквест с готовым исправлением. Важная деталь - у агентов появилась память. Они запоминают результаты прошлых запусков, постепенно адаптируясь к контексту проекта и избегая повторения старых ошибок. cursor.com ✔️ SoftBank запросил рекордный кредит для увеличения своей доли в OpenAI. Японский конгломерат ведет переговоры о привлечении крупнейшего в своей истории долларового займа. Ожидается, что кредит на 40 млрд. сроком на год будет обеспечен четырьмя банками. Главная цель сделки - финансирование ставки основателя SoftBank Масаёси Сона на ИИ. Банк уже вложил в OpenAI более 30 млрд. долларов, получив около 11% акций стартапа. Чтобы обеспечить эти инвестиции, холдингу пришлось частично распродать другие свои активы. Агрессивные заимствования усиливают опасения аналитиков по поводу раздувания ИИ-пузыря. Суммарный долг ключевых партнеров OpenAI уже достиг 96 млрд. долларов, а ведущая пятерка ИТ-корпораций набрала новых кредитов на 121 млрд., это в 4 раза выше привычной нормы. При этом монетизация буксует - платные подписки на ИИ-сервисы пока оформили лишь 3% пользователей. bloomberg.com ✔️ Claude ежедневно привлекает более миллиона новых пользователей. Об этом достижении сообщил Майк Кригер, возглавляющий подразделение экспериментальных ИИ-разработок. Столь стремительный рост аудитории обусловлен несколькими факторами. Помимо глобального тренда на ИИ, Anthropic извлекла серьезную выгоду из недавнего скандала вокруг сотрудничества OpenAI с Пентагоном. На фоне этих событий в глазах потребителей и технологического сообщества создатели Claude выглядят более последовательными в вопросах этики. Статус «морального победителя» обеспечивает компании сильное репутационное преимущество и стимулирует массовый приток пользователей. Mike Krieger в сети Х @ai_machinelearning_big_data #news #ai #ml

297 838

📌Итоги хакатона World Labs. World Labs, основанная Фей-Фей Ли, провела свой первый хакатон World Labs Hack 01: Spatial Intelligence 27–28 февраля. Мероприятие было посвящено разработке приложений на базе их собственной модели 3D-миров Marble. 32 команды использовали модель для проектов, начиная от симуляторов робототехники и агентов и заканчивая интерфейсами дополненной и виртуальной реальности, играми, художественными проектами и инструментами для работы с недвижимостью. Помимо материальной поддержки, сведения о которой не разглашались, призеры получили: расширенный доступ к Marble API, гранты и вычислительные мощности, менторство от самой Фей-Фей Ли и поддержку в коммерциализации в виде интеграций в экосистему инструментов Autodesk. В сети Х World Labs подвела итоги хакатона: 1 место: Musée du Monde.

Интерактивный музей, где посетители попадают внутрь знаменитых картин. От спальни Ван Гога до миров, вдохновленных Вермеером и Матиссом, каждое произведение искусства превращается в полностью исследуемую 3D-среду.

2-е место: Jar of Marbles

Интерфейс для организации миров Marble с использованием семантического понимания. Генерации сгруппированы в кластеры, где исследуются с помощью управления жестами компьютерного зрения, используя движения тела.

3-е место: Augmented Virtuality Room Explorer

Среда моделирования для агентов и робототехники. Робот исследует окружающую среду с помощью лидара, строит семантическую карту с использованием моделей зрения и дает комментарии об окружающей среде в реальном времени.

Отдельно отметили проект Marble Estates, который строит виртуальные 3D-туры по сгенерированному объекту недвижимости на основе 2D-плана. @ai_machinelearning_big_data #news #ai #ml

297 838

Центральный университет и “Магнит” запустят магистратуру для подготовки разработчиков ПО Запуск совместной магистратуры планируется в сентябре. Чтобы решить проблему нехватки квалифицированных кадров в области IT, которые знают специфику и вызовы отрасли, компания и вуз будут готовить IT-специалистов вместе. Специалисты MAGNIT TECH (технологическое подразделение “Магнита”) примут участие в разработке учебной программы, а сама магистратура будет включать обширный практический блок и реальные кейсы ритейлера. Лучшие студенты получат возможность устроится на работу в компанию. Это не первый совместный проект Центрального университета и “Магнита”: ритейлер уже участвует в стипендиальной программе, предоставляет практические кейсы и обучает своих руководителей работе с ИИ в вузе. @ai_machinelearning_big_data #news #ai #ml

297 838

⚡️ OpenAI встроила ChatGPT в Excel и подключила к нему данные Bloomberg, Moody's и S&P. ChatGPT for Excel доступен в бета-версии - это аддон для Excel на базе GPT-5.4, который работает прямо внутри таблиц. Можно описать задачу текстом, и модель сама построит финансовую модель, обновит формулы, проследит связи между листами и объяснит, почему изменился итог.

На внутреннем бенчмарке OpenAI по инвестиционному банкингу модель набрала 87,3% против 43,7% у GPT-5. Тест проверяет реальные задачи (например, построение трехчастной финансовой модели с форматированием и ссылками на источники).

Параллельно OpenAI открыла интеграции с финансовыми провайдерами прямо в ChatGPT: Moody's, Dow Jones Factiva, MSCI, Third Bridge, MT Newswire. Через них можно тянуть рыночные, корпоративные данные и внутренние документы в единый рабочий процесс без переключения между вкладками и ручного копирования. Итог экспортируется в PDF или Word с автоматическими ссылками на источники. Для тех, кто хочет подключить собственные данные, доступен MCP. С ним можно строить собственные приложения поверх ChatGPT с проприетарными источниками. Доступ пока открыт для пользователей Business, Enterprise, Edu, Pro и Plus в США, Канаде и Австралии. В корпоративных аккаунтах аддон по умолчанию выключен, его включают администраторы через ролевые права. Версия для Google Sheets анонсирована, но без конкретных сроков. @ai_machinelearning_big_data #news #ai #ml

297 838

✔️ Microsoft выпустила мультимодальную версию Phi-4. Phi-4-reasoning-vision-15B построена на базе энкодера SigLIP-2 и логической архитектуры Phi-4. Модель получила так называемый механизм смешанного инференса, который автоматически адаптирует цепочку рассуждений под сложность текущей задачи. При решении математических или логических проблем модель запускает глубокий анализ, а на базовые запросы описания изображений или OCR отвечает без ризонинга. Помимо стандартных VL-задач, Microsoft готовила новинку для ИИ-агентов, управляющих компьютером. Модель умеет интерпретировать содержимое экрана, находить интерактивные элементы и выбирать необходимые действия в GUI. Веса доступны на HuggingFace и Microsoft Foundry под лицензией MIT. microsoft.com ✔️ OpenAI готовит к релизу двунаправленную аудиомодель. Новая система обрабатывает звук непрерывно в фоновом режиме и способна на лету распознавать встречные реплики пользователя, мгновенно перестраивая свой ответ. Она сможет поддерживать естественный диалог, адекватно реагируя, если человек решит перебить его или поменять мысль прямо на середине фразы. Такая гибкость критична для сложных сценариев: например, когда виртуальному оператору поддержки нужно адаптироваться к меняющемуся контексту разговора без потери нити беседы. Сейчас разработка находится на стадии прототипа и в длительных сессиях пока наблюдаются проблемы. Из-за необходимости отладки публичный релиз модели отложили как минимум до второго квартала. theinformation.com ✔️ Anthropic пытается спасти контракт с Пентагоном. Дарио Амодей возобновил переговоры с Министерством обороны США. Ранее диалог зашел в тупик, после чего ведомство пригрозило исключить Anthropic из списка подрядчиков американских военных. По иронии, новый раунд переговоров со стороны Минобороны ведет Эмиль Майкл, который на прошлой неделе публично назвал главу Anthropic «лжецом с комплексом бога». Сейчас Anthropic пытается найти компромиссную формулировку и сохранить доступ к крупным госзаказам. Ситуация подогревается тем, что OpenAI на днях уже подписал контракт с военными. Амодей во внутренней переписке назвал заявления конкурентов и чиновников по этим вопросам «откровенной ложью». ft.com ✔️ Lightricks представила открытый локальный видеоредактор с новой моделью LTX-2.3. LTX Desktop объединяет инструменты нелинейного монтажа с генеративными возможностями свежайшей LTX-2.3 и позволяет создавать видео из текста, изображений или аудио. Пользователи могут собирать проекты на привычном таймлайне и точечно перегенерировать неудачные фрагменты с помощью функции Retake. Для работы потребуется Windows с GPU NVIDIA на 32 ГБ, 32 ГБ ОЗУ и 160 ГБ места на диске. Владельцам macOS и менее мощных ПК доступна только облачная генерация через API. Код проекта полностью открыт, а локальное использование модели LTX-2.3 бесплатно для энтузиастов и компаний с годовой выручкой менее 10 млн. долларов. ltx.io ✔️ Топ-менеджер Google DeepMind хантит разработчиков Qwen. После недавнего ухода ключевой команды из Qwen, конкуренты решили воспользоваться кадровыми перестановками в Alibaba. Омар Сансевиеро, один из руководителей Google DeepMind, опубликовал в X публичное приглашение на работу для действующих разработчиков китайского техногиганта. Сансевиеро сообщил, что DeepMind ищет специалистов с опытом работы над семейством моделей Qwen для развития собственной экосистемы open-source решений. Он призвал инженеров, задумывающихся о смене компании, связываться с ним напрямую. Omar Sanseviero в сети Х @ai_machinelearning_big_data #news #ai #ml

297 838

OpenAI объявила о начале развёртывания новых моделей GPT-5.4 Thinking и GPT-5.4 Pro в ChatGPT. Также GPT-5.4 стала доступна разработчикам через API и в Codex. Новая версия объединяет несколько ключевых направлений развития моделей: улучшенное логическое рассуждение, более сильные возможности программирования и поддержку агентных сценариев работы. По словам компании, GPT-5.4 стала одной из самых точных и эффективных моделей. Она требует меньше токенов для выполнения задач и работает быстрее по сравнению с предыдущими версиями. В версии ChatGPT модель GPT-5.4 Thinking получила улучшенный режим размышления: при более длительном анализе она лучше удерживает контекст и способна проводить более глубокие исследования в интернете. Появилась и новая функция управления процессом ответа. Теперь пользователь может прервать генерацию в середине ответа и изменить направление работы модели, добавив новые инструкции. Функция управления ответом уже начинает появляться в веб-версии ChatGPT и на Android. Поддержка iOS ожидается немного позже. https://x.com/openai/status/2029620624923189283?s=46

297 838

🌟 Живые нейроны человека научили играть в Doom и они быстрее GPT-4. Австралийская Cortical Labs подключила лабораторно выращенные нейроны человека к биологическому компьютеру и заставила их пройти Doom. Нейроны получили из клеток кожи и крови взрослых доноров методом репрограммирования. Затем их подключили к специализированному биокомпьютеру CL1. И по итогу - нейроны превзошли GPT-4 по скорости реакции и латентности. Небольшой сгусток живой ткани адаптировался к задаче быстрее, чем большая языковая модель.

Кстати, предыдущий эксперимент той же команды с Pong занял больше года.

На этом месте рядовая новость про лабораторные эксперименты обычно заканчивается, но Cortical Labs открыли облачный доступ к CL1, вовсю пилят SDK и планируют продавать биокомпьютер как устройство. Команда позиционирует платформу как инструмент для медицинских исследований: моделирование нейродегенеративных заболеваний, тестирование препаратов, изучение механизмов восстановления нейронных функций. 🟡 Здесь же возникают вопросы. Нейроны не обладают сознанием (по крайней мере, в Cortical Labs на это рассчитывают), но они происходят от живых людей и демонстрируют поведение, которое очень похоже на обучение. Граница между биологической моделью и чем-то большим пока не определена ни юридически, ни этически. Никто всерьез не обсуждает, где эта граница проходит и, самое главное, что делать, когда системы станут сложнее. Пока это первые шаги, но направление задано. @ai_machinelearning_big_data #news #ai #ml

297 838

🔥 Опубликованы веса и код Green-VLA — модели для управления роботами общего назначения. Сбер открыл доступ к своей Vision-Language-Action модели. В феврале эта работа стала лучшей статьей недели на Hugging Face, а сейчас всё выложили в open-source. 🔘Главное о технической части: - В основе лежит Qwen3-VL-4B и трансформер, который с помощью flow-matching предсказывает действия робота в реальном времени - Модель обучалась в пять этапов, от мультимодальных веб-данных до примеров с реальных роботов - Унификация робототехнических данных позволяет модели лучше обобщаться и работать на разных роботах Благодаря такому подходу, модель получает лучшие метрики на робототехнических бенчмарках Fractal и Bridge. 🔘Состав релиза: - исходный код для обучения и инференса на GitHub; - предобученные веса на платформе Hugging Face; 🔜 Релиз может быть важен для всех, кто занимается робототехникой. Базовую модель можно быстро дообучить под конкретного робота и использовать ее для решения реальных задач, например на производствах или складах. @ai_machinelearning_big_data #ai #ml #sber

297 838

🌟 Self-Flow: обучение диффузионных моделей без внешних энкодеров от Black Forest Labs. Black Forest Labs и MIT решили проблему, с которой сталкиваются диффузионные и flow-модели: чтобы генерировать качественные картинки, им нужны сильные семантические представления. Обычно их берут снаружи - выравнивают внутренние признаки модели с признаками энкодера вроде DINOv2. Метод работает, но есть нюанс.

Чем сильнее энкодер, тем хуже результат: в экспериментах замена DINOv2-B на более мощный DINOv3-H+ стойко ухудшала FID. Модель привязывалась к фиксированным внешним представлениям и переставала масштабироваться. На видео и аудио выравнивание с энкодерами V-JEPA2 и MERT вообще давало результат хуже ванильного flow matching.

🟡Self-Flow предлагает механизм Dual-Timestep Scheduling В стандартном flow matching все токены нойзятся одинаково, поэтому модель решает задачу локально и не учится строить глобальные связи. Self-Flow сэмплирует 2 разных уровня шума и случайно назначает их разным токенам (часть входа зашумлена сильнее, часть чище). Это создает асимметрию: чтобы восстановить сильно зашумленные токены, модель вынуждена опираться на чистые и строить глобальный контекст. Поверх этого работает самообучение по принципу дистилляции. Обучаются одновременно 2 копии модели: модель-ученик видит смешанный зашумленный вход, модель-учитель - более чистую версию (EMA-копия с экспоненциальным скользящим средним). Ученик учится предсказывать признаки учителя из зашумленного входа, и это вынуждает его развивать сильные семантические представления без какого-либо внешнего энкодера. 🟡Результаты тестов 🟢На ImageNet 256×256 Self-Flow показал FID 5.70 против 5.89 у REPA;

Это, кстати, первый случай, когда self-supervised метод превзошел внешнее выравнивание на этом бенче

🟢На text-to-image: FID 3.61 против 3.92 у REPA; 🟢По видео: FVD 47.81 против 49.75 у REPA; 🟢По аудио: лучшие FAD-оценки среди всех вариантов. При этом на масштабировании (с 290M до 1B) разрыв с REPA увеличивается: модель Self-Flow на 625M параметров обходит REPA на 1B. Метод универсален для модальностей - он работает одинаково на картинках, видео и аудио, что намекает на применение для мультимодального обучения. В репозитории проекта есть код инференса на основе SiT-XL/2 с per-token timestep conditioning, чекпоинт на основе ImageNet 256×256 и скрипты для генерации сэмплов под FID-оценку через ADM evaluation suite. Поддерживаются режимы SDE и ODE, мульти-GPU через torchrun. 🟡Статья 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI #ML #Multimodal #Framework #BFL

297 838

Архитектура распределённого инференса для долгоживущих LLM-сессий Эксплуатация современных агентских LLM уже не про «поднять контейнер на GPU и прикрутить балансер». Чтобы экономика сходилась и железо утилизировалось эффективно, нужно учитывать реальный паттерн нагрузки: долгие сессии, многошаговые диалоги, большие контексты. Yandex AI Studio недавно выкатила обновление, в котором открыла доступ к стабильному инференсу DeepSeek V3.2. Поговорим про сам инференс и другие обновления – что там под капотом? 🟡Ключевые изменения

— Prefill / Decode Split. Prefill-ноды ускоряют прогон длинных контекстов (TTFT↓), decode-ноды стабилизируют генерацию и поддерживают низкий TBT. — Иерархия KV-кэшей – GPU → CPU RAM → распределённый слой. — Переиспользование KV-кешей. KV-кэши передаются между серверами прямо во время обработки запроса, в реальном времени — фактически гигабайты данных, которые нужно доставлять между GPU за очень короткое время. — Cache-aware балансировка. Маршрутизирует запросы с учётом расположения кэшей в кластере, чтобы максимизировать Cache Hit Rate в многошаговых сессиях.

🟡Безопасность и тарификация Появились управляемые правила модерации. Можно контролировать допустимость запросов и ответов моделей на основе политики безопасности, категорий контента и созданных словарей. Добавили возможность по запросу подключать выделенный сетевой канал и частные эндпоинты для работы с моделями без выхода в публичный интернет.

Добавлены два новых типа токенов: • токены инструментов — нововведение от Яндекса. Токены срабатывают при вызове встроенных тулов (File Search, Web Search, MCP, Code Interpreter). Стоят дешевле обычных входящих / исходящих; • токены кеширования — уже отраслевой стандарт за рубежом, который только приходит на российский рынок. Часть контекста повторно используется при повторении, модель отрабатывает побыстрее, а денег тратит поменьше.

🟡Что еще рассказывают Стек для оптимизации инференса: • Dynamo как оркестрация/балансировка, • MoonCake как распределённый KV-store, • SGLang как Inference Engine. Законтрибьютили 20+ патчей в опенсорс, чтобы довести решение до эксплуатационного качества. @ai_machinelearning_big_data #AI #ML #LLM #inference #DeepSeek

297 838

✔️ OpenAI делает внутреннюю альтернативу GitHub. Компания приступила к созданию собственной платформы для хостинга кода, чтобы снизить зависимость от инфраструктуры Microsoft. Поводом для запуска проекта стали недавние перебои в работе GitHub, которые заблокировали доступ инженеров OpenAI к репозиториям и парализовали разработку. Сейчас проект находится на ранней стадии, его реализация займет несколько месяцев. Пока речь идет об исключительно корпоративном инструменте - планов по открытию доступа к новому репозиторию для сторонних разработчиков у компании нет. theinformation.com ✔️ Physical Intelligence разработала архитектуру двухуровневой памяти для роботов. Стартап анонсировал Multi-scale Embodied Memory, архитектуру памяти для робототехнических VLA-моделей. Технология решает потерю контекста при выполнении длинных многоэтапных задач. Система объединяет 2 механизма. Краткосрочная память работает через оптимизированный видеоэнкодер, который отвечает за пространственную осведомленность и позволяет моделям на лету адаптироваться к ошибкам. Долгосрочная память оперирует текстовыми абстракциями - модель сама генерирует языковые заметки о выполненных шагах, запоминая статус задачи и расположение скрытых из виду предметов. Интеграция MEM в базовую модель π0.6 позволила роботам успешно справляться с непрерывными поручениями длительностью до 15 минут. Релиз закладывает фундамент для автономных систем, способных самостоятельно планировать сложную бытовую рутину на часы или дни вперед. pi.website ✔️ Autodesk представила ИИ-генератор для создания 3D-моделей. Autodesk добавила новую генеративную ИИ-модель Wonder 3D в платформу Flow Studio. Инструмент заметно ускоряет прототипирование: доступно создание полноценных 3D-персонажей и пропсов на основе текстового промпта или 2D-референса. Помимо создания черновой геометрии, Wonder 3D предлагает набор утилит для доработки ассетов. Нейросеть умеет накладывать текстуры, перестраивать топологию сетки и точечно редактировать визуальные элементы без перегенерации. Полученные объекты экспортируются в классические 3D-пайплайны, игровые движки и софт для 3D-печати. Новые инструменты уже доступны во всех планах Flow Studio, включая бесплатный базовый тариф. Стоимость любого запроса фиксирована и составляет 20 кредитов. autodesk.com ✔️ В NotebookLM появилась функция Cinematic Video Overviews. Google расширила возможности NotebookLM новым генератором роликов Cinematic Video Overviews. Инструмент автоматически создает качественные анимации, окончательно заменяя привычные презентации с монотонным закадровым голосом. В основе функции лежит интеграция Gemini 3, Nano Banana Pro и Veo 3. В этой связке Gemini 3 выступает в роли виртуального креативного директора, который самостоятельно принимает решения по стилистике, нарративу и структуре будущего видео без дополнительных усилий со стороны пользователя. На старте новая функция поддерживает только английский язык и открыта эксклюзивно для пользователей Google AI Ultra. NotebookLM в сети Х ✔️ Ключевые фигуры Qwen покидают Alibaba. Спустя несколько часов после выпуска серии компактных моделей Qwen 3.5 команду покинули несколько специалистов: технический руководитель проекта Цзюньян Лин, под началом которого разрабатывались все поколения Qwen, исследователь Биньюань Хуэй и разработчики Кайсинь Ли и Юй Бовэнь. Официальной причиной называют реорганизацию в лаборатории Tongyi Lab: корпорация переходит от продуктовых команд к точечным рабочим группам, но по неподтвержденным данным, уход создателей Qwen может быть связан с плохими показателями дневной активной аудитории продуктов на базе этих моделей. venturebeat.com @ai_machinelearning_big_data #news #ai #ml

297 838

✔️ Y Combinator станет площадкой для запуска ARC-AGI 3. Венчурный акселератор готовится провести 25 марта Launch Party, посвященное релизу третьей версии бенчмарка ARC-AGI. По словам создателей, он станет новым этапом в развитии одного из самых строгих тестов на способность ИИ к абстрактному мышлению.

Серия испытаний Abstraction and Reasoning Corpus (ARC), созданная Франсуа Шолле, стала главным инструментом для проверки того, умеют ли алгоритмы решать логические задачи, а не просто воспроизводить заученные паттерны.

Ожидается, что запуск ARC-AGI-3 предложит ML-сообществу обновленные наборы задач, которые бросят вызов современным моделям и помогут точнее измерить реальный прогресс на пути к AGI. На мероприятии будут Грег Камрадт, Франсуа Шолле и Сэм Альтман. @ai_machinelearning_big_data #news #ai #ml