uk
Feedback
Machinelearning

Machinelearning

Відкрити в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Показати більше

📈 Аналітичний огляд Telegram-каналу Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 297 959 підписників, посідаючи 323 місце в категорії Технології та додатки та 1 260 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 297 959 підписників.

За останніми даними від 11 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -7 224, а за останні 24 години на -206, загальне охоплення залишається високим.

  • Статус верифікації: Не верифікований
  • Рівень залученості (ER): Середній показник залученості аудиторії становить 7.69%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.95% реакцій від загальної кількості підписників.
  • Охоплення публікацій: В середньому кожен допис отримує 22 918 переглядів. Протягом першої доби публікація в середньому набирає 17 745 переглядів.
  • Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 176.
  • Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як openai, claude, api, gemini, контекст.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Завдяки високій частоті оновлень (останні дані отримано 12 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

297 959
Підписники
-20624 години
-1 5177 днів
-7 22430 день
Архів дописів
⚡️ В дом главы OpenAI бросили коктейль Молотова, подозреваемый задержан. 20-летний мужчина метнул самодельное зажигательное устройство в дом Сэма Альтмана в Сан-Франциско, спровоцировав пожар. Скрывшись с места преступления, злоумышленник направился к штаб-квартире OpenAI, расположенной в 5 километрах от дома. Спустя час полиция задержала его возле главного офиса компании - там молодой человек угрожал сжечь здание дотла. В результате инцидентов никто не пострадал и полиция пока не уточняет, находился ли руководитель OpenAI дома в момент нападения. ft.com ✔️ Минфин США и ФРС экстренно собрали глав крупнейших банков из-за модели Mythos. Министр финансов США и председатель ФРС провели закрытую встречу с руководителями Citigroup, Morgan Stanley, Bank of America и Goldman Sachs. Темой срочного совещания стали риски кибербезопасности, спровоцированные релизом модели Mythos от Anthropic. Опасения властей связаны с техническими возможностями модели. Mythos способен находить и самостоятельно эксплуатировать уязвимости нулевого дня во всех основных операционных системах и веб-браузерах. Для системно значимых банков, от которых зависит глобальная экономика, это означает переход киберугроз на принципиально иной уровень автоматизации. Цель экстренного совещания - убедиться, что финансовый сектор осознает масштабы проблемы и готов перестроить защиту внутренних сетей под новые реалии. bloomberglaw.com ✔️ MiniMax выпустил модель генерации музыки Music 2.6. В новой версии улучшили качество сведения и следование инструкциям. Теперь через промпт можно точно задавать BPM, тональность, порядок вступления партий и выстраивать сложную эмоциональную дугу трека. Проведена глубокая оптимизация средних и низких частот. Для работы с готовым материалом появилась функция Cover. Она извлекает мелодический каркас из загруженного аудио и позволяет полностью изменить жанр или аранжировку, сохранив исходный мотив и ритмику. Кроме этого, представлены три новых Music Skills. Они позволяют интегрировать генерацию музыки в сторонние сервисы, собирать динамические плейлисты на основе предпочтений пользователя и наделять виртуальных ассистентов вокалом для импровизаций. Модель доступна в стадии беты с 14-дневным бесплатным использованием. minimax.io ✔️ Релиз DeepSeek V4 ожидается в конце апреля. По данным инсайдеров, новая флагманская модель DeepSeek V4 дебютирует во второй половине апреля. Ожидается, что архитектура будет насчитывать триллионы параметров, а размер контекстного окна расширится до миллионов токенов. Намеки на скорый релиз уже появились в веб-интерфейсе платформы, где разработчики добавили быстрый и экспертный режимы для обработки сложных комплексных запросов. DeepSeek пока воздерживается от официальных комментариев. finance.sina.com.cn ✔️ ЦРУ внедряет ИИ во внутренней аналитике. Разведывательное управление США подготовило первый отчет, сгенерированный ИИ. По словам заместителя директора ведомства, в ближайшие годы ИИ-ассистенты будут встроены во все аналитические платформы ЦРУ. Нейросети возьмут на себя подготовку черновиков, верификацию разрозненных данных, машинный перевод и выявление скрытых трендов. За последний год управление уже протестировало 300 подобных проектов. Активнее применять генеративные модели начнет и Центр киберразведки, курирующий скрытые хакерские операции, хотя право принятия ключевых решений ведомство обещает оставить за людьми. politico.com @ai_machinelearning_big_data #news #ai #ml

⚡️ Anthropic запустила функцию гибридного использования моделей Claude. На Claude Platform новый серверный тул - Аdvisor. Он
+2
⚡️ Anthropic запустила функцию гибридного использования моделей Claude. На Claude Platform новый серверный тул - Аdvisor. Он реализует механику, в которой Sonnet или Haiku идут как исполнитель и ведут задачу от начала до конца, а Opus подключается как советник, чтобы в результате получить качество, близкое к Opus, по цене, близкой к Sonnet. Модель-исполнитель сама решает, когда позвать Opus, он подключается как обычный вызов инструмента. Opus получает выжимку контекста, возвращает план, исправление или сигнал остановки, после чего исполнитель продолжает работу. Советник не вызывает другие инструменты и не пишет в ответ пользователю - только дает указания исполнителю. Все происходит внутри одного запроса, без дополнительных раунд-трипов и ручной оркестрации. Токены советника тарифицируются по его ставкам и репортятся в usage отдельно, так что расход по уровням можно отслеживать.
На SWE-bench Multilingual, связка Sonnet + Opus-advisor дает +2,7% к качеству относительно Sonnet в соло и при этом снижает стоимость на 11,9%. На BrowseComp Haiku + Opus-advisor выдает 41,2% против 19,7% у чисто Haiku, а общая стоимость остаётся на 85% ниже, чем если запускать только Sonnet.
Advisor tool доступен в бете по API. Документация - тут. Как же Антропик волшебно нарисовала график SWE-Bench 🙂 @ai_machinelearning_big_data #news #ai #ml

⚡️ Practical ML Conf 2026: Яндекс зовет выступить на главной конференции по машинному обучению Если вы работаете с технология
⚡️ Practical ML Conf 2026: Яндекс зовет выступить на главной конференции по машинному обучению Если вы работаете с технологиями, которые уже показывают реальные результаты в проектах — самое время рассказать об этом 🗣️ Организаторы помогут спикерам на каждом этапе: от проработки доклада с экспертами до подготовки выступления с тренером по публичным выступлениям и оформления презентации дизайнерами. Доклады отбирает программный комитет. Критериев отбора четыре👇 - новизна - польза для сообщества - практическая применимость - глубина проработки Practical ML Conf — ежегодная конференция Яндекса для ML-практиков — в этом году снова собирает настоящих фанатов машинного обучения. ✔️Заполняйте форму заявки

🚀 Qwen Code обновился - теперь это почти автономный DevOps-агент Вышли версии v0.14.0 – v0.14.2 и это уже не просто тулза, а полноценная система для управления задачами, агентами и инфраструктурой. Что добавили: • Channels - управляешь Qwen Code прямо из Telegram, DingTalk или WeChat Пишешь с телефона - выполняется на сервере • Cron Jobs - регулярные AI-задачи Тесты каждые 30 минут, билд по утрам, мониторинг логов по расписанию • Qwen3.6-Plus - новый флагман 1M контекста и до 1000 бесплатных запросов в день • Sub-agent Model Selection - разные модели под разные задачи Тяжёлую модель на основную логику, быструю на подзадачи Экономия токенов без потери качества • /plan - режим планирования Сначала AI строит план по файлам и шагам, потом ты подтверждаешь и он исполняет • Follow-up Suggestions - после задачи предлагает следующие шаги Типа «добавить тесты?» или «проверить похожие файлы» • Adaptive Output Tokens - умный вывод По умолчанию 8K, но сам расширяется до 64K если не хватает • Ctrl+O - переключение режима ответа Подробный для дебага или компактный для работы https://github.com/QwenLM/qwen-code/releases @ai_machinelearning_big_data #qwen

✔️ Cowork стал доступен на всех платных тарифах и получил инструменты корпоративного администрирования. Anthropic перевела Claude Cowork для macOS и Windows из статуса превью в общий доступ. Агент теперь доступен на всех платных тарифах. Главное в релизе - набор корпоративных функций для развертывания Cowork внутри компаний. Администраторы получили ролевую модель доступа с синхронизацией пользователей через SCIM и возможность задавать лимиты расходов по командам. Закрыт пробел в аудите: теперь через расширенную поддержку OpenTelemetry система логирует вызовы инструментов, операции с файлами и подтверждения действий, а телеметрию можно отгружать в SIEM. Отдельно появился гранулярный контроль над MCP-коннекторами: на уровне организации можно, например, оставить агенту только чтение и заблокировать любые операции записи. Каталог интеграций пополнился официальным коннектором Zoom. claude.com ✔️ ByteDance развернула полнодуплексную голосовую модель. ByteDance представила SeedDuplex, которая продолжает слушать пользователя, пока сама говорит. Модель обрабатывает звук и смысл слитно, поэтому умеет адаптивно определять границы реплик, она отличает реальный конец фразы от паузы на обдумывание. Отдельный модуль шумоподавления отсекает фон и посторонние голоса. По замерам ByteDance, задержка отклика сократилась на 250 мс, а число неуместных перебиваний упало на 40%. Seeduplex уже полностью раскатана в приложении Doubao - основном потребительском продукте ByteDance bytedance.com ✔️ Gemini теперь генерирует интерактивные симуляции прямо в чате. Google добавила в Gemini новый формат ответа: вместе с текстом чат-бот может отдавать интерактивные визуализации. На запрос смоделировать физическую систему или показать структуру молекулы Gemini соберёт рабочий виджет прямо в окне диалога. Визуализациями можно управлять. Например, в ответе про орбиту Луны появляются ползунки для начальной скорости и силы гравитации — значения можно тянуть мышью или вбивать вручную, а траектория и устойчивость орбиты пересчитываются на лету. Обновление уже раскатывается на всех пользователей приложения Gemini, за исключением корпоративных аккаунтов Workspace и Education. Чтобы попробовать, нужно переключиться на модель Pro и добавить в промпт команду «помоги визуализировать». blog.google ✔️ LM Studio приобрела стартап Locally AI. LM Studio объявила о поглощении проекта Locally AI, разработчика приложений для локального инференса на iPhone, iPad и Mac. Основатель стартапа Адриен Грондин переходит в LM Studio и возглавит направление кросс-платформенных интерфейсов. Сделка нужна, чтобы вывести LM Studio за пределы десктопа: до сих пор клиент работал только на macOS, Windows и Linux. На базе наработок Locally AI разработчики смогут запускать локальных агентов на мобильных устройствах. В ближайших планах LM Studio - связать десктопную и мобильную версии в одну экосистему, чтобы модели и чаты синхронизировались между устройствами пользователя. lmstudio.ai ✔️ Cursor перевел ревьюера Bugbot на онлайн-обучение. Cursor изменил схему тренировки Bugbot, ИИ-инструмента для код-ревью. Раньше модель обновляли редкими офлайн-итерациями, теперь она дообучается в процессе ревью реальных PR. Bugbot собирает 3 типа сигналов: дизлайки на собственные замечания, ответы разработчиков с разбором ошибок модели и комментарии людей, которые указывают на пропущенные баги. На основе этой обратной связи бот формулирует кастомные инструкции, подстраивающие его под бизнес-логику целевого репозитория. После перехода на непрерывное обучение доля валидных срабатываний выросла до 78%. Это выше, чем у Greptile, CodeRabbit и GitHub Copilot. Включить генерацию правил и прогнать ретроспективное обучение можно в дашборде Cursor. cursor.com @ai_machinelearning_big_data #news #ai #ml

🌟 OpenAI только что объявила о серьезных изменениях в тарифной линейке ChatGPT. Появился новый тариф Pro за $100 в месяц, за
🌟 OpenAI только что объявила о серьезных изменениях в тарифной линейке ChatGPT. Появился новый тариф Pro за $100 в месяц, заточенный под Codex. По словам компании, он дает в 5 раз больше лимитов на Codex по сравнению с Plus и рассчитан на длинные, ресурсоемкие сессии. Все существующие фичи Pro никуда не делись: эксклюзивная Pro-модель, безлимитный доступ к Instant и Thinking моделям. До 31 мая подписчикам нового Pro дают до 10x использования Codex относительно Plus - чтобы люди могли распробовать и привыкнуть. А вот для Plus-подписчиков новости менее радужные. Промо-период с расширенным доступом к Codex закончился, и OpenAI ребалансирует лимиты: теперь упор на больше коротких сессий в течение недели вместо длинных марафонов за один день. По сути, если вы активно пользовались Codex на Plus и вам хватало - готовьтесь к тому, что лимиты стали жестче. OpenAI прямо говорит, что Plus за $20 остается лучшим вариантом для повседневного использования, а для тяжелой работы с Codex теперь нужно переходить на Pro. https://chatgpt.com/ru-RU/pricing/ @ai_machinelearning_big_data #openai

✔️ Анонимная модель HappyHorse-1.0 возглавила арену ИИ-видео. 7 апреля на Artificial Analysis Video Arena без анонсов, пресс-
+5
✔️ Анонимная модель HappyHorse-1.0 возглавила арену ИИ-видео. 7 апреля на Artificial Analysis Video Arena без анонсов, пресс-релизов и корпоративного бэкграунда появилась модель HappyHorse-1.0, которая сразу заняла 1 место. 🟢В категории text-to-video без аудио она обошла Seedance 2.0. 🟢В image-to-video без аудио рейтинг ещё выше - 1391–1406 Elo, это новый абсолютный максимум арены. 🟠В треке с аудио HappyHorse идет второй, уступая только Seedance 2.0. 🟡Команда, которая стоит за моделью официально не раскрыта. Все, что известно о внутреннем устройстве, собрано из описаний на happyhorse-ai.com (домен, кстати зарегистрирован 7 апреля). Заявлено 15 млрд. параметров и 40-слойный трансформер, обрабатывающий текстовые, визуальные и аудио-токены в единой последовательности, без перекрестного внимания и без отдельных подсетей под каждую модальность. Инференс идет за 8 шагов без CFG, с ускорением через собственный компилятор MagiCompiler. Пятисекундный ролик в 1080p, по данным авторов, рендерится примерно за 38 секунд на H100. Поддерживается совместная генерация видео и синхронного аудио с липсинком на 7 языках, включая китайский, английский, японский и кантонский. GitHub и Model Hub помечены как coming soon. 🟡Вокруг авторства в сети идет активное расследование. Одна версия связывает HappyHorse с Alibaba: в пользу этого играет название (2026 - год Лошади по китайскому календарю).
Издание The Information ссылаясь на 2 источника, эту версию подтвердило.
Другая - указывает на Tongyi Lab и линейку Wan, однако технические описания HappyHorse и недавно вышедшей Wan 2.7 расходятся: Wan 2.7 делает акцент на ризонинге и длинном тексте, тогда как HappyHorse строится вокруг однопоточного трансформера и 8-шагового инференса. Третья версия, набирающая вес в техническом сообществе, строится на сходстве HappyHorse с открытой моделью daVinci-MagiHuman от SandАi, вышедшей в марте: совпадают метрики визуального качества, следования промту, физической консистентности и WER голоса.
Если релиз состоится на условиях open source с коммерческой лицензией, как следует из описания на сайте модели, это станет первым случаем, когда открытая видеомодель обошла закрытых лидеров в пользовательских слепых тестах.
@ai_machinelearning_big_data #news #ai #ml

На Stepik вышел курс: Vibecoding — Claude Code, Codex, Cursor и coding agents в 2026. Хотите работать с Claude Code, Codex и
На Stepik вышел курс: Vibecoding — Claude Code, Codex, Cursor и coding agents в 2026. Хотите работать с Claude Code, Codex и Cursor так, чтобы coding agents действительно тащили заметную часть разработки: фичи, отладку, тесты, рефакторинг, MVP и многошаговые задачи? Этот курс — про современный vibecoding workflow и agentic development в 2026. В программе: — Claude Code, Codex, Cursor — agent mode и многошаговые задачи — работа с кодовой базой — subagents, hooks, skills — MCP и внешние инструменты — ревью кода, изменения и контроль качества Подойдёт всем, кто регулярно работает с кодом: разработчикам, ML-инженерам, дата-сайентистам, аналитикам, automation-специалистам и техническим фаундерам. Скидка 40% действует 48 часов. Пройти курс на Stepik Реклама: Ип Малышкин А.А. ИНН: 402571325199, Erid: 2VtzqwkzCJa

🙂 Проект badclaude якобы получил абьюз от Антропик. История с завирусившимся в сети проектом badclaude получила продолжение.
+2
🙂 Проект badclaude якобы получил абьюз от Антропик. История с завирусившимся в сети проектом badclaude получила продолжение.
BadClaude добавляет поверх интерфейса Claude анимацию кнута: при нажатии он отправляет команду прерывания и просит модель отвечать быстрее, сопровождая это оскорбительными сообщениями в адрес ИИ.
Автор проекта опубликовал в сети Х скан письма от Антропик, в котором компания требует удаления всех упоминаний Claude и Anthropic из репозитория проекта до 14 апреля. Твит подхватили крупные СМИ: Yahoo Tech и MSN написали про "серьезные этические проблемы из-за злоупотребления неймингом". Тем временем, создатель badclaude добавил в репозитории проекта roadmap, в котором абьюз от Anthropic является вторым этапом после релиза. В планах проекта: криптомайнер, логи о том, сколько раз вы хлестали Клода кнутом и обновленная физика кнута. Подлинность письма-претензии не подтверждена. Является ли эта история троллингом или PR-акцией проекта - неизвестно. @ai_machinelearning_big_data #news #ai #ml

📌 Tongyi Lab сломали мультимодальный RAG. Разбираем VimRAG У классического RAG есть проблем - state blindness. Агент тащит з
+4
📌 Tongyi Lab сломали мультимодальный RAG. Разбираем VimRAG У классического RAG есть проблем - state blindness. Агент тащит за собой линейную историю, и пока контекст текстовый, это работает. Но добавь картинки и видео, и все сыпется. Визуал жрет токены, агент ходит по кругу, делает повторные запросы и теряет нить. Tongyi Lab (Alibaba) предложили решение проблемы - VimRAG. Вместо линейной цепочки рассуждение моделируется как направленный ациклический граф (DAG). Узлы хранят состояния агента и мультимодальные рассуждения. Это позволяет отслеживать пути, убирать дубли и видеть, какие куски контекста реально повлияли на результат. Для работы с визуалом придумали Graph-Modulated Visual Memory Encoding: значимость узла памяти оценивается по его позиции в топологии графа. Важным доказательствам больше токенов в высоком разрешении, мусору - меньше. Адаптивная аллокация вместо тупого сжатия. На бенчмарках VimRAG выдает SOTA результат по мультимодальным RAG задачам, включая SlideVQA, MMLongBench, Large-Scale LVBench и другие. При этом graph pruning заметно ускоряет обучение. Paper: arxiv.org/abs/2602.12735 GitHub: github.com/Alibaba-NLP/VRAG @ai_machinelearning_big_data

🚨 Почему ИИ в России упирается не в модели, а в инфраструктуру На Data Fusion прозвучал довольно трезвый тезис. Основные ограничения сейчас не в алгоритмах и не в кадрах. Упираемся в железо и экономику. ЦОДы стоят дорого. Доступ к мощным чипам ограничен. Такие вещи сложно тянуть в одиночку даже крупным компаниям. Плюс экономика проектов. Большинство ИИ-решений требует серьёзных вложений и долго выходит в плюс. Внутри бизнеса такие инициативы часто проигрывают более быстрым по окупаемости направлениям. В итоге возникает разрыв. Технологии есть, спрос есть, но масштабирование тормозится на уровне инфраструктуры и инвестиций. Обсуждают стандартные инструменты ускорения. Субсидии, налоговые льготы, поддержка инфраструктурных проектов. Смысл простой. Чтобы ИИ стал массовой технологией, а не точечными кейсами, нужна среда, где такие проекты можно запускать и доводить до продакшена без чрезмерных рисков. По факту вопрос сейчас не в том, можем ли делать ИИ. Вопрос в том, как быстро это можно масштабировать.

🙂 Распаковка долгожданной клавиатуры от Anthropic. Хит 2026 года! Да, это генерация Сделано одним проходом на Gemini + Veo 3.1 Lite + ASMR-голос от Elevenlabs. @ai_machinelearning_big_data

✔️ Anthropic Claude Managed Agents: готовая облачная инфраструктура для агентов. Стартовала публичная бета набора API для создания и запуска автономных ИИ-агентов. Сервис берет на себя всю бэкенд-рутину: песочницы, состояния сессий, контроль доступа и оркестрацию. Claude Managed Agents поддерживает долгие автономные сессии: агенты работают часами, сохраняя контекст и прогресс даже при обрывах связи. Доступна и мультиагентная координация - главная модель запускает подчиненных агентов для параллельных задач. Ключевая фича - самооценка: алгоритм итеративно дорабатывает результат до соответствия критериям. Тарификация: стандартная оплата за токены плюс $0.08 за час активного рантайма. Развернуть агентов можно через веб-консоль Claude, CLI или Claude Code. Вот почему Антропик забанил клешню. claude.com ✔️Лаборатория Цукерберга выпустила модель Muse Spark. Muse Spark - первая мультимодальная модель из семейства Avocado, созданная в Superintelligence Lab. Доступ открыт через веб-сайт и фирменное приложение, для разработчиков запущено закрытое тестирование API. Архитектура поддерживает визуальную цепочку рассуждений, использование внешних инструментов и оркестрацию агентов. Фишка релиза - режим Contemplating Mode: несколько ИИ-агентов параллельно анализируют сложную задачу. По независимым тестам модель держится в топ-5, уступая лишь GPT-5.4 и Gemini 3.1 Pro. Создатели отчитались о высоких результатах в визуальных STEM-задачах и медицинской аналитике, но признают отставание в коде и долгих многоэтапных сценариях. reuters.com ✔️ Stability AI запустила ИИ-платформу Brand Studio. Продукт ориентирован на бизнес, которому нужны консистентные генерации в едином визуальном стиле. В основе - инструмент Brand Central, позволяющий дообучать модели на дизайне компании: корпоративные цвета, композиция, стилистика фото, правила размещения логотипов. Технически Brand Studio - хаб-оркестратор. Умная маршрутизация подбирает оптимальную модель под каждый промпт, переключаясь между Stable Diffusion и Nano Banana или Seedream. Для сложных задач есть Producer Mode: агент сам разбивает ТЗ на пошаговый план с возможностью ручной корректировки. Сервис заточен под энтерпрайз: ролевой доступ, единый вход, совместная работа с макетами. Базовая подписка - $50 в месяц, на триале дают 1000 кредитов. stability.ai ✔️ Cloudflare перейдет на постквантовое шифрование в 2029 году. Cloudflare ускоряет переход на постквантовую криптографию и планирует полностью защитить свою инфраструктуру, включая механизмы аутентификации, уже к 2029 году. Сокращение сроков вызвано недавними исследованиями Google и Oratomic. Последние доказали, что момент, когда вычислительные системы смогут ломать современные шифры, наступит не в 2035-м, а раньше. Cloudflare предупреждает, что добавления PQ-алгоритмов мало, для защиты от даунгрейд-атак придется полностью отказаться от уязвимых протоколов, а ротация скомпрометированных секретов займет годы. cloudflare.com ✔️ Точность Google AI Overviews составляет 91%. Стартап Oumi провел независимое тестирование Google AI Overviews по бенчмарку SimpleQA. Переход поисковика на Gemini 3 поднял общую точность ответов с 85% до 91%. Но качество указания источников парадоксальным образом ухудшилось. Доля ответов, где информация верна, но ссылки ее не подтверждают выросла с 37% до 56%. Система регулярно опирается на посты в соцсетях, игнорируя более авторитетные ресурсы. Кроме того, поисковый ИИ уязвим к SEO-манипуляциям: алгоритм охотно подхватывает фейковые факты из оптимизированных блогов и выдает их за истину в первой строке выдачи. В итоге, несмотря на рост точности, проблема некорректного связывания данных и источников делает верификацию ответов крайне сложной. nytimes.com @ai_machinelearning_big_data #news #ai #ml

+3
🌟 WildDet3D: открытая модель монокулярной 3D-детекции по одному снимку. Институт Аллена представил модель WildDet3D, которая по одному изображению строит 3D-рамки объектов: оценивает их положение, размер и ориентацию в метрических координатах. Модель принимает сразу несколько типов промптов: текстовый запрос, клик по точке или готовый 2D-бокс от внешнего детектора. 🟡Архитектура состоит из 3 блоков 2D-детектор построен на SAM3 и обрабатывает все типы запросов. Геометрическая ветка использует энкодер DINOv2 с обучаемым декодером глубины, учитывающим геометрию обзора: направления лучей камеры зашиваются через сферические гармоники, что снимает необходимость в отдельной калибровке. Третий компонент, 3D-head, объединяет через кросс-внимание 2D-детекции с признаками глубины и поднимает их в полноценные 3D-боксы. Если на инференсе доступны данные с LiDAR, ToF или стереокамеры, они подмешиваются в ту же геометрическую ветку без переобучения. 🟡Тесты На бенчмарке Omni3D модель показывает 34,2 AP с текстовыми промптами (это +5,8 пункта к прежнему лидеру 3D-MOOD). На zero-shot переносе на Argoverse 2 WildDet3D практически удваивает прежний результат: 40,3 ODS против 23,8. На редких категориях из собственного бенчмарка WildDet3D-Bench успехи, разумеется, еще лучше - 47,4 AP против 2,4 у 3D-MOOD. 🟡Вместе с моделью вышло демо-приложение для iOS. Оно использует видеопоток с камеры iPhone и данные LiDAR-сенсора, чтобы в реальном времени отрисовывать 3D-боксы поверх сцены как AR-оверлей. Это наглядная демонстрация того, как монокулярная модель усиливается, когда устройство умеет отдавать дополнительный сигнал глубины. 🟡Третья часть релиза - датасет WildDet3D-Data. Более 1 млн. изображений и 3,7 млн. верифицированных 3D-аннотаций, охватывающих свыше 13 тыс. категорий объектов. По сценам распределение получилось такое: 52% помещений, 32% городской среды и 15% природы. Он собран на основе 2D-наборов (COCO, LVIS, Objects365, V3Det): кандидаты в 3D-боксы генерировались 5 независимыми методами оценки геометрии, затем фильтровались, проверялись VLM и дополнительно отбирались людьми. 🟡Статья 🟡Модель 🟡Техотчет 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #CV #Detection #WildDet3D #Ai2

🚀 Qwen 3.6-Plus забрал все три первых места на OpenRouter. Одновременно. Alibaba выкатили новую модель, и она сразу заняла #
🚀 Qwen 3.6-Plus забрал все три первых места на OpenRouter. Одновременно. Alibaba выкатили новую модель, и она сразу заняла #1 в трех рейтингах OpenRouter: Daily, Weekly и Trending. Такого там раньше никто не делал. Модель уже вышла из триала и доступна в проде. По первым отзывам: латенси ниже, рассуждения на уровне топовых моделей, а цена за токен заметно приятнее конкурентов. Доступна через Qwen Cloud, Alibaba Cloud Model Studio, OpenRouter и Fireworks AI. Из коробки интегрируется с OpenClaw, Kilo Code, Cline, opencode и Qoder. Для тех, кто сейчас выбирает модель под продакшен, есть смысл погонять на своих задачах. Достижения на OpenRouter звучат красиво, но синтетические бенчмарки и реальные пайплайны - вещи разные. Интересно посмотреть, как она поведет себя на длинных контекстах и сложных мультистеповых цепочках. openrouter.ai/qwen/qwen3.6-plus fireworks.ai/models/fireworks/qwen3p6-plus @ai_machinelearning_big_data #qwen

✔️ Codex пробил отметку в 3 млн. активных пользователей в неделю. Об этом сообщил Сэм Альтман в сети Х. В честь достижения эт
✔️ Codex пробил отметку в 3 млн. активных пользователей в неделю. Об этом сообщил Сэм Альтман в сети Х. В честь достижения этой отметки лимиты использования Codex будут сброшены. Так будет каждый раз при достижении очередного миллиона, вплоть до 10 миллионов. Счастливого вам вайб-кодинга и пусть удача всегда будет с вами! (с) @ai_machinelearning_big_data #news #ai #ml

🎨 FLUX.2 Small Decoder: декодер ускорили в 1.4 раза, а вы и не заметите разницы Black Forest Labs выкатили новый компактный
🎨 FLUX.2 Small Decoder: декодер ускорили в 1.4 раза, а вы и не заметите разницы Black Forest Labs выкатили новый компактный декодер для FLUX.2. Суть простая: это drop-in замена стандартного декодера, которая работает примерно в 1.4 раза быстрее и при этом потребляет заметно меньше VRAM. И никаких плясок с интеграцией. Декодер подключается к существующему пайплайну FLUX.2 из коробки. Поменял компонент, всё работает. Особенно это актуально для real-time сценариев и генерации в высоком разрешении, где каждая миллисекунда на счету. По бенчмаркам, например, декодирование ускоряется с 91.6 мс до 69.4 мс. Лицензия Apache 2.0, веса уже на HuggingFace. Для тех, кто гоняет FLUX в продакшене или строит на нём что-то интерактивное, обновление практически бесшовное и сразу дает ощутимый прирост. https://huggingface.co/black-forest-labs/FLUX.2-small-decoder @ai_machinelearning_big_data #FLUX

✔️ Anthropic расширяет партнерство с Google и Broadcom. Компания заключила крупное соглашение о поставке вычислительных мощностей нового поколения с запуском в 2027 году. Почти вся новая инфраструктура разместится в США. Масштабирование железа связано с ростом бизнеса: в 2026 году прогнозируемая годовая выручка Anthropic перешагнула $30 млрд., а число клиентов, тратящих на Claude более $1 млн в год, достигло 1000 компаний. Главным облачным провайдером остается Amazon, но Anthropic не привязывается к одному вендору: модели тренируются и запускаются на AWS Trainium, Google TPU и NVIDIA GPU. anthropic.com ✔️ ИИ-триада объединилась для защиты моделей от нелегальной дистилляции. OpenAI, Anthropic и Google начали использовать площадку Frontier Model Forum для совместного отслеживания попыток враждебной дистилляции. Эта практика нарушает условия использования и обходится лабораториям Кремниевой долины в миллиарды долларов упущенной выгоды ежегодно. Координация выстроена по аналогии с кибербезопасностью: компании делятся данными об атаках и тактиках злоумышленников, чтобы быстрее блокировать несанкционированный сбор результатов инференса. Полноценному обмену мешает американское антимонопольное законодательство. Разработчики опасаются обвинений в сговоре и ждут от правительства США правовых инструкций для легальной защиты технологий. bloomberg.com ✔️ OpenAI открыла набор на программу Safety Fellowship по безопасности ИИ. Пилотный проект ориентирован на специалистов по элайнменту. Приоритеты: оценка уязвимостей, снижение рисков, контроль над ИИ-агентами, защита приватности и предотвращение злоупотребления моделями. Программа пройдет с 14 сентября 2026 по 5 февраля 2027 года. Участники получат стипендию, менторов, вычислительные мощности и кредиты на API, но без доступа к внутренним системам OpenAI. Формат - удаленно или в центре Constellation. По итогам каждый должен представить статью, бенчмарк или датасет. OpenAI обещает, что опыт и технические навыки будут важнее дипломов. Заявки принимаются до 3 мая. openai.com ✔️ Китай развернул масштабную кампанию по краже тайваньских технологий. По данным спецслужб Тайваня, Пекин атакует ИИ-сектор и производителей чипов, чтобы преодолеть технологическую блокаду. На острове фиксируют всплеск промышленного шпионажа: китайские компании используют теневые каналы, нелегально хантят инженеров, похищают интеллектуальную собственность и закупают оборудование в обход экспортного контроля. Параллельно растет давление в киберпространстве. Только за первый квартал года ИТ-сети Тайваня зафиксировали свыше 170 млн попыток несанкционированного проникновения с целью сбора данных и слежки. reuters.com ✔️ Нейросимволический ИИ для робототехники снижает энергопотребление в 100 раз. Университет Тафтса опубликовал концепт гибридной VLA-модели для управления роботами. Метод использует архитектуру, объединяющую глубокое обучение с правилами символьной логики. Система заранее выстраивает абстрактный план, опираясь на свойства объектов, и не учится долгим путем проб и ошибок. На тестах с «Ханойской башней» модель показала радикальный прирост эффективности. Время обучения сократилось с полутора суток до 34 минут, затраты энергии на тренировку упали до 1% от стандартных VLA-систем. В инференсе потребление составило 5%. Точность выросла с 34% до 95%. В усложненной версии теста нейросимволический ИИ добился успеха в 78% случаев, а традиционные модели провалили все попытки. По мнению авторов, структурное мышление поможет решить проблему роста энергоаппетитов нейросетей. sciencedaily.com @ai_machinelearning_big_data #news #ai #ml

⚡️ Anthropic запустила проект Glasswing. Project Glasswing - инициатива по защите критической программной инфраструктуры с по
⚡️ Anthropic запустила проект Glasswing. Project Glasswing - инициатива по защите критической программной инфраструктуры с помощью ИИ. Поводом стали возможности разрабатываемой модели Claude Mythos Preview, которая, по оценке самой компании, превосходит почти всех специалистов по поиску и эксплуатации уязвимостей в коде. За несколько недель работы Mythos Preview обнаружила тысячи 0-day уязвимостей, в том числе во всех крупных операционных системах и браузерах. Среди раскрытых примеров: 🟢27-летняя ошибка в OpenBSD, позволяющая удаленно обрушить систему через одно подключение; 🟢16-летний баг в FFmpeg, который автотесты не замечали после 5 млн. прогонов; 🟢автономно собранная цепочка эксплойтов в ядре Linux, поднимающая права обычного пользователя до полного контроля над машиной.
Модель находила уязвимости и писала эксплойты без участия человека. Все упомянутые баги уже исправлены, для остальных Anthropic уже опубликовала криптографические хэши описаний и раскроет детали после выхода патчей.
🟡Mythos не выйдет в общий доступ. Партнеры Glasswing получат модель для оборонительных задач: локального поиска уязвимостей, тестирования бинарников, защиты конечных точек и пентестов. Доступ открыт более чем 40 организациям, поддерживающим критическую и open-source-инфраструктуру. К проекту присоединились AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Anthropic выделяет до $100 млн. в кредитах на использование модели и $4 млн. прямых пожертвований: $2,5 млн в Alpha-Omega и OpenSSF через Linux Foundation и $1,5 млн. для Apache Software Foundation. После этапа превью, модель будет доступна участникам Glasswing по цене $25 за миллион входных и $125 за миллион выходных токенов через Claude API, Amazon Bedrock, Vertex AI и Microsoft Foundry. Защитные механизмы для моделей такого класса Anthropic планирует обкатать на ближайшем релизе Claude Opus, который не несет сопоставимых рисков. Anthropic уже обсуждает возможности Mythos Preview (как атакующие, так и защитные) с американскими госструктурами. Подробности о возможностях модели, ее свойствах и общих характеристиках доступны в Claude Mythos Preview system card. @ai_machinelearning_big_data #news #ai #ml

⚡️ Z ai выпустила GLM-5.1. Китайская лаборатория релизнула GLM-5.1 - флагманскую MoE-модель с 754B параметров нового поколения, ориентированную на агентную инженерию. Фокус релиза - на кодинг и долгие агентные сессии. 🟡Тесты 🟢На SWE-Bench Pro модель берет 58,4, обходя Claude Opus 4.6 (57,3), GPT-5.4 (57,7) и Gemini 3.1 Pro (54,2). 🟢На Terminal-Bench 2.0 результат 63,5, а в связке с Claude Code - 66,5. 🟢В CyberGym GLM-5.1 выбивает 68,7 против 48,3 у предыдущей GLM-5 🟢В BrowseComp - 68,0 без внешнего менеджера контекста. 🟠На бенчмарках HLE, AIME 2026 и GPQA-Diamond модель держится на уровне конкурентов, но не лидирует: здесь впереди Gemini 3.1 Pro и GPT-5.4. GLM-5.1 построена так, чтобы оставаться продуктивной на длинной дистанции: декомпозировать задачу, запускать эксперименты, читать результаты, находить блокеры и пересматривать стратегию. Z ai утверждает, что модель устойчиво оптимизирует решение на протяжении сотен итераций и тысяч вызовов инструментов, то есть результат тем заметнее, чем дольше она запускают. API доступен на платформе Z ai, веб-версия на chat.z.ai обещана в ближайшие дни. Веса опубликованы на Hugging Face под лицензией MIT.
Для локального развертывания уже готовы сборки под SGLang 0.5.10+, vLLM 0.19.0+, xLLM, KTransformers и свежую ветку Transformers.
@ai_machinelearning_big_data #news #ai #ml