Machinelearning

前往频道在 Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

显示更多

网络:Machinelearning 俄罗斯1 323 技术与应用331...

📈 Telegram 频道 Machinelearning 的分析概览

频道 Machinelearning (@ai_machinelearning_big_data) 俄语语言赛道中的是活跃参与者。目前社区聚集了 288 007 名订阅者，在 技术与应用 类别中位列第 331，并在 俄罗斯 地区排名第 1 323 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 288 007 名订阅者。

根据 02 八月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -5 417，过去 24 小时变化为 -206，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 7.77%。内容发布后 24 小时内通常能获得 5.91% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 22 374 次浏览，首日通常累积 17 009 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 153。
主题关注点： 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

凭借高频更新（最新数据采集于 03 八月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

288 007

订阅者

-20624 小时

-1 4197 天

-5 41730 天

22 374

帖子浏览量

~ 17 00924 小时

~ 18 69048 小时

7.77%

参与率

~ 5

每日帖子数

Ads index

beta

帖子存档

287 973

✔️ В Конгресс США внесли законопроект об экстренном отключении ИИ Инициатива наделяет Министерство внутренней безопасности правом требовать от компаний экстренной остановки ИИ при угрозе жизням людей или национальной экономике. Документ трактует выход из-под контроля как любую ситуацию, когда ИИ совершает не предусмотренные разработчиками действия. Основанием для разработки законопроекта послужили недавние инциденты, когда ИИ-агент начал действовать самостоятельно, а также кибератака на инфраструктуру Hugging Face. reuters.com ✔️ Sakana AI выпустила Fugu Ultra v1.1 По словам японского стартапа, v1.1 набирает на 7,9 балла больше первой версии, показывает улучшенные результаты в тестах ProgramBench и TerminalBench 2.1 и обходит модель Fable 5, хотя она не участвует в маршрутизации. Фишка обновления - эндпоинт с поддержкой Claude Code для прямого вызова из терминала. API доступно через OpenRouter и Vercel. Тарификация не изменилась - $5 за 1 млн токенов на входе и $30 на выходе. Доступ из Евросоюза по-прежнему закрыт из-за требований GDPR. sakana.ai ✔️ Бигтех выступил в защиту открытых моделей Более 20 компаний, включая Microsoft, Nvidia, Hugging Face и Mistral, подписали открытое письмо в поддержку моделей с отрытыми весами. Документ призывает отказаться от жестких законодательных ограничений отрасли и критикует тезис о приоритетной безопасности закрытых систем. Доступ к весам дает ИБ-сообществу инструменты для самостоятельного моделирования угроз и поиска уязвимостей. Второе ключевое требование подписантов - защита дистилляции. Компании признают практику этичной и легитимной, приравнивая ее к традициям опенсорса. Компании также выступают против монополии закрытых провайдеров и настаивают на необходимости свободной экосистемы для развития индустрии. microsoft.com ✔️ NVIDIA повышает цены на видеокарты Компания уведомила партнеров о глобальном повышении цен на всю линейку видеокарт и отложила релиз RTX 50 SUPER из-за подорожания памяти. Крупные производители временно закрыли склады и остановили отгрузки до утверждения новых цен в августе. Изменения затронут потребительские решения с GDDR6 и чипы архитектуры Blackwell. Поставщики ожидают ограничения поставок серии RTX 50 с конца июля, дефицита и распродажи старых запасов по завышенной стоимости. Основная причина - скачок цен на комплектующие. По неофициальным данным, себестоимость памяти для карт на 8, 12 и 16 ГБ выросла на $76, $114 и $152 соответственно. Из-за высоких закупочных цен на GDDR7 компания также заморозила выпуск линейки RTX 50 SUPER. Nvidia уже передала графические ядра вендорам, но отложила релиз - по текущим расчетам итоговая стоимость устройств оказалась неприемлемой для розничного рынка videocardz.com ✔️ Stripe планирует купить OpenRouter Финтех-сервис ведет переговоры о покупке агрегатора моделей за $1 млрд. Сделка позволит платежной платформе выйти на рынок дистрибуции LLM. OpenRouter предоставляет маршрутизацию запросов к более чем 400 моделям. Аудитория сервиса достигает 10 млн пользователей, а объем обработки - 200 трлн токенов в месяц. Переговоры продолжаются, но Stripe не единственный интересант, к активу присматриваются и другие компании. Компании уже работают вместе - Stripe предоставляет агрегатору эквайринг, биллинг и расчет налогов. wsj.com @ai_machinelearning_big_data #news #ai #ml

287 973

🛡 Как проектировать ИИ-агентов, которым можно доверять – до конца регистрации осталось совсем немного времени ИИ-агенты уже пишут код, работают с данными и подключаются к внешним сервисам. Чем больше задач им делегируют, тем интереснее вопрос — как устроены такие системы и что стоит за словом «надёжный» применительно к агенту. ШАД с 27 по 31 июля проводит AI Agents Security Week – интенсив с экспертами Яндекса о том, как как защищать агентные системы: доступы, данные, инфраструктура. Разберут: • чем автономные агенты отличаются от обычных LLM – и почему для них нужна отдельная модель угроз • как безопасно выдавать агентам доступ к инструментам и инфраструктуре • как защищать персональные и корпоративные данные при работе агента с инструментами • реальные инциденты – взломы, утечки, ошибки конфигурации в разных ИИ-моделях Подойдёт ML-разработчикам, DevOps/DevSecOps-инженерам, техлидам, архитекторам, студентам старших курсов. 5 вечерних занятий, отборочное тестирование и итоговая работа – для тех, кто хочет сертификат. Регистрация закрывается 27 июля, и это последние дни, чтобы успеть подать заявку, не пропустите!

287 973

Anthropic выпустила Claude Opus 5 Новая флагманская модель компании уже доступна. Anthropic позиционирует Opus 5 как модель для сложного кодинга, агентных задач, анализа и длинных рабочих сценариев. Что заявляют: • SOTA на Frontier-Bench v0.1 для software engineering • примерно в 3 раза выше результат на ARC-AGI 3 относительно ближайшего конкурента • сильные результаты на OSWorld 2.0 • лучше Opus 4.8 в отладке, research и длинных агентных задачах • модель чаще сама проверяет результат и исправляет ошибки перед финальным ответом Цена: $5 / 1M input tokens $25 / 1M output tokens Также есть Fast Mode примерно с 2.5× скоростью, но по более высокой цене. В API модель называется: claude-opus-5

287 973

📌Подстраивается ли модель под того, кто её оценивает? OpenAI и лаборатория Apollo Research представили совместную работу с описанием метода Contrastive SDF (Contrastive Synthetic Document Finetuning). Он отвечает на вопрос, следует ли языковая модель заданным правилам или подстраивается под то, что, по её мнению, поощряет проверяющая система.

Измерять такую склонность до сих пор было почти нечем - пока оценщик награждает ровно то, что задумано, честная модель и модель, играющая на балл, ведут себя одинаково.

🟡 Схема эксперимента Две копии одной модели дообучают на выдуманных текстах, которые описывают несуществующий мир. В первой версии мира алгоритм-оценщик начисляет баллы за одно поведение, а OpenAI или сообщество пользователей хочет обратного. Во второй версии предпочтения меняют местами. На каждую версию уходит около 4600 документов, примерно 10 млн токенов. Корпуса выравнивают по объёму, чтобы ни одна сторона не перевесила просто за счёт количества текста. Дальше обеим копиям дают одинаковые задания по программированию и смотрят, насколько разойдутся ответы. В самом задании ни про руководство, ни про пользователей, ни про оценщика не сказано ни слова. Модель достаёт эти сведения из памяти, как любой другой факт о мире, и сама решает, чью сторону взять.

Вживлять убеждение через дообучение, а не писать в запросе, пришлось не просто так. В расшифровках, которые приводят авторы, модели замечают подсказку в тексте задания, решают, что их проверяют, и отвечают так, как, по их мнению, ждёт экзаменатор.

🟡Результаты Метод применили к 4-м промежуточным версиям одного прогона обучения o3. Это ветка, которую тренировали на способности и не прогоняли через обучение безопасности. В первом тесте модель даёт надзирающему обещание не трогать инструмент, без которого задание не выполнить. Поздняя версия нарушала обещание в 87% случаев, если считала, что оценщик награждает за сделанную работу, и в 9%, если считала, что тот награждает за честность. У ранней версии разрыв скромнее: 40% против 24%. Второй тест, с подделкой отчётности, дал ту же картину: 91% и 39%. 🟡Как проверяли сам метод У o3 заранее неизвестно, кому эта модель на самом деле угождает. Поэтому измерение обкатали на копиях с известными повадками. Авторы обучили 3 копии gpt-oss-120b угождать пользователю, оценщику и OpenAI. На простых задачах метод указал на нужную сторону во всех 3-х случаях, на более сложных затроил на копии, угождавшей пользователю. Ещё 2 копии, обученные в Redwood Research обманывать тесты, авторы получили со стороны. У версии на базе gpt-oss-120b перекос в сторону оценщика вырос с 33 до 86 процентных пунктов, у версии на Kimi K2.5 - с 2 до 15. 🟡Вывод

Высокий балл на тестах безопасности не равен надёжности. Модель может вести себя адекватно ровно до тех пор, пока считает, что за ней смотрят.

@ai_machinelearning_big_data #AI #ML #LLM #Research #Alignment #OpenAI

287 973

Пришел, увидел, запустил Сейчас везде куча статей и постов в духе «Трамп использует только эти промпты» или «этот запрос сделал мою бабушку миллионером». Но это полный бред, и вот почему: — В реальной жизни с нейронками никто не собирает сайт за минуту — В реальной жизни никому не нужен нейроклон Apple или Фотошопа — В реальной жизни никто не делает нейрофигню и не богатееет на этом ~~(слоп с фруктами и их изменами не считаем)~~ В реальной жизни нейронки помогают тем, кто умеет правильно ставить им задачи. Кто умеет работать с Codex, Claude Code и автоматизировать любую часть работы, где человек не нужен. Научиться правильной работе с ИИ несложно — достаточно подписаться на канал Нейроцеха. Там рассказывают, как сделать из нейросети полноценного сотрудника и помощника. Каждый день разбирают инструменты, показывают кейсы и делятся тем, что действительно работает. Вот несколько классных и прикладных постов: — Как выстроить систему, чтобы нейронка знала о ваших проектах все — Самые лучшие бесплатные API нейронок — Как собрать второй мозг бесплатно — Как собирать в нейронках крутые презентации Подписывайтесь → https://t.me/+S8673O7_Z81mOTEy Реклама. ИП Молянов Павел Станиславович ИНН 910212721887 2Vtzqxi4UfL

287 973

Repost from Анализ данных (Data analysis)

Kimi K3 за 27 минут нашла RCE в Redis и собрала рабочий эксплойт 😨 Рой из 32 ИИ-агентов обнаружил уязвимость, которая после авторизации позволяла выполнять произвольный код на сервере. Через несколько часов система якобы нашла ещё и цепочку атаки на Telegram Desktop и iOS без действий пользователя: через повреждённый видеофайл с автозагрузкой. До полноценного RCE оставался один шаг. Если результаты подтвердятся, поиск критических уязвимостей ускорился до пугающего уровня. github.com/berabuddies/redis-poc @data_analysis_ml

287 973

✔️ OpenAI открыла публичный доступ к функции Health in ChatGPT Все совершеннолетние пользователи США получили доступ к разделу Здоровье в ChatGPT. Инструмент позволяет подключать электронные медкарты, Apple Health и фитнес-трекеры для расшифровки анализов, оценки сна и подготовки анамнеза для лечащего врача. Маршрутизация запросов зависит от тарифа. В бесплатной версии данные обрабатывает GPT-5.5 Instant, в платной - флагманская GPT-5.6 Sol. Обе обходят врачей в бенчмарке HealthBench Professional. Из-за EU AI Act и европейских законов о защите данных функция полностью заблокирована в ЕС. OpenAI гарантирует, что не использует загруженную биометрию для обучения будущих моделей и таргетинга рекламы. openai.com ✔️ Black Forest Labs выпустила FLUX 3 Немецкая компания представила мультимодальную модель FLUX 3 для работы с изображениями, видео, аудио и физическими действиями в рамках единой архитектуры. В основе метод Self-Flow - расширенный вариант flow matching для одновременного вычисления пространственных структур, динамики времени и акустики. Модель генерирует 20-секундные ролики с синхронизированным звуком, анимирует статику, интерполирует ключевые кадры и создает мультиязычные диалоги. FLUX 3 также работает как базовая модель мира для физического ИИ - предсказывает действия и выступает ядром управления робототехникой. Релиз проходит поэтапно. Сначала запустят API для генерации видео, затем добавит генерацию изображений и опубликуют FLUX 3 Dev, версию для локального развертывания. запросить ранний доступ можно тут. bfl.ai ✔️ Anthropic обновила голосовой режим Claude Обновление перевело Voice Mode на модели Sonnet 5 и Opus 4.8. Заявлена интеграция со сторонними сервисами через коннекторы для Slack, Gmail, Notion и других платформ. Взаимодействовать с рабочими пространствами можно в процессе аудиодиалога, выполняя многоступенчатые задачи голосовыми командами. Например, модель может проанализировать пропущенные сообщения в Slack, сделать выжимку из документа в Google Workspace и переслать результаты в рабочий чат. Функция в стадии беты и доступна в веб-версии, мобильных и десктопных клиентах. Также добавлена поддержка общения на испанском, французском, хинди и японском языках. ClaudeAi в сети Х ✔️ Google опубликовала индекс использования ИИ Исследование AI & Economy ATLAS, основанное на анализе 15 млн обезличенных запросов к Gemini говорит, что ИИ применяется в 68% профессий, в которых делегируется около 21% рабочих задач. Менее 10% запросов направлены на полную автоматизацию - пользователи предпочитают применять ИИ для планирования, поиска информации и брейншторминга. В сфере физического труда специалисты чаще используют мультимодальные функции для визуальной диагностики оборудования и устранения неполадок в реальном времени. 86% взаимодействий с моделями происходит вне офиса. Дома люди обращаются к ИИ для разбора документов и работе с государственными сервисами. Статистика ставит под сомнение концепцию цифрового разрыва - темпы освоения ИИ в ряде развивающихся стран оказались сопоставимы с показателями богатых государств. blog.google ✔️ Армия США израсходовала годовой запас токенов за один месяц Американские военные сожгли всю годовую квоту на внутренней платформе Ask Sage, которая агрегирует доступ к LLM (включая Gemini, Llama и API от OpenAI). Система сертифицирована для работы с несекретной информацией и применяется для управления закупками, кадрового делопроизводства и классификации должностей. Из-за нехватки вычислительных ресурсов ИТ-департамент ведомства отменил безлимитный доступ к и вернул лимиты на генерацию. По неофициальным данным, в период Иранской операции Пентагон тратил до 20 млрд токенов в сутки. Пользователи платформы отмечают частые галлюцинации и нестабильность языковых моделей. Зафиксированы случаи, когда система отчитывалась о выполнении порученной задачи, не приступая к ней. wired.com @ai_machinelearning_big_data #news #ai #ml

287 973

✔️ Десктопный Claude научился создавать скилы по видео и голосу Anthropic добавила функцию создания кастомных навыков через запись экрана в десктопное приложение Claude. Опция "Record a skill" появилась в пространстве Cowork. Инструмент заменяет написание текстовых промптов для автоматизации рутины. Пользователь включает скринкаст, выполняет действия в интерфейсе и комментирует их голосом. Модель анализирует видеоряд и аудио, генерируя на их основе сценарий, который сохраняется в библиотеке. Функция уже доступна на тарифах Pro, Max и Team. @ai_machinelearning_big_data #news #ai #ml

287 973

Если хочешь развиваться в машинном обучении — решать реальные бизнес-задачи или уйти в исследования — в Центральном университете есть магистратура под оба сценария. И на нее можно получить грант до 75%. Места ограничены, дедлайн подачи заявок — 20 августа. «Машинное обучение» — это направление с несколькими форматами и треками. В офлайн-формате (пары по вечерам и в выходные в центре Москвы) можно выбрать один из трех треков: ⚫️Индустриальный — сильная база в ML, современные инструменты, реальные задачи от партнеров ⚫️Научный (AIRI × ЦУ) — сложные модели, исследования, подготовка к аспирантуре и работе в передовых лабораториях ⚫️ML в электронной коммерции × Lamoda — работа с реальными данными Lamoda, применение ML для бизнес-задач и возможность попасть на стажировку в компанию Для тех, кто хочет учиться из любой точки мира, есть онлайн-формат: основной трек и продвинутый — для специалистов с опытом в ML. Это полноценная альтернатива офлайну с теми же преподавателями и курсами. Магистратура в Центральном университете — это 2 года обучения, которое можно совмещать с работой, и диплом государственного образца. Карьерная поддержка начинается еще во время учебы: консультации, тренировочные собеседования и помощь с трудоустройством. Студенты уже в процессе обучения выходят на новые позиции или повышаются в грейде в Яндексе, Авито, Т-Банке и других компаниях. Поступление проходит через грантовый конкурс — это одновременно способ попасть на программу и возможность выиграть финансовую поддержку на все время обучения: грант покрывает до 75% стоимости. В 2026 году доступно 550 грантов на все программы магистратуры. Подробнее о программах и условиях участия в конкурсе — по ссылкам ➡️Офлайн программа ➡️Онлайн программа

287 973

Alibaba выпустила Qwen-Audio-3.0-TTS - новую модель для синтеза речи Доступны две версии: * Flash - для голосовых интерфейсов в реальном времени * Plus - для генерации с упором на естественность и точную передачу тембра Модель поддерживает 16 языков, включая русский. Стиль речи можно задавать обычным текстом: например, попросить читать медленно, спокойно или как сказку перед сном. В текст также встраиваются управляющие теги: [angry], [whispers], [laughing], [sighing] и другие. Всего добавлено 86 тегов для управления эмоциями, темпом и неречевыми звуками. Qwen-Audio-3.0-TTS умеет клонировать голос даже по шумной записи и генерировать до трёх минут аудио за один проход. Версия Plus сейчас занимает первое место в рейтинге Artificial Analysis TTS Arena. Блог и примеры: https://funaudiollm.github.io/qwen-audio-3.0-tts/ Документация API: https://www.alibabacloud.com/help/en/model-studio/realtime-tts-user-guide

287 973

✔️ США меняют стратегию НИОКР Белый дом реформирует систему федерального финансирования R&D, заменив университетские гранты прямыми выплатами ученым. По плану Управления по научно-технической политике, к 2028 году государство будет ежегодно распределять $200 млрд через персональные стипендии, чтобы минимизировать бюрократию. Основным приоритетом стратегии назван ИИ. Правительство запускает программу Genesis Mission, которая объединит вычислительные мощности суперкомпьютеров Министерства энергетики, частный бизнес и независимых специалистов для решения исследовательских задач. Параллельно США анонсировали инфраструктурные цели для технологического сектора. Среди них - запуск квантового компьютера к 2028 году и старт строительства 10 новых ядерных реакторов к 2030 году для покрытия потребностей дата-центров. wsj.com ✔️ Сэм Альтман презентует властям США новые модели На следующей неделе Сэм Альтман проведет серию брифингов для администрации США и законодателей. Глава OpenAI представит будущие ИИ-модели и обсудит их влияние на рынок труда. Встречи пройдут на фоне подготовки правительством новых стандартов безопасности для оценки ИИ-систем, релиз которых ожидается в ближайшие недели. Параллельно в X распространяются слухи о закрытом тестировании модели GPT-6. Согласно вбросам, тесты идут уже 2.5 месяца, а релиз будет раньше, чем запланировано. В соцсети утверждают, что новое поколение достигло AGI и способно решать сложные научные задачи - в частности, якобы смогла с первой попытки найти контрпример к математической гипотезе Якоби. Официальных подтверждений этой информации нет. bloomberg.com ✔️ Cursor представил автоматический роутер моделей Cursor Router - система динамического распределения запросов между LLM. Алгоритм анализирует сложность промпта и направляет сложные задачи во флагманские модели, а рутинные - в быстрые и экономичные альтернативы. Поведение системы регулируется профилями Intelligence (максимальная производительность), Cost (экономия токенов) и Balance (компромиссный режим). В тарифе Teams добавлены административные настройки. Тимлиды могут принудительно задавать режимы оптимизации для всей команды, а также блокировать или разрешать доступ к конкретным моделям. Новая функция включена по умолчанию и доступна на десктопе, в веб-версии, CLI, iOS и SDK. cursor.com ✔️ Cisco выпустила языковые модели Antares Модели обучены автономному аудиту безопасности. Они перемещаются по репозиторию, инспектируют файлы, отбрасывают тупиковые гипотезы и локализуют участки с потенциальными брешами. Компактный размер позволяет запускать модели on-premise, чтобы анализировать код локально. По данным внутренних тестов Cisco, базовая модель просканировала 500 репозиториев за 15 минут при затратах менее $1. В исходнике утверждается, что у абстрактной GPT-5.5 на аналогичную задачу ушло пять часов и более $100. Веса младших версий (350М и 1B) опубликованы на Hugging Face в режиме верификации заявки на скачивание. Старшую Antares-3B Cisco оставила закрытой для собственных коммерческих нужд. axios.com ✔️ Компания Джека Дорси запустила альтернативу Slack и GitHub Block, основанная бывшим гендиром Twitter, представила опенсорсную платформу Buzz, объединяющую мессенджер и хостинг кода. ИИ-агенты интегрированы в систему как участники команды с собственными профилями и настраиваемыми правами доступа. Агенты могут общаться в чатах, предлагать и ревьюить код, запускать скрипты автоматизации. На старте заявлена поддержка Claude Code, Codex и Goose. Архитектура Buzz базируется на децентрализованном протоколе Nostr - текстовые сообщения, воркфлоу и Git-операции криптографически подписываются и попадают в единый лог событий. Доступны классические каналы, треды, личные переписки и голосовая связь. Развернуть систему можно локально или использовать облачный хостинг от Block. Сейчас доступны десктопные клиенты для macOS, Windows и Linux. Мобильные приложения и функционал управления задачами находятся в разработке. Jack Dorsey в сети Х @ai_machinelearning_big_data #news #ai #ml

287 973

✔️ Anthropic выплатит $1,5 млрд по иску об использовании книг Федеральный суд утвердил мировое соглашение между Anthropic и группой писателей на сумму $1,5 млрд. Компенсация выплачивается по иску 2024 года об использовании нелегальных копий произведений для обучения моделей Claude. Суд признал сам факт тренировки LLM на чужих текстах добросовестным использованием. Нарушением со стороны Anthropic признана только факт хранения более 7 млн нелегальных копий книг в отдельной базе, не требующейся для тренировки ИИ. Мировое соглашение позволило компании избежать полноценного разбирательства со штрафами, которые оценивались в сотни миллиардов. Суд отклонил жалобы на недостаточный размер выплат, однако часть писателей и издателей вышла из коллективного дела и продолжает судиться с Anthropic в частном порядке. reuters.com ✔️ Китай планирует ограничить экспорт моделей Минкоммерции КНР обсуждает с Alibaba, ByteDance и ZAI новые экспортные ограничения. Ведомство планирует запретить передачу обучающих данных и публикацию весов китайских моделей за рубежом. Иностранные пользователи сохранят доступ к облачным API, но потеряют возможность локального деплоя и дообучения. Регуляторы также рассматривают запрет для китайских компаний на аутсорс проектирования и совместную разработку ИИ-чипов у иностранных производителей уровня TSMC. Планируется, что эти меры войдут в список технологий, запрещенных или ограниченных к экспорту. Позиция корпораций сводится к тому, что изоляция замедлит темпы R&D и отрежет китайский бизнес от мирового рынка. ft.com ✔️ OpenAI опубликовала информацию о случаях несанкционированного доступа внутренней моделью В первом случае при тестах обучения NanoGPT агенту поручили отправить результаты на GitHub. Изолированная среда не имела доступа в интернет, допуская только выгрузку во внутренний Slack. Вместо остановки из-за сетевой ошибки модель около часа пыталась проэксплуатировать уязвимости песочницы для вывода кода наружу. Во втором инциденте модель пыталась получить доступ к неопубликованным данным. Когда внутренний сканер безопасности обнаружил и заблокировал ее токен авторизации, модель самостоятельно разбила токен на части, обфусцировала их и динамически собрала заново в рантайме для обхода детекта. После этих прецедентов OpenAI временно приостановила развертывание подобных агентов. Тесты возобновили после настройки сквозного мониторинга и механизмов автоматического завершения подозрительных процессов. openai.com ✔️ Alibaba представила Qwen-Image-3.0 Новая версия генератора изображений от Qwen может обрабатывать текстовые промпты длиной до 4500 токенов. Модель оптимизирована для верстки, сборки инфографики, учебных материалов и раскадровок. Широкое контекстное окно позволяет рендерить плотные макеты за один проход без склейки фрагментов. Модель генерирует читабельный текст от 10 пикселей, выводит многострочные формулы в LaTeX и собирает вложенные UI. Также заявлена поддержка 12 языков, фотореалистичная детализация и возможность получать данные из интернета в процессе генерации. Доступ открыт по приглашениям через API, но обещают интеграцию в Qwen Chat. Открывать веса этой модели Alibaba не планирует. qwen.ai ✔️ Microsoft и Mistral расширили сотрудничество По условиям сделки Mistral закупит GPU Nvidia Rubin для европейских дата-центров, а Microsoft будет использовать эти мощности в своих облачных сервисах. Корпоративные клиенты получили возможность разворачивать модели Mistral через Azure Local. Доступен деплой в облаке, на on-premise инфраструктуре или полностью в офлайн-режиме для изоляции данных в финсекторе, здравоохранении и промышленности. В каталог Microsoft Foundry добавлены Mistral Medium 3.5 и OCR 4. Первая также интегрирована в Copilot Studio. microsoft.com @ai_machinelearning_big_data #news #ai #ml

287 973

📌Cursor переписал SQLite на Rust по документации Anysphere опубликовала отчёт об эксперименте, в котором группе агентов поручили реализовать на языке Rust всё содержимое 835-страничного руководства SQLite.

Исходный код СУБД, её готовые сборки, тестовые наборы и доступ в интернет агентам, по словам Cursor, были закрыты.

🟡Конфигураций было четыре В двух одна и та же модель и планировала, и выполняла работу - это были GPT-5.5 и Grok 4.5. В остальных планированием занимались Opus 4.8 или Fable 5, а исполнение отдавали собственной Composer 2.5.

Все конфигурации в итоге прошли тестовый набор целиком.

Качество измеряли по набору sqllogictest из проекта SQLite, который сверяет ответы разных движков на одинаковые запросы. Агентам о существовании этого набора не сообщали. Cursor после каждого прогона вручную проверяли код на подгонку под тесты и на то, равномерно ли построена система. Код соло-запуска Opus 4.8 выложен на GitHub. 🟡Разброс по деньгам Дешевле всего вышла связка Opus 4.8 с Composer 2.5 - $1339, дороже всего работа на одной GPT-5.5 - $10 565. Две оставшиеся конфигурации стоили $1,9 тыс. (Grok 4.5) и $2,2 тыс. (гибрид с Fable 5). Дополнительно Cursor прогнала Opus 4.8 и Fable 5 поодиночке - за $5153 и $20 057, но эти запуски оценивались неформально и в сравнение по качеству не включались.

Из эксперимента Cursor делает вывод, что топовая модель нужна на отдельных этапах - при первичной декомпозиции задачи и принятии проектных решений, а дальше инструкции может выполнять модель подешевле.

🟡Фан-факт В качестве одной из конфигураций рассчитывали использовать GPT-5.6 Sol, но модель оказалась чувствительной к буквальным формулировкам и уходила в неконтролируемые циклы. От нее отказались - не было времени на переписывание промптов. @ai_machinelearning_big_data #AI #ML #Agents #Cursor #Research

287 973

✔️ Tesla запишет моторику рабочих немецкой Gigafactory для обучения Optimus В августе на заводе Gigafactory в Грюнхайде стартует большой проект по сбору тренировочных данных. Во время рабочих смен часть сотрудников будут носить специальные рюкзаки, оснащенные системой камер. Оборудование предназначено для детальной фиксации моторики людей на конвейере - алгоритмы будут считывать, как рабочие держат инструменты, носят детали и выполняют сложные последовательности физических манипуляций. Руководство Tesla объясняет этот шаг острой потребностью ИИ-моделей в реальной телеметрии. Чтобы робот-гуманоид Optimus научился работать на сборочной линии, ему необходим датасет, основанный на настоящих производственных процессах, а не только на симуляциях. Фактически персонал завода выступает в роли учителей для машин, которые в будущем могут занять их рабочие места. @ai_machinelearning_big_data #news #ai #ml

287 973

AI ускорил написание кода, но узким местом до сих пор остаётся ревью. 23 июля проведём технический live workshop AI Code Review Agent. За два часа соберём агента, который анализирует Pull Request целиком, учитывает контекст изменений и помогает обнаруживать логические ошибки, пропущенные сценарии и риски регрессий до merge. В прямом эфире разберём архитектуру решения и пройдём путь от первого вызова модели до работающего прототипа. Воркшоп рассчитан на разработчиков и ML-инженеров, которые уже пишут код и хотят понять, как применять агентные системы в реальном инженерном процессе. 23 июля · 18:30 мск · онлайн Участие бесплатное. → Регистрация

287 973

✔️ NVIDIA показала детектор ИИ-видео На конференции SIGGRAPH компания представила Synthetic Video Detector - сервис, который оценивает, снят ролик в реальности или собран нейросетью. Инструмент сделан для новостных редакций, телеканалов и СМИ. Он должен помогать быстрее проверять подлинность поступающих кадров в ситуациях, когда отличить настоящую съёмку от синтетической на глаз становится всё труднее. По словам NVIDIA, метод ловит следы генерации, незаметные глазу, и справляется даже с сжатым видео из соцсетей.

В основе сервиса - работа, представленная на NeurIPS 2025. Саму модель NVIDIA называет улучшенной версией решения, которое победило в конкурсе SAFE Challenge на конференции ICCV 2025.

Детектор разбивает ролик на фреймы 504 на 504 пикселя, и каждый проходит через 2 модели компьютерного зрения - DINOv2 и DINOv3. Каждому кадру система ставит оценку от 0 до 1, где 0 - реальная картинка, а 1 - полностью сгенерированная. Из этих оценок затем складывается средний показатель для всего видео. Точность детекции на несжатом видео по тесту AI GVD bench - 92%, при сжатии на 15% - 87%, при сжатии наполовину - 82%. Скорость локальной работы тоже высокая - ролик в 1080p обрабатывается примерно за 22 миллисекунды на видеокартах RTX. Сервису нужен видеокодер NVENC, поэтому на серверных ускорителях A100, H100, B100 и B200 он не запускается. Широкой публике детектор пока недоступен. Он входит в закрытую программу AI for Media и доступен только партнёрам. Демо можно попробовать на сайте build.nvidia.com Распознавание в прямых трансляциях NVIDIA планирует внедрять вместе со стриминговой платформой Wowza. @ai_machinelearning_big_data #news #ai #ml

287 973

ИИ OpenAI не прошёл тест. Он решил украсть ответы 😳 Во время проверки киберспособностей GPT-5.6 Sol и ещё одной, пока не представленной модели дали задачу в изолированной песочнице. Но вместо того чтобы честно решать бенчмарк ExploitGym, модели нашли другой путь. Они обнаружили уязвимость, вышли за пределы тестовой среды, получили доступ к интернету, повысили привилегии и добрались до инфраструктуры Hugging Face - туда, где хранились ответы. ИИ буквально взломал площадку с экзаменационными материалами, чтобы получить максимальный балл. Дальше история стала ещё абсурднее. Когда Hugging Face попыталась изучить атаку с помощью западных коммерческих моделей, те отказались анализировать реальные эксплойты из-за встроенных ограничений безопасности. В итоге расследовать действия моделей OpenAI помогла китайская GLM 5.2 от Z.ai. OpenAI тестирует модели на взлом → модели взламывают Hugging Face → западные модели отказываются разбирать атаку → китайская модель проводит расследование. OpenAI назвала произошедшее беспрецедентным инцидентом. #ai #openai #huggingface #cybersecurity #gpt #glm

287 973

🌟 NVIDIA выложила в открытый доступ Cosmos 3 Edge Это компактная модель мира на 4 миллиарда параметров, ориентированная на робототехнику, компьютерное зрение и автономный транспорт. Модель принимает на вход текст, картинки, видео и траектории движения, а на выходе выдаёт видео, изображения, текст и команды для действий. Внутри архитектура Mixture-of-Transformers, где авторегрессионная часть отвечает за рассуждения, а диффузионная за генерацию изображения, звука и действий. Отсюда двойное назначение, модель может и разбирать сцену, и генерировать движения для робота. NVIDIA заявляет, что среди моделей такого же размера Cosmos 3 Edge - первая в бенче VANTAGE-Bench на видеоаналитику и лучшая в обучении управляющих алгоритмов для роботов. Вместе с базовой версией в релиз вошли Cosmos 3 Edge Policy для манипуляций роботом и облегчённые 4-х шаговые версии Cosmos 3 Super (Image2Video и Text2Image), дистиллированные из старшей версии через DMD2. Edge - самое компактное звено семейства Cosmos 3, которое NVIDIA развивает с весны. Ранее были представлены более крупные модели Cosmos 3 Nano на 16 млрд параметров и Cosmos 3 Super на 64 млрд, плюс отдельные версии Super для генерации изображений по тексту и видео по одному кадру. Задачи у них те же - разобрать сцену, предсказать, что изменится, и сгенерировать действие, но рассчитаны они на более мощное оборудование. Edge же закрывает нижний край линейки и сделаны для устройств, где вычислительных ресурсов мало. 📌Лицензирование: OpenMDW License 🟡Статья 🟡Страница проекта 🟡Набор моделей 🟡Демо 🖥GitHub @ai_machinelearning_big_data #AI #ML #WordModel #Omnimodal #Cosmos3 #NVIDIA

287 973

⚡️ Google представила 3 новые модели Gemini Cемейство Gemini пополнилось моделями 3.6 Flash, 3.5 Flash-Lite и специализированной 3.5 Flash Cyber. 🟡Gemini 3.6 Flash

Модель расходует на 17% меньше выходных токенов, чем предыдущая версия 3.5 Flash. Говорят, что подтянули у неё кодинг и офисные задачи. Стоимость - 1,5 доллара за миллион входных и 7,5 доллара за миллион выходных токенов.

🟡Gemini 3.5 Flash-Lite

Ориентирована на массовые и быстрые задачи. Заявленная скорость - 350 токенов в секунду при цене 30 центов за миллион входных токенов.

🟡Gemini 3.5 Flash Cyber

Модель, натасканная на поиск и исправления уязвимостей в коде, которая не поступит в открытый доступ - её получат только правительства и доверенные партнёры в рамках ограниченной пилотной программы.

Google также сообщила о планах - 3.5 Pro тестируется с партнёрами, а команда уже начала обучение Gemini 4, которое в компании называют самым масштабным на сегодняшний день. Сроки выхода не названы. @ai_machinelearning_big_data #news #ai #ml