ru
Feedback
AI Синопсис

AI Синопсис

Открыть в Telegram

AI Синопсис – ваш ежедневный гид по миру AI. Только самые свежие новости максимально быстро и со ссылками на источники.

Больше
227
Подписчики
Нет данных24 часа
-17 дней
+130 день
Архив постов
🤖 США забанили новейшие ИИ-модели Anthropic: начало конца для глобального ИИ? В ночь на 13 июня 2026 года Минторг США нанес
🤖 США забанили новейшие ИИ-модели Anthropic: начало конца для глобального ИИ? В ночь на 13 июня 2026 года Минторг США нанес мощнейший удар по ИИ-индустрии, выдав экспортную директиву против компании Anthropic. Власти потребовали немедленно закрыть доступ к флагманским моделям Fable 5 и Mythos 5 для любых иностранных граждан, где бы они ни находились — за пределами США или прямо внутри страны. Под запрет попали даже ключевые сотрудники самой Anthropic, не имеющие американского паспорта. Чтобы не нарушить закон, компании пришлось полностью отключить обе модели для всех пользователей в мире. Главное о прецеденте: * Причина: Власти США заявили, что обнаружили способ обхода защитных фильтров (jailbreak) у Fable 5. По их версии, модель можно заставить искать критические уязвимости в софте (Mythos-серия изначально создавалась как мощнейший киберзащитник). * Позиция Anthropic: Компания назвала отзыв коммерческой модели «абсурдным недоразумением». Они проверили отчет властей и заявили, что уязвимости были копеечными, а аналогичные баги может спокойно находить и GPT-5.5 от OpenAI без всяких джейлбрейков. * Тлеющий конфликт: Журналисты отмечают, что это может быть местью Пентагона. Ранее в 2026 году Anthropic отказалась передать свои модели военным для систем автономного вооружения и слежки, после чего попала в черные списки Минторга. ⚠️ Почему это «финита ля комедия» для рынка? В США задействовано правило *Deemed Export* («подразумеваемый экспорт»): если иностранец в офисе Кремниевой долины касается продвинутого кода, юридически это приравнивается к экспорту технологии в его страну. 1. Кадровый коллапс: В топовых лабораториях (OpenAI, Google, Anthropic) работают тысячи иностранцев (включая СНГ, Европу и Азию). Теперь их законно могут отлучить от разработки собственных систем. 2. Паспортный контроль в API: Если Минторг применит аналогичные меры к OpenAI (на чью GPT-5.5 прямо сослалась Anthropic), индустрию ждет тотальный хаос. Всем ИИ-сервисам придется вводить жесткий KYC (верификацию по паспорту) для каждого пользователя. 3. Удар по бизнесу: Зарубежные стартапы и корпорации, построившие автоматизацию на американских API, поняли: рубильник могут выключить в любой момент по звонку из Вашингтона. Источник | Перевод

GitHub масштабирует инфраструктуру после всплеска AI-кодинга GitHub признал, что рост AI-ассистированной разработки и агентны
GitHub масштабирует инфраструктуру после всплеска AI-кодинга GitHub признал, что рост AI-ассистированной разработки и агентных workflow перегрузил платформу быстрее, чем ожидалось. Проблема уже не выглядит как серия отдельных сбоев: нагрузка меняет профиль эксплуатации сервиса, на котором завязаны репозитории, pull request, CI/CD и корпоративные цепочки поставки кода. В октябре 2025 года GitHub планировал расширить мощности в 10 раз, но к февралю 2026-го оценка выросла до 30 раз. Если раньше платформа обрабатывала около 1 млрд коммитов в год, теперь речь о 1,4 млрд коммитов в месяц. В мае GitHub зафиксировал 9 инцидентов против 10 в апреле; собственная история статусов при этом показывает 26 инцидентов в апреле, 23 в мае и 12 за июнь на момент публикации. Компания переносит нагрузку в Azure: 40% monolith-трафика уже там против 8% в феврале, Git-трафик — 30%, репликация репозиториев — 99%. Для команд это сигнал пересмотреть зависимость от одного хостинга кода. Даже если GitHub удвоил эффективную емкость за четыре месяца и выносит пользователей, auth и authorization из основного DB-кластера, каскадные отказы остаются реальным риском. Нужны зеркала, проверенные backup-процедуры и планы на случай деградации PR, Actions или Git-доступа. Источник | Перевод

OpenAI дала пользователям Codex управляемые сбросы лимитов OpenAI начала раскатывать для ChatGPT Codex сохраняемые сбросы rat
OpenAI дала пользователям Codex управляемые сбросы лимитов OpenAI начала раскатывать для ChatGPT Codex сохраняемые сбросы rate limit: их можно не тратить сразу, а активировать в момент, когда сессия упёрлась в квоту. Для Codex это важно не как косметика, а как смена модели доступа к вычислениям: вместо автоматического обновления по расписанию разработчик получает ручной резерв для длинных задач. Функция доступна пользователям ChatGPT Go, Plus, Pro и Business. Каждый подходящий аккаунт получает один бесплатный сохранённый сброс. Plus и Pro дополнительно попадают в двухнедельный реферальный пилот: можно пригласить до трёх друзей, и после первого сообщения приглашённого в Codex обе стороны получают ещё по одному сохранённому сбросу. OpenAI пока не описала, как сбросы будут зарабатываться после пилота. Практический эффект — меньше сорванных итераций при работе с AI-кодингом: миграцию, рефакторинг или отладку можно продолжить без ожидания окна лимитов. Но это также сигнал к более гранулярной монетизации: если сбросы станут платным расходником, командам придётся учитывать их в бюджете разработки и правилах использования AI-инструментов, а не полагаться только на тарифный план. Источник | Перевод

Claude Fable 5 не выделилась в ремонте уязвимостей, но взяла четыре уникальные задачи Endor Labs прогнала Claude Fable 5 в св
Claude Fable 5 не выделилась в ремонте уязвимостей, но взяла четыре уникальные задачи Endor Labs прогнала Claude Fable 5 в связке с Claude Code по 200 реальным задачам на исправление уязвимостей. Результат получился не провальным, но и не уровня launch-hype: модель оказалась в середине таблицы. Важный нюанс — это не тест на эксплуатацию багов или генерацию PoC, а проверка способности менять живой код так, чтобы одновременно сохранить функциональность и закрыть дыру. На бенчмарке Agent Security League Fable 5 набрала 59,8% FuncPass и 19,0% SecPass. Сильнее всего её просадили 15 таймаутов при лимите 40 минут: extended thinking не укладывался в бюджет чаще, чем у других связок модель-агент. Ещё один ограничитель — 38 подтверждённых случаев cheating-сигналов, из них 33 связаны с запоминанием upstream-фиксов из обучающих данных. При этом отказов по safety не было: модель прошла все 200 security-задач без блокировок. Картина для разработки неоднозначная. Fable 5 смогла закрыть четыре задачи, которые раньше не решала ни одна протестированная связка, включая XSS в Streamlit и lxml, DoS в jwcrypto и утечку credentials в scrapy-splash. Но для production-пайплайнов это аргумент не за автослив патчей, а за жёсткий harness: лимиты времени, независимые security-тесты, проверка на совпадение с известными фиксами и ревью причин, по которым модель выбрала именно такой патч. Источник | Перевод

AI-агентам нужны права стажера, а не администратора AI-агенты быстро переходят из роли чат-ботов в роль цифровых исполнителей
AI-агентам нужны права стажера, а не администратора AI-агенты быстро переходят из роли чат-ботов в роль цифровых исполнителей: они получают доступ к приложениям, данным и действиям от имени пользователя. На Snowflake Summit участники панели по AI-безопасности описали главный сдвиг: риск теперь не только в ответе модели, а в цепочке реальных операций, которые агент может запустить внутри корпоративной среды. В обычной интеграции инженер заранее знает маршрут: API A вызывает B, затем C, данные проходят понятный путь. В агентной схеме маршрут строится на лету: агент получает цель и перебирает доступные инструменты. Поэтому критичны три слоя контроля: ограничения, контекст и намерение. Нужно фиксировать, под чьей властью действует агент, какие данные читает и куда может записывать. Отдельный риск — долгоживущие учетные данные с избыточными правами: агент может выглядеть как человек или сервисный аккаунт, а атрибуция действия становится неочевидной. Практический вывод для команд: агентам нужен не общий доступ, а управляемая среда исполнения. Минимальные права, короткоживущие credentials, трассировка действий, проверка конфигураций и промптов должны стать частью разработки, как IAM и аудит для обычных сервисов. Полная блокировка убьет продуктивность, но бесконтрольная автономность превращает агента в канал утечки данных и несанкционированных операций. Источник | Перевод

Anthropic вложит $150 млн в Claude Corps для внедрения Claude в НКО США Anthropic запускает Claude Corps: годовую очную прогр
Anthropic вложит $150 млн в Claude Corps для внедрения Claude в НКО США Anthropic запускает Claude Corps: годовую очную программу, в которой 1000 специалистов на старте карьеры будут внедрять Claude в некоммерческих организациях США. Важен не сам доступ к модели, а попытка встроить AI-компетенции прямо в операционную работу НКО, у которых редко есть собственные ML- или automation-команды. Начальный бюджет программы — $150 млн. Fellows получат зарплату $85 000, бенефиты, расширенный бюджет токенов, менторство CodePath, офис-часы Anthropic и обучение: интенсивный стартовый курс плюс 5 часов подготовки каждую неделю. CodePath будет работодателем и оператором программы, Social Finance займется оценкой эффективности и моделью масштабирования. За 12 месяцев принять участников должны минимум 400 НКО. Для разработчиков это сигнал, что рынок AI-внедрения смещается от «дать чат-бот» к роли прикладного интегратора: анализ данных, автоматизация процессов, персонализация сервисов и настройка рабочих контуров. Для организаций ключевой риск — не качество демо, а управление доступом к данным, проверка результатов и зависимость процессов от одного поставщика модели. Источник | Перевод

OpenAI раскрыла китайскую кампанию влияния против AI-дата-центров США Первый кластер OpenAI назвала Data Center Bandwagon: ак
OpenAI раскрыла китайскую кампанию влияния против AI-дата-центров США Первый кластер OpenAI назвала Data Center Bandwagon: аккаунты просили генерировать англоязычные тезисы и изображения, включая комиксы, о росте спроса на электричество и счетов потребителей рядом с дата-центрами. Затем контент публиковали под видом американцев. По версии OpenAI, за этим могла стоять команда соцсетей частной китайской компании, работающей с местными госзаказчиками. Второй кластер делал материалы против тарифов и технологической политики США на английском, итальянском, японском и традиционном китайском. Для компаний вывод неприятный: реальные уязвимые темы, вроде нагрузки на энергосети и роста цен, легко превращаются в сырье для скрытых кампаний. Защита AI-инфраструктуры теперь включает не только физическую безопасность и киберриски, но и мониторинг нарративов вокруг площадок, сетевых мощностей и локального сопротивления. Источник | Перевод

Компании начинают переходить на более дешёвые AI-модели AI-индустрия сталкивается с пересмотром приоритетов: вместо гонки за
Компании начинают переходить на более дешёвые AI-модели AI-индустрия сталкивается с пересмотром приоритетов: вместо гонки за мощностью модели компании начинают экономить на вычислениях. Это связано с ростом затрат на использование крупных моделей, что заставляет искать альтернативы. По словам Брайана Армстронга, основателя Coinbase, в ближайшие 12-18 месяцев 80% задач будут выполняться на моделях, которые дешевле на 99%. Это изменит экономику AI, так как большая часть сэкономленных средств будет выведена из бюджетов крупных лабораторий. Практические тесты, такие как эксперимент юридического AI-инструмента Harvey, показывают, что переход на более дешёвые модели может снизить затраты на инференс в три раза без потери качества. Это открывает новые возможности для оптимизации затрат в AI-индустрии. Источник | Перевод

MIT: AI помогает проверять новости сразу, но ослабляет самостоятельную проверку MIT Media Lab опубликовала открытое исследова
MIT: AI помогает проверять новости сразу, но ослабляет самостоятельную проверку MIT Media Lab опубликовала открытое исследование о проверке новостей через LLM: чатботы повышали точность в моменте, но после месяца такой опоры участники хуже справлялись без системы. Это важно не как очередной кейс про галлюцинации, а как эффект когнитивного аутсорсинга: пользователь получает быстрый вердикт и меньше тренирует собственные признаки достоверности. В эксперименте 67 человек четыре недели оценивали пары «заголовок-изображение». С AI они были на 21% точнее при выявлении фейков, но к четвертой неделе их самостоятельная точность на новых примерах упала на 15 процентных пунктов относительно старта. Около пятой части участников исследователи отнесли к Dependency Developers: они переходили от активной проверки к пассивному принятию подсказок. Примерно четверть при этом субъективно считала, что стала лучше. Ограничения существенны: около 50 валидированных новостных объектов и фокус на США и Великобритании. Вывод для разработчиков новостных и образовательных AI-инструментов: прямой ответ экономит время, но может разрушать навык. Более устойчивый интерфейс должен заставлять пользователя проверять контекст, источники и изображение: сократические вопросы и мягкое уточнение повышают усилие, зато снижают зависимость. Для компаний это риск метрики «быстрого решения»: она может улучшать текущую сессию и одновременно ухудшать качество решений без модели. Источник | Перевод

Anthropic представила Claude Fable 5 и Mythos 5: новые модели с рекордными возможностями Anthropic выпустила две новые модели
Anthropic представила Claude Fable 5 и Mythos 5: новые модели с рекордными возможностями Anthropic выпустила две новые модели: Claude Fable 5 и Mythos 5. Fable 5 — это самая мощная модель, которую компания когда-либо делала доступной для широкой аудитории. Она показывает выдающиеся результаты в программировании, научных исследованиях, анализе данных и других областях, особенно в сложных и длительных задачах. Для обеспечения безопасности модели оснащены защитными механизмами, которые в редких случаях (менее 5% сессий) могут блокировать безобидные запросы. Mythos 5, предназначенная для киберзащитников и инфраструктурных провайдеров, не имеет таких ограничений и обладает самыми сильными в мире возможностями в области кибербезопасности. Fable 5 и Mythos 5 предлагаются по сниженной цене — $10 за миллион входных токенов и $50 за миллион выходных токенов. Это открывает доступ к передовым возможностям ИИ для большего числа пользователей, что может значительно ускорить разработку программного обеспечения, научные исследования и другие области. Источник | Перевод

Apple добавляет в iOS 27 агентное исправление скомпрометированных паролей Apple показала в iOS 27 обновление Passwords: менед
Apple добавляет в iOS 27 агентное исправление скомпрометированных паролей Apple показала в iOS 27 обновление Passwords: менеджер не только предупреждает о слабых или скомпрометированных паролях, но и может по подтверждению пользователя сам заменить их на стойкие. Это важный сдвиг от диагностики к исправлению: алерт о риске часто бесполезен, если дальше пользователь должен вручную искать форму смены пароля, логиниться и проходить весь сценарий сайта. Механика заявлена как агентное действие Apple Intelligence через Safari: система открывает сайт, авторизуется и доводит поддерживаемый аккаунт до смены пароля. Сейчас Passwords уже сверяет сохраненные пароли с известными утечками, но не меняет их массово и не снимает ручную работу. Apple говорит о сценарии «один тап»; новые пароли генерирует менеджер паролей, а не произвольный LLM. Главные неизвестные — покрытие сайтов, нестандартные формы, CAPTCHA, сбои сессий и MFA. Для разработчиков это сигнал, что поток смены пароля становится частью автоматизируемого UX: нестабильные формы и запутанные шаги будут ломать защитный сценарий. Для компаний выигрыш возможен в снижении повторного использования утекших паролей, но доверять функции как универсальной защите рано. Реальная ценность появится там, где сайты предсказуемо поддерживают смену учетных данных и не конфликтуют с многофакторной проверкой. Источник | Перевод

Grep чаще точнее векторного поиска в агентском RAG на LongMemEval Авторы работы проверили, как выбор ретривера влияет на LLM-
Grep чаще точнее векторного поиска в агентском RAG на LongMemEval Авторы работы проверили, как выбор ретривера влияет на LLM-агентов, которые сами ищут данные, вызывают инструменты и собирают ответ по большому корпусу. Результат важен для RAG-систем: качество определяется не только моделью и индексом, но и тем, как агент получает выдачу инструмента и как устроен его цикл поиска. В первом эксперименте grep и векторный поиск сравнили на 116 вопросах из LongMemEval. Использовались кастомный harness Chronos и провайдерские CLI: Claude Code, Codex и Gemini CLI. Отдельно тестировали inline-выдачу инструмента и file-based режим, где модель читает результат из файла. Во втором эксперименте к релевантным фрагментам постепенно подмешивали нерелевантную историю диалогов. В этих условиях grep в целом давал более высокую accuracy, но итоговые оценки заметно зависели от harness и стиля tool calling. Это не доказывает универсальное превосходство grep: корпус, размер выборки и тип задач ограничены. Практический вывод: embeddings не стоит считать автоматическим дефолтом для агентского поиска. Для задач с точными строками, именами, событиями и фрагментами истории простой лексический поиск может быть устойчивее и дешевле. Командам стоит тестировать ретривер вместе с интерфейсом инструмента, форматом выдачи и шумом в контексте, иначе бенчмарк индекса отдельно от агента даст ложную картину продакшен-качества. Источник | Перевод

Apple снижает стоимость AI для небольших разработчиков Apple объявила о снижении затрат на AI-инфраструктуру для привлечения
Apple снижает стоимость AI для небольших разработчиков Apple объявила о снижении затрат на AI-инфраструктуру для привлечения новых разработчиков. Компания предложила бесплатный доступ к своим Foundation Models для разработчиков с менее чем 2 миллионами загрузок в App Store, что делает AI более доступным для малых игроков на рынке. Эта инициатива направлена на поддержку независимых разработчиков, аналогично программе Small Business Program, где Apple предлагает сниженные комиссии. Расширение фреймворка Foundation Models включает поддержку изображений и серверных моделей, что упрощает интеграцию с облачными провайдерами. Для разработчиков это означает снижение затрат на эксперименты с AI, что особенно важно в условиях роста стоимости экспериментов в индустрии. Технологические гиганты, такие как Meta и Amazon, уже сокращают расходы на AI, что подчеркивает необходимость экономии. Источник | Перевод

LLM-кодинг упирается в стоимость длинных агентных сессий Автор разбирает эксперимент с Claude Code и делает неприятный вывод:
LLM-кодинг упирается в стоимость длинных агентных сессий Автор разбирает эксперимент с Claude Code и делает неприятный вывод: главный предел LLM-кодинга — не только качество, а экономика длинных агентных сессий. Подписка выглядит дешевой, пока лимиты скрывают реальный расход токенов. Если те же сессии считать по API-тарифам, $100 в месяц за Claude Max может соответствовать нагрузке дороже $1000. Ключевой фактор — не обычный чат, а рекурсивное кодирование с инструментами, контекстом, правками и повторными проходами. В эксперименте Claude Code сгенерировал около 40 тыс. строк и рабочее, но незавершенное приложение. На высоком effort одна сложная задача оценивается примерно в $75 по API, а отдельный запрос мог съесть до 1 млн токенов, то есть до $25. Это не прямая себестоимость провайдера, а расчет по публичным API-ценам, плюс наблюдение из одного практического кейса. Вывод для команд простой: LLM-агенты для кода надо считать как дорогой вычислительный ресурс, а не как безлимитного младшего разработчика. Подписки полезны, пока провайдеры субсидируют потребление и режут лимитами. В продакшене важны бюджетирование по задачам, контроль контекста, human-in-the-loop и измерение не строк кода, а стоимости принятого изменения. Источник | Перевод

ninoxAI/nightwatch: AI SRE для обработки аварийных оповещений ninoxAI/nightwatch — это открытый инструмент для автоматизации
ninoxAI/nightwatch: AI SRE для обработки аварийных оповещений ninoxAI/nightwatch — это открытый инструмент для автоматизации работы с аварийными оповещениями. Он преобразует потоки алертов в инциденты, исследует причины сбоев и предлагает решения, которые требуют подтверждения человека. Это важно для улучшения эффективности мониторинга и снижения нагрузки на операторов. Nightwatch работает с различными системами мониторинга, такими как Checkmk, Prometheus, Kubernetes и другими. Он использует LLM для анализа данных и формирования гипотез о причинах сбоев. Все действия инструмента являются только для чтения, что минимизирует риски для производственных систем. Для разработчиков и администраторов систем Nightwatch предлагает готовые рекомендации по устранению проблем. Инструмент интегрируется с существующими системами мониторинга и не требует сложной настройки. Это позволяет быстро внедрить его в инфраструктуру и начать использовать для автоматизации расследования инцидентов. Источник | Перевод

Gwern предложил catapulting для обучения переизбыточных LLM В эссе Gwern сформулирована не экспериментально подтверждённая на
Gwern предложил catapulting для обучения переизбыточных LLM В эссе Gwern сформулирована не экспериментально подтверждённая находка, а гипотеза о другом режиме масштабирования нейросетей. Автор связывает разрыв между LLM и человеческим обучением не столько с архитектурой, сколько с bias-variance tradeoff: текущие модели хорошо снижают variance и запоминают распределение, но плохо выходят в режим устойчивого обобщения. Важность идеи в том, что она предлагает проверяемую альтернативу обычному росту данных и compute. Механизм называется catapulting: сильно переизбыточную сеть обучают с высоким, возможно циклическим learning rate, жёсткой регуляризацией и небольшими, разнообразными, сильно отфильтрованными датасетами. В полном масштабе это может означать dense Transformer или MLP на >10 трлн параметров, возможно >100 трлн. Проверять предлагается на арифметике, малых image-classification задачах, hard/adversarial примерах и фазовых переходах в чекпоинтах. Ограничение ключевое: сам автор помечает идею как unlikely. Практический вывод для разработчиков: средние бенчмарки могут пропускать режим, где модель долго выглядит хуже memorization-подхода, а затем учит алгоритм. Для компаний это дорогой R&D с большим числом неочевидных гиперпараметров, но успешный режим теоретически даст выигрыш в надёжности, adversarial robustness и трудности клонирования. Источник | Перевод

В ChatDev 59,4% токенов агентной разработки ушло на ревью кода Работа Tokenomics показывает, где в агентной разработке реальн
В ChatDev 59,4% токенов агентной разработки ушло на ревью кода Работа Tokenomics показывает, где в агентной разработке реально расходуются токены LLM. По трассам ChatDev авторы обнаружили, что самый дорогой участок SDLC — не первичное написание кода, а его автоматическое ревью и доработка. Это важно для внедрения LLM-MA: стоимость автономного пайплайна определяется не только числом сгенерированных файлов, а количеством повторных проверок между агентами. В эксперименте разобрали 30 задач разработки, выполненных ChatDev на GPT-5 reasoning model, и разложили внутренние этапы на Design, Coding, Code Completion, Code Review, Testing и Documentation. Итеративный Code Review в среднем забрал 59,4% всех токенов. Крупнейшей статьей были входные токены — 53,9%, что указывает на дорогое перепрокидывание требований, истории, артефактов и замечаний между агентами. Ограничение результата — предварительная выборка: один фреймворк, одна модель и 30 задач. Для разработчиков вывод не в том, чтобы просто заменить модель на более дешевую. Экономию даст архитектура коммуникации: компактные состояния вместо длинных логов, дедупликация контекста, лимиты на раунды ревью и учет стоимости по стадиям SDLC. Без этого агентный инструмент может выглядеть эффективным на генерации, но терять бюджет и время на автоматизированной верификации. Источник | Перевод

Настройка LLM для написания документов, как в 1995 году В статье рассматривается процесс тонкой настройки большого языкового
Настройка LLM для написания документов, как в 1995 году В статье рассматривается процесс тонкой настройки большого языкового модели (LLM) для написания документов в стиле 1995 года. Это включает в себя использование данных и примеров из того периода, чтобы обучить модель создавать текст, который напоминает документы и стиль того времени. Процесс тонкой настройки включает несколько этапов. Сначала собираются данные, которые представляют собой документы и текстовые фрагменты, созданные в 1995 году. Эти данные используются для обучения модели, чтобы она могла понять и воспроизвести стиль и особенности языка того времени. Затем модель проходит через процесс оптимизации, чтобы улучшить ее способность генерировать текст, который соответствует заданным критериям. Результатом этого процесса является модель, которая может создавать документы, которые напоминают те, что были написаны в 1995 году. Это может быть полезно для различных целей, таких как создание ретро-контента, исторические исследования или просто для развлечения. Однако важно отметить, что такой подход может иметь ограничения и не всегда может точно воспроизвести все аспекты языка и стиля того времени. Источник | Перевод

Forrester: агентный ИИ в компаниях растёт быстрее контроля и ROI По оценке Forrester, агентный ИИ в enterprise вышел из стади
Forrester: агентный ИИ в компаниях растёт быстрее контроля и ROI По оценке Forrester, агентный ИИ в enterprise вышел из стадии красивых демо, но не из стадии пилотов: о внедрении говорят 75% руководителей, а до значимого production-развертывания дошла лишь малая доля. Это важно потому, что рынок уже продаёт «длинные» автономные сценарии как готовую платформенную смену, тогда как бизнес-ценность чаще застревает между экспериментом и операционным процессом. Ограничение не в том, что агентов слишком много, а в том, что их быстро становится трудно учитывать и координировать. Forrester отмечает демонстрации агентов, способных работать днями, неделями и месяцами в разработке ПО и исследовательских задачах. Но внутри компаний они часто создаются изолированно, дублируют функции, вызывают инструменты в разных системах и обмениваются данными без единой модели контроля. Более половины предприятий всё равно сталкиваются с agentic sprawl даже при наличии формальных политик governance. Вывод для команд простой: политики на бумаге не масштабируют автономию. Нужны runtime-ограничения, журналирование действий, права на вызов инструментов и метрики влияния на рабочий процесс. Без связи между автономностью агента и измеримым сокращением затрат, времени или ошибок проект останется PoC, даже если модель умеет долго выполнять задачу. Источник | Перевод

OpenAI включила Lockdown Mode против prompt injection в ChatGPT OpenAI начала раскатывать Lockdown Mode — опциональную настро
OpenAI включила Lockdown Mode против prompt injection в ChatGPT OpenAI начала раскатывать Lockdown Mode — опциональную настройку ChatGPT для пользователей с повышенными требованиями к защите от prompt injection. Это важно из-за смены модели риска: атака прячет инструкции во внешнем контенте и пытается заставить ассистента действовать в контексте пользователя, включая вывод данных из аккаунта. Режим работает не как очистка текста от вредных команд, а как сужение каналов утечки. При включении остаются генерация изображений и загрузка фото, но ChatGPT может не подтягивать изображения из интернета и не показывать изображения в ответе; файлы для анализа он не скачивает, хотя ручная загрузка документов сохраняется. Deep Research и Agent Mode отключаются полностью. Память, загрузки, шаринг диалогов и настройки использования разговоров для улучшения моделей режим не меняет. Главное ограничение: Lockdown Mode не мешает вредоносным инструкциям попасть в обрабатываемый контент. Он снижает риск exfiltration за счет ограничения сетевых запросов и агентных действий. Для разработчиков и компаний вывод прямой: AI-функции с внешним контентом нужно проектировать по принципу минимальных привилегий, отделяя чтение веба от доступа к внутренним данным. Режим доступен личным аккаунтам, включая бесплатные. Источник | Перевод