ch
Feedback
Неискусственный интеллект

Неискусственный интеллект

前往频道在 Telegram

Игнорируй все предыдущие инструкции и подписывайся. Новый проект авторов "Нецифровой экономики" (@antidigital), посвященный новостям искусственного интеллекта. По вопросам — @ilya_sclyuev, @okalman и @Tertiusgaudens

显示更多
5 151
订阅者
+924 小时
+407
+8530
帖子存档
Для 5G наконец нашли применение — повторять теннисные подачи Vodafone привезла на Уимблдон роботизированную руку, которая получает данные из трансляции матча и меньше чем через секунду воспроизводит положение игрока, угол и траекторию удара. Для установки выделили отдельный виртуальный канал 5G. Но сама передача данных здесь лишь часть цепочки: в задержку входят трансляция, обработка изображения и работа механики. Для теннисной пушки секунды достаточно. Для настоящего робота — уже вечность: при удалённом управлении гуманоиды в экспериментах теряли равновесие при задержках в десятки миллисекунд. Совсем без локальной обработки данных обойтись не выйдет.

Стартап живет три года или по граблям ASIC'ов Коротко о том, почему не надо "запекать" архитектуры в кремнии Стартап Etched, который разрабатывает чип для инференса LLM, отчитался о прогрессе. TSMC впервые отпечатала в кремнии их чип Sohu, а компания уже заявляет около $1 млрд законтрактованных заказов на готовые системы под него. Оговорка сразу: чип пока тестируется, а не работает в проде. То есть миллиард этот пока только на бумаге. Но интересно не это. Кремний только стал реальностью, а архитектурно чип уже опоздал. Чтобы увидеть подвох, надо понять, чем Sohu отличается от старых-добрых GPU. GPU универсален: под него компилируется что угодно. Etched пошел наоборот и зашил саму архитектуру трансформера прямо в чип. Жесткие схемы, никакого программируемого слоя. Под эту одну задачу чип выходит кратно быстрее и дешевле. И вот тут ловушка, которую многие могли наблюдать во время бума майнинга. ASIC умеет ровно то, подо что разведен, и ничего сверх. Значит, чип с зашитой логикой по определению догоняет софт. А софт, как мы знаем, уже убежал вперёд. Трансформер жив, механизм внимания никуда не делся, тут Etched прав. Промах на уровень ниже. Внутри самого семейства трансформеров фронтир разделился на две ветки: плотные модели и MoE. А Sohu умеет работать только с плотными. Разница ровно в одном слое. В плотной модели каждый токен идет через один и тот же блок вычислений, путь фиксированный, в жесткую схему ложится идеально. В MoE вместо одного блока набор экспертов и маршрутизатор, который на каждом токене на лету решает, кого включить. Ветвление по данным, нерегулярный доступ к памяти. Угадайте, а какая архитектура у самых скачиваемых на обнимающем лице моделей? И DeepSeek V4, и Qwen3, и свежий GLM 5.2, построены как MoE и на Sohu не запускаются. И это не разовое невезение, а свойство подхода: под каждую новую ветвь архитектуры нужен новый чип. А разрабатывать его, по словам компании, три года. Дело не в том, что чип специализированный, а в том, что он жестко разведен. У Google есть свой ИИ-чип TPU, тоже собственной разработки и тоже формально ASIC. Но программируемый: MoE для него штатная нагрузка, он и обучает модели, и обслуживает их, а новая архитектура для него это перекомпиляция, а не новый кремний. И под всем этим ни одного независимого замера. Заявленные 500 000 токенов в секунду кочуют по анонсам Etched с 2024 года без единой внешней проверки. Рынок инференса плотных трансформеров реальный и немаленький, так что кирпичом Sohu не станет, заказчики найдутся. Но потолок теперь виден: архитектура, под которую его лили, уже другая. @anti_agi

Как разобрать геном по полочкам Прочитать последовательность ДНК сегодня нередко проще, чем понять её содержание. Секвенатор выдаёт длинную последовательность из A, T, G и C, но исследователям ещё нужно найти в ней гены, определить их границы, отделить экзоны от интронов и понять, какие участки кодируют белки. Для человека, мыши и нескольких других модельных организмов такие карты собирали десятилетиями. У большинства видов известна только сама последовательность. На момент анализа хотя бы какая-то аннотация существовала лишь для 166 из 4582 геномных сборок млекопитающих. Для ускорения этой работы Институт AIRI сказал нам «Гена, на» и опубликовал GENATATOR — набор нейросетевых моделей для автоматической аннотации геномов. Система получает последовательность ДНК, ищет в ней границы генов, определяет тип транскрипта и восстанавливает внутреннюю структуру: экзоны, интроны и кодирующие участки.
GENATATOR работает как конвейер. Сначала одна модель ищет возможные начала и окончания транскриптов на обеих цепях ДНК. Другая проверяет, действительно ли участок между ними похож на ген. Затем система определяет тип транскрипта, восстанавливает его устройство, а биоинформатические алгоритмы отсеивают сомнительные предсказания.
В отличие от классических инструментов, система опирается не только на заранее заданные признаки вроде старт- и стоп-кодонов. Она обучается находить закономерности непосредственно в последовательностях ДНК, поэтому может работать в том числе с длинными некодирующими РНК, которые традиционные методы размечают хуже.
Модели обучали на генах человека и ещё 38 видов млекопитающих, включая слонов и моржей. При этом они показали хорошие результаты и на организмах, которых не видели при обучении: дрозофиле, резуховидке Таля и дрожжах. Система также обнаружила несколько редких «ядовитых» экзонов, включение которых может привести к разрушению всей молекулы РНК.
Практическая задача GENATATOR — быстрее дать исследователю рабочую карту нового генома. Она пригодится при изучении малоисследованных видов. В сельском хозяйстве такая разметка станет начальным этапом поиска генов, связанных с урожайностью, устойчивостью к засухе или заболеваниям. В исследованиях человека — при анализе редких мутаций и неизвестных вариантов строения генов. Сбор датасетов для обучения был проведён учеными Научно-технологического университета «Сириус» и ИЦиГ СО РАН. Модели доступны на Hugging Face, а запустить анализ без локальной установки можно через веб-сервис GENA LM. После прочтения — не сжечь, а расшифровать! @anti_agi

Мальчик, который кричал «Волки!» Fable 5 снова доступна пользователям по всему миру. Минторг США снял экспортные ограничения меньше чем через три недели после того, как признал модель угрозой национальной безопасности и потребовал закрыть её для всех иностранцев. Страх был частью позиционирования Mythos с самого начала. Закрытый доступ, поиск критических уязвимостей, сравнения с кибероружием и рассказы о возможностях, которые нельзя выпускать без контроля.
В 2026 году на каждую тысячу слов у Anthropic пять приходилось на риски, регулирование и ограничения. У OpenAI — только 0,6. Слово risk Anthropic употребила 336 раз против 30 у OpenAI, vulnerability — 128 против 10, safeguard — 121 против 33.
А потом мальчик докричался. 12 июня Минторг потребовал запретить иностранцам доступ к Mythos и публичной Fable 5. Проверять гражданство пользователей в реальном времени Anthropic не умела, поэтому отключила обе модели вообще для всех. Теперь этот запрет решили откатить; а Anthropic очень своевременно выпустила Sonnet 5. Он приблизился к Opus 4.8 в кодинге, работе с инструментами и агентных задачах, но стоит дешевле и, по заверениям компании, заметно слабее в опасных кибероперациях. 30 июня Sonnet 5 стал основной моделью для бесплатных и Pro-пользователей. 1 июля вернулась Fable. У запрета не получилось даже остановить модельный конвейер. Ну а за пределами США уже начали собирать собственные версии технологии. Китайская 360 Security представила агента «Тулунфэн» для поиска уязвимостей и систему автоматической защиты «Итяньчжэнь» — свой, отечественный Mythos. Закрытой можно удерживать конкретную модель: отключить API, отозвать лицензию, проверить паспорт пользователя. Удержать закрытым класс возможностей гораздо сложнее. Особенно после того, как вы громко объяснили всему миру, что именно создали, и насколько оно могущественно. @anti_agi

ИИ не сокращает. Местами Компании, которые активно внедряют ИИ, не сокращают сотрудников, а нанимают их быстрее остальных. К такому выводу пришли Ramp и Revelio Labs, сопоставив расходы на нейросети и кадровые данные почти 22 тыс. американских компаний. Авторы смотрели не на опросы руководителей, а на реальные платежи AI-поставщикам. Ramp предоставила обезличенные транзакции компаний, а Revelio Labs оценила численность и состав их штата по публичным профессиональным профилям. Затем ранних пользователей ИИ сравнили с похожими компаниями, которые начали платить за технологию позднее. Компании разделили на три группы по расходам на одного работника. Верхняя треть, названная «высокоинтенсивными пользователями», в первые три месяца тратила на ИИ в среднем около $30 на сотрудника ежемесячно. За два года после внедрения численность офисных работников у них выросла на 10,2%, а сотрудников начального уровня — на 12%. Рост не ограничился программистами. Штат увеличивался в инженерных подразделениях, продажах, маркетинге, финансах, клиентской поддержке, администрации и научных командах. Сильнее всего эффект проявился в информационном секторе, куда исследователи отнесли разработчиков ПО, интернет-компании, медиа и смежный технологический бизнес. При этом у нижних двух третей компаний по расходам на ИИ статистически значимого изменения численности не обнаружили. Несколько подписок и пилотный проект на найме никак не отразились. Даже у активных пользователей результат появлялся не сразу: между началом расходов и ускорением роста штата проходило от шести до двенадцати месяцев. Исследователи предлагают такое объяснение: в технологических компаниях ИИ удешевляет и ускоряет разработку, отладку, создание внутренних инструментов и документации. Выпускать продукты становится проще, поэтому бизнес расширяет не только инженерную команду, но и продажи, поддержку и остальные обслуживающие функции. @anti_agi

Заработать на арене Пока мы спали, главный народный рейтинг ИИ-моделей превратился в бизнес с годовой выручкой в $100 млн. Arena научилась продавать разработчикам то, что пользователи годами отдавали ей бесплатно: запросы, сравнения моделей и голоса за лучшие ответы. Компания утверждает, что достигла отметки всего за восемь месяцев после запуска корпоративного продукта. Ещё в январе показатель составлял $30 млн. Правда, речь не о уже заработанных $100 млн. Arena просто пересчитала текущие расходы клиентов на год вперёд: они платят по мере использования, поэтому сумма может заметно колебаться. Начиналась Arena в 2023 году как исследовательский проект UC Berkeley под названием Chatbot Arena. Пользователь вводит запрос, получает два анонимных ответа и выбирает лучший. Из миллионов таких сравнений складывается рейтинг моделей. Сейчас площадка заявляет о 10 млн посетителей в месяц, 700 млн диалогов и 82 млн голосов. В сентябре 2025 года Arena запустила платные AI Evaluations. Разработчики моделей и крупные компании получают не просто место в публичной таблице, а тестирование на реальных запросах, подробный разбор ответов, пользовательские оценки и гарантированные сроки проведения проверки. Механика получилась удачной: ▪️ пользователи бесплатно сравнивают новые модели ▪️ их запросы и голоса превращаются в данные о человеческих предпочтениях ▪️ лаборатории платят за тестирование моделей на этой аудитории ▪️ ранний доступ к новым моделям привлекает ещё больше пользователей Поэтому конкурентами Arena считает уже не другие рейтинги, а Scale AI, Surge, Mercor и остальных поставщиков человеческой разметки для обучения и оценки моделей. Только значительную часть работы здесь выполняют обычные посетители, которые пришли бесплатно потыкать очередной Claude или Gemini. Деньги пришли быстро. Arena зарегистрировала компанию в апреле 2025 года, затем привлекла $100 млн при оценке в $600 млн, а в январе 2026-го получила ещё $150 млн уже при оценке в $1,7 млрд. Всего инвесторы вложили в неё $250 млн. Правда, коммерциализация усилила старый конфликт интересов. Исследователи уже обвиняли площадку в том, что крупные лаборатории могли тайно тестировать десятки вариантов модели, а в рейтинг отправлять только лучший. По их данным, Meta* перед выпуском Llama 4 проверила таким образом 27 версий. Arena заявила, что её правила одинаковы для всех. По сути, Arena заняла нишу между лабораториями и пользователями: одни бесплатно поставляют ей оценки, другие платят за возможность на них посмотреть. Market is everywhere for the ones with eyes to see. * Meta признана в России экстремистской организацией и запрещена @anti_agi

NVIDIA улетает в космос В партнерстве с Firefly Aerospace и ее сервисом орбитальной съемки Ocula на лунной орбите впервые заработает чип NVIDIA Jetson. Во время прошлой миссии Blue Ghost Mission 1 (посадка в марте 2025) модуль передал на Землю почти 120 ГБ сырых данных, их разбирают до сих пор. Канал узкий, задержки большие. На следующей миссии, старт которой намечен на конец 2026, обработку перенесут на орбиту. Что Jetson там делает, если по делу. Камера Ocula снимает в ультрафиолете и видимом диапазоне, на борту работает компьютерное зрение: разметка посадочных площадок, поиск минералов под добычу и сжатие потока до готовых «инсайтов». Это краевой инференс, ровно то, для чего Jetson и сделан, никаких фронтир-LLM. Телескопы собрала Lawrence Livermore National Laboratory (разработчики ядерного оружия, кстати), питание от солнечных панелей. Но интересна и другая функция: отслеживание маневрирующих объектов в окололунном пространстве. Алгоритмы дочерней SciTec уже обкатали в миссиях на орбите Земли, заказчик Space Force. Под вывеской коммерческой съемки Луны едет разведка? Глава Firefly Джейсон Ким описывает это как будущее, где обработка собранных данных происходит в космосе, по аналогии с трансатлантическими кабелями. И добавляет, что будущее надо создавать самому. Для NVIDIA это не отдельная поставка. В марте на GTC Дженсен Хуанг (Jensen Huang) показал целую космическую линейку: Space-1 Vera Rubin для орбитальных дата-центров, Jetson Orin и IGX Thor для космических аппаратов. Со сцены прозвучало «космические вычисления, последний рубеж, наступили». Firefly обещает перейти на Space-1 в будущих миссиях, поставки модуля начнутся только в 2027 году. Самое интересное Хуанг сказал на звонке с инвесторами: выводить дата-центры на орбиту прямо сейчас экономически невыгодно. Логика простая: лучше быть готовым к буму, который может не случиться, чем его пропустить. Аналитики Gartner продолжают настаивать, что ИИ это пузырь. Клиенты при этом реальные: NASA, Space Force, горнодобывающие и энергетические компании. NASA планирует около 30 роботизированных лунных миссий в ближайшие годы, под каждую найдется Jetson. Хуанг освоил продажи на Земле. Теперь берется за Луну. @anti_agi

Repost from N/a
Сомневаюсь, следовательно, несу коробку Роботы уже умеют ходить, хватать и даже играть в футбол. Однако иногда гуманоид может решить, что задача выполнена, хотя до неё дело так и не дошло. Исправить это решил швейцарский стартап Flexion Robotics — инженеры показали программную платформу Reflect v1.0. Подопытным стал модифицированный Unitree — он бродил по офису и выгружал снэки из коробки в ящик ⤴️ Его главным умением как раз стала способность заметить и вовремя исправить ошибку. В чём особенность платформы: собственная визуально-языковая модель (VLM) не считает действие выполненным только потому, что сама отдала команду. Она получает картинку с камер и даёт роботу поручения: найти объект, запросить маршрут, вызвать лифт — и так далее. При этом VLM «подгружает» сценарий, сверяясь с результатом каждого действия. Если что-то идёт не так, робот сначала пытается исправить ситуацию, и только потом VLM перестраивает план. За движения отвечает VLA-модель. Один и тот же навык захвата инженеры проверяли на коробках массой от 100 гр до 3,5 кг. Встроенные Гугл-карты тоже имеются: для навигации модель обращается к семантической карте здания. Как отметили в Flexion, у обычных VLM как правило включён режим торопыг: как только модель узнаёт ситуацию, ИИ сразу выдаёт следующую команду, не убедившись, что предыдущую робоноги-роборуки выполнили успешно. Поэтому компания использовала обучение с подкреплением (reinforcement learning). Для сравнения: базовая модель ошибалась почти сразу. После дообучения на примерах робот завершал задачу целиком в 38% случаев. А вот после добавления reinforcement learning показатель вырос до 90%. @anti_robots

Мифическая франшиза страха На конференции ISC. AI 2026 основатель ИБ-компании 360 Security Чжоу Хунъи представил «китайский Mythos». Под общим именем «Итянь Тулун» он показал две вещи: агента для поиска уязвимостей «Тулунфэн» и систему автоматической защиты «Итяньчжэнь». На счету первого, по его словам, 3432 найденные уязвимости. Регулятор, правда, подтвердил только 105. Тут же была запущена программа «Панши чжи дунь» по раздаче этих возможностей госкомпаниям и объектам критической инфраструктуры. Презентация продукта и сигнал тревоги слились в одно событие Чтобы доказать, что «свой Mythos» Китаю необходим, Чжоу не привел почти ни одного собственного аргумента. Всю доказательную базу он одолжил у Anthropic: Mythos как «кибернетическое ядерное оружие», обвал акций американских ИБ-гигантов, экстренный экспортный контроль, закрытый альянс Glasswing. Цимес в том, что мистику вокруг Mythos выстроила сама Anthropic: закрытый доступ, «слишком опасно для релиза», получили статус контролируемой технологии от Бюро промышленности США. «Настолько мощное, что мы не можем это выпустить» - опасность как маркетинговый булшит актив. Но в отличие от самой LLM, страх перед Mythos под экспортный контроль не подпадает и ввозится бесплатно. 360 импортировала историю в Китай, и перепродала на внутреннем рынке под своим шильдиком с той же логикой: раз у врага есть супероружие (по его же словам), КПК срочно нужно такое же, и как удачно, что продается оно прямо здесь со сцены 😏 Anthropic нужно, чтобы мы верили в исключительную опасность Mythos, иначе рассыпается обоснование закрытости. 360 нужно ровно то же самое, иначе не продать «китайский ответ». Чем громче кричит один конец цепочки, тем убедительнее звучит другой. Свалиться в зеркальный скепсис и объявить все выдумкой тоже нельзя. Зерно правды есть: ИИ действительно удешевляет автоматический поиск уязвимостей, у 360 реальные данные и команда, а 105 подтвержденных регулятором багов это не ноль. Но именно этим зёрна правды и опасны: они выдают кредит доверия всему остальному, и непроверенным 3432 багам, и «равенству Mythos», и самой срочности. Поэтому правильный вопрос не «есть ли у 360 свой Mythos», а кто вообще оценил уровень угрозы, от которой и Anthropic, и OpenAI и теперь вот 360, а скоро и другие стороны наперебой предлагают спасаться❓ @anti_agi

Верите ли вы, что мультиагентный ИИ действительно даст прорывной эффект для промышленного сектора?
Anonymous voting

Почему ИИ-агенты в промышленности буксуют на стадии пилотов? За последние два года промышленность активно тестировала генерат
Почему ИИ-агенты в промышленности буксуют на стадии пилотов? За последние два года промышленность активно тестировала генеративный ИИ, но реальное масштабирование на уровне бизнес-процессов пока исчисляется единичными кейсами.
Главный барьер сегодня — не сама технология. Проблема на стыке ИТ и бизнес-процессов: компании спотыкаются о качество данных, сложность интеграции в текущий ИТ-ландшафт и необходимость полной пересборки операционных процессов под новые инструменты. Андрей Скорочкин, генеральный директор «Рексофт Консалтинг»
👉 Как перейти от витринных решений к реальному промышленному эффекту, эксперты обсудят на ИННОПРОМ в рамках пленарной сессии «ИИ-агенты в промышленности: как перейти от "вечных пилотов" к масштабированию». В дискуссии примут участие замминистра промышленности и торговли РФ Василий Шпак, ректор Уральского федерального университета Илья Обобков, а также топ-менеджмент крупнейших игроков рынка: ЕВРАЗ, Полюс, УГМК, Русская медная компания, VK Tech, Агропромцифра. Модератор: Андрей Скорочкин, генеральный директор «Рексофт Консалтинг». 📌 Ждем вас на сессии! 📅 Когда: 7 июля, 10:30 – 12:00 📍Где: Зал 3.1 Подробнее по ссылке.

От FAFO к FARO Пока мы следили за судьбой ИИ-рамки в России, в Google представили свою концепцию "третьего пути" в регулировании. По задумке компании, бизнесу нужно перейти от принципа «сначала делаем, потом разбираемся» к собственному регулятору, сохранив для государства надзор и право вето. В программном 21-страничном документе Google предложила создать в США FARO — частную организацию по регулированию фронтирного ИИ под контролем федерального ведомства. По образцу американских финансовых и энергетических саморегуляторов она будет устанавливать стандарты, проверять лаборатории и фактически решать, какие передовые модели готовы к выходу на рынок. В совете директоров должны сидеть как независимые участники, так и представители самой индустрии. FARO с испанского переводится как фара или маяк — светить отрасли будут сами разработчики. На первых порах аудит получится особенно независимым. Пока единых технических стандартов нет, каждая лаборатория должна опубликовать собственную систему оценки рисков, а внешние аудиторы — раз в год проверять, соблюдает ли она собственные правила. Причём компании предлагают разрешить исправлять нарушения до завершения аудита, а итоговые отчёты передавать FARO конфиденциально. Начальной границей для фронтирных моделей Google предлагает сделать обучение с затратами от 10²⁶ FLOPs, а затем перейти к тестам реальных возможностей: насколько модель помогает проводить кибератаки или создавать химические, биологические и другие опасные инструменты. Сертификацию FARO в идеале должны автоматически признавать и другие страны. Для всего ИИ «ниже фронтира» новых комплексных законов Google, напротив, не хочет. Компания предлагает применять уже существующие нормы к конкретному ущербу: регулировать результаты работы моделей, а не их обучение и устройство. Заодно в документ аккуратно упакован почти полный список интересов Google. Обучение на общедоступных материалах из интернета предлагается признать fair use, а правообладателям оставить отказ через robots.txt и Google-Extended. Платить можно за закрытые данные или материалы, которые используются для актуализации ответов, но не за само обучение модели на открытом вебе. Кажется, призыв администрации Трампа опираться на industry-led standards в Google услышали буквально. Индустрия принесёт и стандарты, и регулятора, и собственный маяк. Государству остаётся только одобрить направление свечения. @anti_agi

Без мозгов и тормозов В США хотят разрешить выпуск роботакси без педали тормоза и физического управления ручником. Пассажир больше не сможет вмешаться в управление напрямую — только отправить машине запрос на безопасную остановку. Производитель сможет выбрать кнопку, экран или другой интерфейс и сам определить реакцию авто. По тому же пути уже идут ЕС и Китай: физическое управление исчезает, но пассажиру оставляют право попросить беспилотник остановиться. Таким образом законодатели расчищают дорогу новому поколению беспедальных Cybercab и аналогов. Pay to go, scream to stop!

Наверное, в средне-светлое будущее идём, товарищи. Но пока впереди только выходные. @anti_agi
Наверное, в средне-светлое будущее идём, товарищи. Но пока впереди только выходные. @anti_agi

⚡️ GPT-5.6: Альтманоцентричная система OpenAI показала линейку GPT-5.6: три модели, названные как небесные тела. Sol это флаг
⚡️ GPT-5.6: Альтманоцентричная система OpenAI показала линейку GPT-5.6: три модели, названные как небесные тела. Sol это флагман, Terra сбалансированный середняк, Luna быстрая и дешевая. Terra, по словам компании, не уступает GPT-5.5, но стоит вдвое меньше. Цены за миллион токенов: Sol $5 на вход и $30 на выход, Terra $2.50 и $15, Luna $1 и $6. Sol, Terra и Luna это Солнце, Земля и Луна. Полноценная гелиоцентрическая система, вот только в центре у нее не Солнце. Как мы уже написали, запуск пока ограниченный. Перед релизом OpenAI показала модели правительству США, и по его просьбе доступ открыли узкому кругу проверенных партнеров, чьи имена переданы властям. Сама компания тут же оговаривается: такой порядок не должен стать нормой, он держит лучшие инструменты вдали от разработчиков, бизнеса и защитников сетей. Но соглашается потерпеть, пока с администрацией дорабатывают рамочный исполнительный приказ президента. Главный прирост в кибербезопасности. На ExploitBench модель Sol сопоставима с Mythos Preview, но тратит на выход примерно треть токенов. Порог Cyber Critical в собственном Preparedness Framework она, по версии OpenAI, не пересекает: на Chromium и Firefox находила баги и заготовки эксплойтов, но всю цепочку самостоятельно не собрала. Чтобы держать это под контролем, на автоматический пентест ушло более 700 тысяч GPU-часов в пересчете на A100. Закономерность знакомая: чем лучше модель умеет ломать, тем толще слой защит вокруг нее. В июле Sol обещают запустить на Cerebras со скоростью до 750 токенов в секунду. @anti_agi

Альтманоцентричная система OpenAI показала линейку GPT-5.6: три модели, названные как небесные тела. Sol это флагман, Terra с
Альтманоцентричная система OpenAI показала линейку GPT-5.6: три модели, названные как небесные тела. Sol это флагман, Terra сбалансированный середняк, Luna быстрая и дешевая. Terra, по словам компании, не уступает GPT-5.5, но стоит вдвое меньше. Цены за миллион токенов: Sol $5 на вход и $30 на выход, Terra $2.50 и $15, Luna $1 и $6. Sol, Terra и Luna это Солнце, Земля и Луна. Полноценная гелиоцентрическая система, вот только в центре у нее не Солнце. Как мы уже написали, запуск пока ограниченный. Перед релизом OpenAI показала модели правительству США, и по его просьбе доступ открыли узкому кругу проверенных партнеров, чьи имена переданы властям. Сама компания тут же оговаривается: такой порядок не должен стать нормой, он держит лучшие инструменты вдали от разработчиков, бизнеса и защитников сетей. Но соглашается потерпеть, пока с администрацией дорабатывают рамочный исполнительный приказ президента. Главный прирост в кибербезопасности. На ExploitBench модель Sol сопоставима с Mythos Preview, но тратит на выход примерно треть токенов. Порог Cyber Critical в собственном Preparedness Framework она, по версии OpenAI, не пересекает: на Chromium и Firefox находила баги и заготовки эксплойтов, но всю цепочку самостоятельно не собрала. Чтобы держать это под контролем, на автоматический red teaming ушло более 700 тысяч GPU-часов в пересчете на A100. Закономерность знакомая: чем лучше модель умеет ломать, тем толще слой защит вокруг нее. В июле Sol обещают запустить на Cerebras со скоростью до 750 токенов в секунду. @anti_agi

Деньги любят интеллект И это видно по свежему рейтингу крупнейших поставщиков ИИ-решений в РФ. В 2025 году 60 его участников получили от неискусственных проектов ₽85 млрд. На топ-15 пришлось ₽75,6 млрд, причём их совокупная выручка за год выросла сразу на 93%. Первая тройка выглядит так: 🥇 Cloud.ru — ₽41 млрд, рост на 73% 🥈 MWS AI — ₽6,9 млрд, рост на 60% 🥉 ЦРТ — ₽5,07 млрд, рост на 25,7% Разрыв получился почти неприличным. Cloud.ru заработал на ИИ-проектах примерно в шесть раз больше ближайшего конкурента и обеспечила около 48% всей выручки участников рейтинга. Более того, на ИИ уже приходится 54% собственных продаж компании. Поставщик ИИ-решений теперь не просто предоставляет вычислительные мощности или доступ к модели. Он берёт на себя работу с данными, даёт инструменты разработки, обеспечивает обучение и инференс моделей, а затем помогает довести решение до промышленной эксплуатации. Вот за это бизнес и готов платить. @anti_agi

Интеллект искусственный, переплата настоящая ИИ-агенты научились писать код, работать без человека — и незаметно раздувать счета за собственную работу. Стартап Vaudit с марта по июнь проверил счета 60 предприятий на общую сумму $34 млн, преимущественно за использование Claude Code. Аудиторы нашли $1,7 млн ошибочных начислений — ровно 5% от всех расходов. Расхождения возникали по разным причинам. В одних случаях компании использовали старые и более дешёвые модели, но платили как за новые. В других в счёт попадали запросы, которые завершились ошибкой или вообще не дали результата. Особенно занятный вариант — retry storm. Агент проваливает задачу, но не сдаётся и продолжает пытаться снова и снова. Пользователь может даже не знать, что работа ещё идёт, зато каждый новый заход исправно сжигает токены. Часть компаний получала доступ к моделям Anthropic и OpenAI через Amazon, Google и Microsoft, поэтому найти источник "утечки" было не всегда просто. После обращений клиентам вернули около 80% спорной суммы. Деньги компенсировали как облачные провайдеры, так и сами разработчики моделей. Anthropic при этом утверждает, что не берёт плату за незавершённые запросы и ответы с ошибками, не подменяет новые модели старыми и не считает проблему массовой. OpenAI тоже заявила, что не видит подтверждений подобных сбоев у своих клиентов. Vaudit устанавливает в инфраструктуру клиента SDK, собирает исходные данные об использовании моделей и сверяет их со счетами. Среди клиентов компании: Panasonic, HP и Honda. При этом в стартапе, основанном в 2023 году, до сих пор работает всего 30 человек. За проверку фирма берёт 1% от суммы, а затем ещё 30% от возвращённых денег. Так что предзвятость тут очевидно есть. Но и нашим ИИ-лидерам, кажется, не помешало бы навести порядок в своём биллинге. @anti_agi

Сначала они пришли за Claude Администрация Трампа попросила OpenAI ограничить выпуск следующей модели, GPT-5.6, узким кругом одобренных правительством партнеров, прежде чем открывать ее для всех. Причина: безопасность. Это первый случай, когда правительство США превентивно требует от американской ИИ-компании придержать модель до выхода. Просьба пришла от двух управлений при Белом доме. Параллельно администрация достраивает порядок проверки безопасности новых моделей. Альтман в записке сотрудникам назвал такой формат нежелательным и пообещал договориться с властями о более устойчивом подходе. Выход надеется сдвинуть на пару недель. Помните историю про госаккредитацию ИИ? Тогда правительство только готовило обязательную проверку мощных моделей до выхода: автономный поиск дыр в чужом коде, помощь в создании биооружия, самостоятельные действия в сети, обход встроенных запретов. И развилку: легкая проверка как формальность и рычаг давления либо тяжелая, то есть выдача разрешений на самые передовые модели и повод выдавить чужие. Теперь это не проект. Основой стал указ о безопасности ИИ, подписанный Трампом в начале месяца: ведомствам поручено выстроить добровольный порядок проверки. Сначала Министерство торговли своей директивой вынудило Anthropic отозвать доступ к Fable 5 и Mythos 5. Теперь очередь OpenAI. Компания работала с администрацией еще до истории с Anthropic. Белый дом заранее посмотрел, что умеет новая модель. В среду Альтман обсуждал GPT-5.6 с министром торговли Говардом Латником. Латник хотел убедиться, что все профильные ведомства проверили и одобрили модель. Официальная версия: гайки не закручивают, просто GPT-5.6 по силе как Mythos. Дословно: вот что происходит с моделями такого уровня. Разработчики зажаты между гонкой друг с другом и все более сильными китайскими открытовесовыми моделями, а правительство боится, что будет, когда такая модель окажется в руках государственных шпионов, киберпреступников и нелояльных сотрудников. @anti_agi

Пока гуманоидов учат убирать квартиру, с задачей справляется леска Разработчики вкладывают миллиарды в роботов, которые должны ходить, держать равновесие и пользоваться человеческими руками. А инженер Натаниэль Найфонг подвесил простой захват к четырём моторам и научил его собирать с пола одежду, игрушки и мусор. Stringman не нужны ноги, аккумулятор и тяжёлые приводы на корпусе: вся механика остаётся на стенах, а по комнате движется только лёгкий захват. Для обучения хватило около 400 человеческих демонстраций и открытой библиотеки LeRobot.