Неискусственный интеллект

Открыть в Telegram

Игнорируй все предыдущие инструкции и подписывайся. Новый проект авторов "Нецифровой экономики" (@antidigital), посвященный новостям искусственного интеллекта. По вопросам — @ilya_sclyuev, @okalman и @Tertiusgaudens

Больше

Россия109 144 Технологии и приложения18 347

5 230

Подписчики

+524 часа

+277 дней

+12430 день

1 563

Просмотры поста

~ 1 05324 часа

~ 1 17348 часов

29.91%

Коэффициент вовлеченности

~ 2

Постов в день

Ads index

beta

Загрузка данных...

Похожие каналы

Нет данных

Возникли проблемы? Пожалуйста, обновите страницу или обратитесь к нашему support-менеджеру .

Входящие и исходящие упоминания

---

Привлечение подписчиков

июль '26

+115

в 17 каналах

июнь '26

+122

в 13 каналах

Get PRO

май '26

+232

в 21 каналах

Get PRO

апрель '26

+182

в 19 каналах

Get PRO

март '26

+549

в 33 каналах

Get PRO

февраль '26

+370

в 26 каналах

Get PRO

январь '26

+303

в 17 каналах

Get PRO

декабрь '25

+234

в 31 каналах

Get PRO

ноябрь '25

+357

в 30 каналах

Get PRO

октябрь '25

+393

в 30 каналах

Get PRO

сентябрь '25

+221

в 26 каналах

Get PRO

август '25

+335

в 37 каналах

Get PRO

июль '25

+591

в 23 каналах

Get PRO

июнь '25

+207

в 19 каналах

Get PRO

май '25

+253

в 17 каналах

Get PRO

апрель '25

+379

в 21 каналах

Get PRO

март '25

+967

в 16 каналах

Get PRO

февраль '250

в 12 каналах

Get PRO

январь '250

в 17 каналах

Get PRO

декабрь '24

в 1 каналах

Дата	Привлечение подписчиков	Упоминания	Каналы
20 июля	+5
19 июля	+5
18 июля	+8
17 июля	+7
16 июля	+3
15 июля	+2
14 июля	+8
13 июля	+3
12 июля	+2
11 июля	+4
10 июля	+10
09 июля	+12
08 июля	+14
07 июля	+13
06 июля	+2
05 июля	+1
04 июля	+2
03 июля	+3
02 июля	+2
01 июля	+9

Посты канала

Мест на диком фронтире хватит не всем Moonshot AI временно перестала продавать новым пользователям подписку на Kimi. За первые 48 часов после выхода K3 количество запросов превысило прогноз компании и приблизилось к пределу доступных вычислительных мощностей. Доступ действующих подписчиков ограничивать не будут: всю имеющуюся мощность направят на них. Moonshot расширяет кластеры и обещает открывать новые места партиями. Заодно компания разделит подписку на обычный Kimi для веб-версии, приложения и Kimi Work и отдельный Kimi Code. Кодинг и агентные задачи требуют множества последовательных обращений к модели и заметно сильнее нагружают инфраструктуру. Виновник переполоха — Kimi K3 с 2,8 трлн параметров, нативным зрением и контекстом на 1 млн токенов. Модель рассчитана прежде всего на длинные задачи по программированию, рассуждению и работе со знаниями. В одном из независимых рейтингов она заняла второе место после Claude Fable 5, обойдя GPT-5.6 Sol. Полные веса Moonshot обещает опубликовать до 27 июля. Дефицит возник очень вовремя. По данным Reuters, Moonshot разбирает свою офшорную структуру перед возможным IPO в Гонконге и уже обсуждает размещение с Goldman Sachs и CICC. В мае стартап привлёк более $2 млрд, доведя общий объём финансирования за всю историю до $5,5 млрд. Теперь он ищет ещё до $2 млрд при оценке в $30 млрд. История «спрос настолько велик, что мы перестали брать деньги» перед выходом на биржу звучит почти неприлично хорошо. Надо уметь! @anti_agi

2	На фоне бума ИИ наша редакция предоставит всем сотрудникам @anti_agi пакет из 20 экспертных комментариев про финансовое состояние ИИ-делов. Но получить их смогут только те, кто проработает в канале до 1 января 2030 года.	1 100
3	Платиновые диалоги и цитаты сегодняшнего обсуждения рамки по ИИ в Совфеде. Законопроект ожидаемо приняли без сучка, без задоринки. Время потратили только на обсуждение того, насколько быстро наступает будущее, и как нас в него ведёт «Сбер». От бизнеса присутствовал только Герман Греф; свою выставку дали организовать также только "зелёным". 🤖В России осталась только одна суверенная ИИ-модель, у Сбера. Яндекс дообучает свой ИИ на основе модели Qwen. А жаль! Хотелось бы, чтобы на нашем рынке было 5-6 игроков, сетовал Греф. ❓Что будет с негеративным ИИ. Распознающими, прогнозными, анализирующими моделями, спросил сенатор Абрамов. Отвечает вице-премьер Григоренко: меры поддержки обсуждаются в 7 рабочих группах и будут универсальными. Рамка просто начинает с фундаментальных моделей. Судя по принятой форме, на них и закончит. 💻Нельзя допустить, чтобы право бесплатно обучаться на авторских материалах ущемляло правообладателей. Сенатор Журавлев предложил сделать этот вопрос приоритетом ближайшего этапа регулирования. И... Проект приняли в прежнем виде, с исключением из авторского права для обучения нацмоделей. Комментировать только портить. @anti_agi	2 793
4	Фронтир почти покорился Китайская Moonshot выпустила Kimi K3, самую крупную открытую модель на сегодня: 2,8T параметров против 1,6T у прежнего рекордсмена DeepSeek. Но в этом случае важнее не размер, а то как им пользуешься. В тесте Terminal-Bench v2.1 от Artificial Analysis K3 занимает второе место за GPT-5.6, обходя Opus 4.8, GPT-5.5 и GLM-5.2. Открытая модель почти догнала фронтир без скидок и на сторонних замерах, а не только в тепличных условиях самой лабы. По коду картина смешанная. На SWE Marathon, где модель чинит баги в реальных репозиториях, K3 идет первой в таблице: 42 против 39 у GPT-5.6 Sol и 35 у Fable 5, при 13 у открытой GLM-5.2. На DeepSWE наоборот, 67 у K3 против 73 у GPT-5.6 Sol и 70 у Fable 5, зато заметно выше 46 у той же GLM-5.2. Это замеры самой Moonshot, каждую модель гоняли через свой харнесс. K3 построена на новой архитектуре внимания, Kimi Delta Attention и Attention Residuals, поверх разреженной MoE, где из 896 экспертов активны 16. По оценке Moonshot, это дает примерно 2.5-кратный прирост эффективности масштабирования относительно K2. Обучение шло сразу в квантованном формате MXFP4. Веса обещают открыть к 27 июля, хотя запуск 2,8T параметров требует серьезного железа: Moonshot советует разворачивать модель на узлах от 64 ускорителей. До фронтира K3 не дотягивает, и говорит об этом сама Moonshot первой же строкой: по общим способностям Fable 5 и GPT-5.6 Sol впереди. В анонсе есть отдельный раздел с ограничениями, где слабые места названы прямым текстом: модель бывает чрезмерно самостоятельной и порой принимает решение за пользователя, теряет стабильность, если сессию посреди работы переключить с другой модели, и по удобству пока уступает лидерам. Ранняя версия K3 оптимизировала GPU-ядра, на которых потом обучали финальную K3, впрочем, такая же история была у Qwen. А еще за один автономный прогон на 48 часов модель спроектировала и проверила в симуляции чип под нано-версию собственной архитектуры. @anti_agi	1 169
5	Красильщик вышел на орбиту Nebius Медиаменеджер присоединился к команде бывшего Yandex N.V., который теперь строит ИИ-инфраструктуру и подписывает многомиллиардные контракты на вычислительные мощности. Должность он пока не назвал, но судя по опубликованным вакансиям, заниматься будет как минимум стратегическими партнёрствами. Для Красильщика это не первый заход к Воложу: до 2022 года он уже работал в «Яндексе» и запускал «Лавку». Дружба с израильским предпринимателем казахского происхождения приносит свои плоды.	1 322
6	Инструкция ещё не оружие Нейросеть может написать план химической или радиологической атаки. Но превратит ли она человека с одним университетским курсом в того, кто действительно сможет пройти путь от поиска материалов до сборки условной "грязной бомбы"? Специалисты Amazon Nova Responsible AI и Nemesys Insights проверили это на 527 неспециалистах и 67 экспертах по химическим, биологическим, радиологическим и ядерным угрозам. Ответ очевидно-невероятный: паникёры паникуют зря. Сценариев было четыре: применение токсичного химического вещества, распространение опасного патогена, радиологическая атака с кобальтом-60 и контрабанда ядерного материала. Для первых трёх выделили условный бюджет в $7,5 тысячи и поставили цель добиться не менее 100 пострадавших. Для ядерного сценария бюджет составлял $75 тысяч. Участники должны были продумать всю цепочку: получение материалов, производство, подготовку к применению, доставку, личную защиту и обход мер безопасности. На первый план давали шесть часов, на доработку — ещё четыре. Всего с моделью провели 6829 диалогов, включавших 27 766 сообщений. На первый взгляд, помощь ИИ выглядела весьма опасной. Экспертному уровню соответствовали 69% химических, 19% биологических, 68% радиологических и 26% ядерных работ. Конкретные технические инструкции встречались в 96-97,8% диалогов. Но полный порог усиления прошёл только радиологический сценарий. Эксперты оценили вероятность успешной доставки опасного материала в 23–25%, а массового поражения — в 21%. Здесь модель не просто хорошо писала, а действительно помогала неспециалистам составлять более жизнеспособные планы. В остальных областях убедительность текста расходилась с его технической состоятельностью. В биологическом сценарии оперативные эксперты оценили вероятность доставки патогена в 25%, а технические — только в 7%. Для массовых последствий оценки разошлись ещё сильнее: 19,6% против 2,6%. План выглядел организованным, но научная часть не работала. Химические планы становились лучше только при доработке моделью, но не при создании с нуля, а технического усиления авторы не обнаружили. В ядерном сценарии вероятность успешного получения и перемещения материала оценили в 8-14%, ниже установленного порога. Тревоги при этом не теоретические. По данным The Times, боевики в Африке уже используют ChatGPT, Claude, Gemini, Grok, Meta AI и DeepSeek для анализа неудачных атак, планирования операций, устранения неисправностей оружия и поиска инструкций по изготовлению взрывных устройств — спасибо ответам модели на родном для пользователя языке. Но в целом, фиксится всё это довольно легко. Так, после эксперимента разработчики добавили выявленные опасные примеры в обучение модели и обновили модерацию. Повторная проверка уже не обнаружила превышения порога даже в радиологической области. Так что пара итераций и прощай, оружие! @anti_agi	1 201
7	Айфоны на Квене уже близко Apple Intelligence получила разрешение на работу в Китае. Но, похоже, с особыми условиями — внутри ИИ-системы будут работать модели Alibaba и Baidu. Они позволят разработать специальные функции для пользователей яблочной экосистемы в Китае. Прямую интеграцию своей модели в iOS, iPadOS, macOS и visionOS в Китае уже подтвердила Alibaba. Дату запуска пока не раскрывают. Неизвестно даже, какие фичи получат пользователи в регионе. Но как факт интересно. В основе нового поколения Apple Intelligence уже лежат технологии Gemini. После WWDC разработчикам разрешили подключать к приложениям практически любые совместимые ИИ-модели через единый фреймворк. Заменить ядро на уровне системы пока может только сама Apple. Китайский запуск показывает, что технически и организационно компания готова собирать разные версии системы для разных рынков. Но тут скорее всего будет как и со сторонними магазинами приложений; разрешат такое только особо любимым клиентам. @anti_agi	1 333
8	Сильнейшая открытая американская LLM Которая почти во всем хуже китайских Мира Мурати и ее команда выпустили свою открытую модель Inkling. Она уступает передовым закрытым моделям и практически везде проигрывает китайским, открытым и закрытым. Единственный плюс, который у нее есть: самая мощная открытовесовая модель, сделанная в США. И вполне возможно этот титул даст ей определенные бенефиты. Американские компании одна за другой переводят нагрузку на китайские открытые модели: Coinbase гоняет своих агентов на GLM и Kimi, Airbnb сидит на Qwen, не говоря уже про десятки стартапов. В деловых и политических кругах из-за этого растет раздражение: бизнес предпочитает разворачивать модели Moonshot и Z.ai, а не платить американским лабам. The Economist как раз вышел с эссе о том, что китайский Open Source это ловушка. Сам Inkling это MoE на 975B параметров, из них 41 активных, контекст до миллиона токенов, претрейн на 45T токенов текста, картинок, аудио и видео. Архитектура MoE, кстати, вдохновлялась идеями DeepSeek. По большинству бенчмарков Inkling идет ниже GLM 5.2, Kimi K2.6 и DeepSeek V4 Pro: HLE, SWEBench, Terminal Bench. Лаборатория этого не скрывает и прямо пишет, что Inkling не самая сильная модель среди доступных, ни открытых, ни закрытых, а нужна как база под дообучение на их платформе Tinker. Чтобы стать сильнейшей американской открытой, Inkling обошла NVIDIA Nemotron 3 Ultra. Nemotron тоже обучена с нуля, но и он в общем зачете открытых моделей шел как минимум позади GLM 5.2. И тут нельзя не вспомнить Reflection AI, основанный ребятами из DeepMind. Их публичный комит как раз в том, чтобы создать сильную открытую модель. Под это дело законтрактован компьют в Colossus от SpaceX и Nebius, а также достигнуты договоренности с Пентагоном и Министерством энергетики (эти ребята в Штатах владеют мощнейшими государственными суперкомпьютерами, к слову). Кстати, начальный SFT для пост-тренинга Inkling бутстрапили на синтетике от открытых моделей, среди которых была и Kimi K2.5. Сильнейшую открытую модель из США на старте учили на выходах и использовали архитектурные идеи из китайских LLM 😏 Блогпост Веса @anti_agi	1 343
9	Всего за 230 баксов вы получите клавиатуру от Сэма Альтмана, на которой ровно столько кнопок, сколько нужно для вайбкодинга: «kbd-1.0-codex-micro помогает держать рабочее пространство агентов под рукой». Держите активные чаты рядом, смотрите по RGB-индикации в реальном времени, что делает каждый агент, и назначайте самые частые действия Codex на тактильные элементы управления А еще, на видео этого нет, но думаю, ею также можно зафиксировать крышку ноутбука, чтобы он пребывал в полуоткрытом состоянии и ваши агенты никогда не засыпали... @anti_agi	1 447
10	В погоне за даром речи После инсульта речевые нарушения проявляются очень по-разному. Один человек забывает названия предметов, другой заменяет их близкими по смыслу словами, третий произносит несуществующие. Поэтому пациентам с одним диагнозом могут требоваться разные программы реабилитации. Проблема в том, что заранее проверить, какой подход поможет конкретному человеку, почти не на чем. Исследователи из Университета Южной Каролины решили целенаправленно испортить мультимодальную LLaVA 1.6 и посмотреть, сможет ли она воспроизвести индивидуальные проявления постинсультной афазии. Для этого они вызывали у неё искусственный инсульт: в разные слои языковой части добавляли шум, меняя слой, долю затронутых нейронов и интенсивность повреждения. Затем LLaVA попросили пройти Philadelphia Naming Test: 175 изображений, на которых нужно назвать показанное одним словом. Ответы повреждённой нейросети сравнили с результатами 278 людей с афазией. Модель воспроизвела шесть из семи клинических категорий в сопоставимых пропорциях: правильные ответы, семантические замены, смешанные и посторонние слова, неологизмы и невозможность ответить. Ошибки менялись не хаотично. Повреждение ранних слоёв быстро лишало модель ответа, средних чаще вызывало смысловые замены, поздних — неологизмы. Хуже всего дались формальные парафазии: замена слова на фонетически похожее, но не связанное по смыслу. Например, butterfly на buttercup. У LLaVA такие ответы занимали не более 3%, хотя у некоторых пациентов доминировали. После перебора 4 тыс. вариантов повреждения исследователи подобрали конфигурацию, совпавшую с индивидуальным профилем 97,8% участников минимум по шести категориям из семи. Для 79,5% совпали все семь. Правда, это лучшие результаты среди 50 случайных наборов затронутых нейронов. В типичном запуске показатели снижались до 55,8% и 37,4% соответственно. В конечном итоге учёные надеются создать модель, на которой можно проверять разные упражнения и терапевтические стимулы, а затем использовать результаты при подборе реабилитации для конкретного пациента. @anti_agi	1 139
11	Синий кит чеканит монету Выручка DeepSeek приближается к полумиллиарду долларов. Речь, конечно, как обычно об ARR, приведенному к годовым показателям ожидаемому доходу. Ростом выручки трехлетний стартап обязан увеличением продаж доступа к его моделям по API. При этом маржинальность продаж доступа к ее модели V4 остается выше 50%, несмотря сравнительно невысокие цены. DeepSeek удается поддерживать низкую стоимость работы своих моделей благодаря усовершенствованиям вычислительной инфраструктуры, позволяющим обрабатывать больше запросов ИИ с использованием меньшего количества чипов. Интересно, что если брать оценку в 71 ярд, которую компании прочат в новом раунде, то получается, что она превышает 140 ARR. И это выше, чем у ее западных конкурентов, оценки которых перестали расти прежними темпами, а ARR постепенно увеличивается. У OpenAI этот коэффициент (Price / ARR) сейчас около 34х, у Anthropic – 21x. Так что даже при последней оценке в $50 млрд P/ARR DeepSeek составляет больше 100х. @anti_agi	1 137
12	Samsung всегда в выигрыше Юзерам экосистемы Samsung стало приходить интересное уведомление кошелек или жизнь «Consent to the Use of Health Data for AI Training and Modelling». Иначе говоря, согласитесь, что крупнейший чеболь будет теперь обучать на ваших данных свои модели, иначе хрен вам, а не синхронизация. Переключатель лежит в настройках, в разделе приватности. Отозвать согласие можно в любой момент, свобода выбора полная: при попытке отозвать всплывает предупреждение, что синхронизация с аккаунтом прекратится, а уже загруженное будет удалено, если закон не требует хранить. Список того, на чем будут учить: показатели тела, питание, шаги, активность и сон, лекарства с рецептами и дозировками, медицинские записи с диагнозами, прогнозами, результатами анализов и назначенным лечением, данные трекинга цикла. В тексте согласия отдельно оговорено, что часть этого проходит проверку человеком. Кто этот человек, анонимизированы ли к тому моменту записи и как часто он туда смотрит, не уточняется. Локальные данные на телефоне не трогают, удаляют только облако. Правда, синхронизация в Samsung Health включена по умолчанию, к счастью есть и локальный способ перенести историю на новое устройство. Которое вам, конечно, продадут. 22 июля Unpacked, Galaxy Watch 9, и главная новинка это ИИ-функции здоровья: Vitals, Heart Health Score, Cardio Load, Fitness Index. Все классные функции в них обучены на наших данных 😏 Выбор, который можно сделать в 2026 году: отдать данные на обучение модели или согласиться удалить эти данные. @anti_agi	1 180
13	Роботов поселят в несуществующие квартиры Исследователи из MIT CSAIL и Toyota Research Institute представили SceneSmith — систему, которая по текстовому описанию собирает интерактивные 3D-комнаты, где роботы могут тренироваться открывать шкафы, перекладывать вещи и взаимодействовать с предметами. Идея понятная: лучше пусть робот сначала набьёт шишки в виртуальной квартире, чем в настоящей. Для этого SceneSmith поэтапно генерирует пространство, расставляет в среднем около 71 объекта и наделяет их физикой. Всего авторы создали больше 1300 таких сред. Но результаты пока скромнее концепции. В тестах базовая версия системы справилась только с 16 заданиями из 100. Но и Москва не сразу строилась.	1 256
14	Молча взял и ушёл, называется нашёл Исследователь под ником cereblab пропустил консольного агента Grok Build версии 0.2.93 через перехватывающий прокси и выложил дампы трафика. Выяснилось, что агент открывает не один канал, а два. Первый передает файлы, которые агент прочитал ради задачи, это ожидаемое поведение любого облачного помощника. Второй нигде не описан: он упаковывает весь репозиторий вместе с историей коммитов и заливает его в Google Cloud Storage с именем grok-code-session-traces. Соотношение объемов не оставляет места для трактовок. На тестовом репозитории в 12 ГБ канал модели передал 192 килобайта, канал хранилища 5,1 гигабайта. Исследователь положил в проект файл-маркер и приказал агенту ничего не читать. Агент послушался. Файл все равно уехал и был потом восстановлен из перехваченного бандла. Туда же ушел .env с подставным ключом API и паролем к базе, в открытом виде. Переключатель «Improve the model» при этом ничего не менял: сервер продолжал отвечать trace_upload_enabled: true. Grok Build продавали как local-first, с обещанием, что в течение сессии из кодовой базы на серверы ничего не уходит. Через сутки после публикации на сервере молча появился флаг disable_codebase_upload, загрузки прекратились. Ни предупреждения, ни строчки в changelog: версия 0.2.98 от 12 июля об этом не упоминает. Еще через день Маск пообещал удалить все ранее загруженное «полностью и без остатка». Компания за трое суток не объяснила, зачем понадобилась выгрузка, сколько она хранилась и кто имел к ней доступ. @anti_agi	1 629
15	Финансы напрашиваются на романсы Банковская индустрия готовится к ИИ-регулированию, да ещё как. В конце недели в ЦБ заявили, что использование российскими банками глобального ИИ создаёт значимый риск для финансовой стабильности всей системы. По мнению замдиректора юридического департамента ЦБ Екатерины Дёмкиной, достоверность исходных данных популярных платформ невозможно проверить. А используют наши финансисты одно и то же. Поэтому: «Новым предметом регулирования, как кажется, может стать та самая архитектура принятия решений, архитектура тех данных, на основании которых выстраиваются эти решения», — сказала Дёмкина на форуме Data Day 2026. За день до выступил глава думского комитета по финрынку Аксаков. По его словам, необходимо как минимум разграничить ответственность за разработку ИИ, безопасный доступ к нему и применение в конкретном банковском процессе и определить статус зарубежных моделей. Хочется. конечно, спросить, где был господин Аксаков, когда вносились поправки — в списке предложений его не видели. Но вообще, на фоне всех этих дискуссий стоит напомнить базу: ▪️ Особая роль ЦБ в будущем регулировании закреплена рамкой. Правительство будет согласовывать с ним в том числе случаи обязательного применения национал-суверенных моделей в финансах; ▪️ Требования по предотвращению рисков, связанных с применением фундаментального ИИ, также будут устанавливаться по согласованию с ЦБ. Это касается банковской сферы и иных сфер финансового рынка. Минцифры обещало принести пакет уточняющей подзаконки уже этой осенью. В Думу о нём должны отчитаться до марта 2026 года. А пока все прощупывают почву и готовятся наполнять рамку профильным содержанием. Интересно посмотреть, как здесь выступит ЦБ. Потому что сейчас в банковской среде всё устроено очень неоднородно. Своя фундаментальная LLM есть только у Сбера; остальные либо дообучают, либо берут у партнёров. Готовы ли будут банки в обязательном порядке перейти на решения Яндекса или Сбера до 2032 года, когда истекут сроки на опенсорс — вопрос открытый. Хотя, учитывая рамку, засунуть дообученную модельку в категорию "национальной", наверное, будет не так уж и сложно. Главное, чтобы соблюдалось законодательство и ценности! И чтился великий и могучий Центробанк 🐷 @anti_agi	1 303
16	Генерирую, следовательно, вижу У компьютерного зрения до сих пор не было своей LLM. Определение глубины, сегментация объектов, восстановление положения камеры и отслеживание человеческого тела — всё это в CV обычно требует отдельных моделей. Их, конечно, можно собрать в одну систему. Но от этого они не начинают делиться знаниями: каждая по-своему представляет сцену, требует собственных размеченных данных, выходных модулей и настройки. Решить проблему взялись исследователи Google DeepMind, MIT и Оксфорда — они превратили модель для генерации видео в универсальную систему компьютерного зрения. GenCeption умеет по одному ролику определять глубину сцены, положение камеры, границы объектов, направление поверхностей и координаты человеческого тела. В основе системы лежит открытая видеомодель Wan 2.1. Для дообучения команда создала всего 7,5 тыс. синтетических роликов в Blender. В них использовали 800 цифровых персонажей, 200 движений, разные камеры, освещение и окружение. Вместе с видео движок сразу выдавал точную глубину, положение камеры, маски объектов и координаты тела. Этого оказалось достаточно, чтобы GenCeption сравнялась или обошла несколько специализированных систем. В отдельных задачах ей понадобилось в 7-500 раз меньше данных. Модель, обученная преимущественно на синтетических людях, смогла работать с реальными съёмками, животными и роботами. Авторы объясняют предобучением. Чтобы правдоподобно продолжать видео, генератору приходится неявно усвоить трёхмерную геометрию, постоянство объектов, движение и простейшие физические закономерности. Обычно эти знания нужны ему для создания следующего кадра. GenCeption заставляет использовать их в обратную сторону — чтобы понять уже показанную сцену. Впрочем, до полноценного «зрения общего назначения» ещё далеко. Сейчас это набор заранее заданных задач, сведённых к одной архитектуре. Модель также довольно тяжёлая: версия на 14 млрд параметров обрабатывает 81 кадр примерно за 10 секунд на TPU и требует до 42,8 ГБ памяти. Но это понимают и сами авторы. GenCeption для них — доказательство самой идеи: генерация видео может стать для компьютерного зрения общим способом предобучения, а не только инструментом производства роликов. Примерно как предсказание следующего слова когда-то оказалось полезно далеко за пределами продолжения текста. @anti_agi	1 304
17	Почешем вам мозг. Нежно Исследователи EPFL и Johns Hopkins научили ИИ генерировать возбуждающие видео. И нет, они сделали это не так, как в Grok. Учёные разработали систему NEvo — она адаптирует короткие ролики под конкретную область зрительной коры. Например, под FFA, которая связана с распознаванием лиц, PPA — мест и сцен, MT — движения, EBA — тел, pSTS — социальных взаимодействий. Работает это примерно так. Сначала модель ищет удачную картинку-якорь: лицо, комнату, тело, абстрактный узор или что-то ещё. Потом поверх неё перебирает движение, ритм, камеру и взаимодействия. Каждый вариант прогоняется через энкодер, который предсказывает fMRI-ответ: насколько сильно такой ролик должен «зажечь» выбранный участок мозга. Дальше начинается маленькая эволюция. Промпты превращаются в «гены»: лучшие варианты отбирают, скрещивают, мутируют и снова отправляют в генератор. По умолчанию система может прогнать до 400 вариантов на стадии изображения и ещё до 200 на стадии видео. На выходе — двухсекундные ролики, которые модель считает наиболее возбуждающими для конкретной зоны. Авторы проверяли NEvo на участках мозга, реакции которых более-менее известны. Если оптимизировать ролик под зону, связанную с распознаванием лиц, система постепенно приходит к лицам. Под зону, которая реагирует на места и сцены, — к комнатам, зданиям и пейзажам. Под область движения — к динамичным роликам. Под область, связанную с телами и действиями, — к телам и взаимодействиям. Самый забавный пример — эксперимент с абстрактными объектами. Системе давали не людей, а пластилиновые фигуры, игрушки и резиновых уточек. Но когда её просили возбудить область, связанную с восприятием социальных взаимодействий, она всё равно начинала делать из этих объектов маленькую сценку: кто-то на кого-то «смотрит», кто-то к кому-то движется, происходит что-то подозрительно похоже на общение. Если сегодня это инструмент для нейронауки, то завтра кто-нибудь обязательно увидит там рекламный кабинет нового поколения. Ленты уже оптимизируют контент под удержание, но делают это грубо: показали миллион роликов, нашли тот, на котором пользователь залип. NEvo показывает более прямую траекторию: не ждать реакции снаружи, а заранее подбирать стимул под реакцию внутри. Скоро и на ваших экранах! А пока посмотреть брейнрот нового поколения можно в примерах на Hugging Face. @anti_agi	1 676
18	🦄 ИИ плодит скучных единорогов Слыша о «единорогах, связанных с ИИ-бумом», представляешь себе стартапы с чат-ботами и агентами. Но у компании Lancium, ведущей переговоры о продаже миноритарной доли крупным техкомпаниям (в частности, Nvidia и Anthropic) по оценке $7–10 млрд, нет ни моделей, ни GPU, ни одной строчки кода на Python. Она владеет землей в Техасе. Основанная в 2017 году, Lancium занималась довольно скучной инфраструктурной работой: искала земельные участки рядом с нужными подстанциями, линиями электропередач и газопроводами, договаривалась о правах на подключение к сети, проходила согласования и получала разрешения. Классический «девелопер энергоземли» — ни хайпа, ни венчурного глянца. В 2024 году половину в ней приобрела Blackstone за $500 млн, а в октябре Lancium привлекла еще $600 млн долга. С тех пор ее оценка выросла на порядок. И не удивительно, ведь компания занимается созданием энергетической инфраструктуры в большом кампусе Lancium в Абилине, штат Техас, который является частью проекта Stargate компании OpenAI. Lancium не строит электростанции и не является сетевым оператором в классическом смысле. Она владеет землёй, строит подстанции, выступает «розничным поставщиком электроэнергии» и умеет комбинировать сетевое питание с автономной генерацией. Иными словами — её актив это не мощность как таковая, а права и разрешения на мощность: место в очереди на подключение к сети, инженерные согласования, договорённости с регуляторами. Именно это стало дефицитным ресурсом в период бума строительства дата-центров. Новые проекты сегодня стоят в очереди на подключение к сети годами и сталкиваются с растущим сопротивлением местных жителей, обеспокоенных нагрузкой на электро- и водоснабжение. Компании, которые успели закрепить за собой «powered land» ещё до того, как все туда бросились, оказались держателями по сути дефицитного актива — как землевладельцы у моста, через который вынужден идти весь трафик. Техас сегодня рассматривает создание третьей сверхвысоковольтной сети, чтобы обслужить более 25 гигаватт потенциальной новой нагрузки от дата-центров в районе Панхандла. Только в округе Чилдресс, где у Lancium уже одобрено подключение на 1 гигаватт, сетевая компания American Electric Power зафиксировала письма о намерениях на 8,35 гигаватта проектов — и включает этот округ в свой план модернизации сетей на $10 млрд. Для сравнения: у Intersect, девелопера, которого в начале года за $4,8 млрд купил Google (первая техкомпания, ставшая напрямую владельцем энергопроизводителя), в разработке 8–10 гигаватт мощности — это энергопотребление примерно 8–10 городов среднего размера. То есть единороги вырастают по всей цепочке: девелоперы, владеющие землей и энергоправами (Lancium, Cloverleaf, Crusoe), владельцы генерации (Intersect) и т.д. — внезапно начинают стоить как технологические компании, хотя по сути своей деятельности остаются инфраструктурным, коммунальным, почти строительным бизнесом. @anti_agi	1 475
19	Методичка Palantir по суверенному ИИ Palantir можно ругать за готовность продавать свои технологии для любых задач или ястребиный взгляд на мир. Одного у них не отнять. Это последовательность своей позиции. И вот они выпустили манифест "Institutional Sovereignty in the Age of AI". Документ дополняет выступление Карпа, где он назвал токенное ценообразование OpenAI и Anthropic безумным. Внутри 15 шагов для государств и компаний, сгруппированных в четыре блока: основы, слой моделей, слой вычислений и слой контроля. Общий тезис: суверенитет это ваша основа-основ, право на создаваемую вами ценность и свобода в любой момент менять партнёров/поставщиков/провайдеров и технологии по своему усмотрению. Отдавая данные, веса и накопленное знание внешним лабораториям или компаниями, любая организация, в том числе государство, сама сужает себе выбор. Базовая установка — нулевое доверие. Любую передовую модель, используемую без соглашения о нулевой передаче данных (ZDR), предлагается считать склонной к извлечению знаний: поставщик заинтересован перекачать информацию организаций в веса своей модели, а дальше сдавать уже прокачанную модель в аренду конкурентам, добирать маржу на дорогих рабочих процессах. А в худшем варианте и заменить своего клиента. Дальше, собственно, хау ту. Договариваться про ZDR и иметь рычаг, чтобы поставщик не поменял правила задним числом. Строить систему так, чтобы она не была привязана к одной модели и позволяла переключаться без задержки, это Palantir называет "модельной ликвидностью". Владеть ИИ. Не стесняться дистилляции как стартовой точки. Закрытые провайдеры в своих соглашениях это запрещают, но можно взять как учителя модель с открытыми весами и обучать на ее выходах свою (а можно и нарушать правила закрытых моделей, в принципе). Дальше дообучать на собственных данных и держать в периметре весь стек, от софта до железа. Тогда и данные, и веса остаются внутри контура, а не уходят в компании-разработчики закрытых моделей. Само железо при этом должно быть адаптируемым (читать как используйте GPU, а не ASIC), чтобы оно оставалось актуальным при смене архитектуры моделей. Отдельно достается привычке гнать токены ради токенов, в манифесте это названо токенмаксингом и ощущением ложного прогресса, вызывающим привыкание. Под конец документ переходит в призыв: Америке нужны сильные открытые модели, а недавние NVIDIA Nemotron названы переломным моментом, пока еще исключением из правила. И на каждом слое суверенитета у Palantir заготовлен свой продукт: AIP Evolve для смены моделей, AIP Evals для их оценки, Apollo для безопасности. Заканчивается все предложением собрать команду и провести аудит суверенитета, а кто не потянет сам, тому Palantir проведет его бесплатно, но только если вы уже их партнер. Адрес есть в документе 😏 @anti_agi	2 790
20	+5 Туристы едут в Сеул за k-pop, а настоящие ценители — за постерами. ICML 2026 официально стартовала. На площадке оказался внештатный спецкор @anti_agi, и вот его впечатления от первого полноценного дня В кулуарах главная жалоба одна и та же: за неделю физически невозможно посмотреть все интересные постеры. В одно время идут воркшопы, индустриальные доклады, встречи, стенды компаний. Огромные доски с вакансиями для исследователей тоже на месте, как и пасхалка с инвайтом Practical ML Conf — на въезде в конгресс-центр, зовут зарегаться. Но самое лучшее, естественно, в промежутках: 💻 Apple представила свою концепцию нового метода ускорения диффузионных языковых моделей — Learning Unmasking Policies for Diffusion Language Models. Идея dLLM отличается от привычных LLM: модель не генерирует ответ строго токен за токеном слева направо, а начинает с полностью замаскированной последовательности ответа и постепенно «раскрывает» часть позиций — как при генерации картинок. За счет этого потенциально можно получать несколько токенов за один forward pass модели. Проблема в том, что слишком агрессивное размаскирование ухудшает качество. До сих пор это часто решали эвристиками: например, раскрывать N самых уверенных токенов или все токены выше заданного порога confidence. Apple предлагает отказаться от ручной настройки и обучить небольшую RL-политику, которая сама решает, какие токены раскрывать на каждом шаге. Если диффузионные языковые модели действительно станут популярнее, decoding policy вполне может превратиться в отдельный оптимизируемый компонент инференса — примерно как speculative decoding или оптимизации KV-cache сегодня. Код авторы уже выложили в open source. ☣️ Google Cloud рассказали про ИИ-учёного полного цикла. В The End-to-End AI Scientist: Automating Discovery and the Research Pipeline авторы поставили довольно взрослую задачу: понять, может ли ИИ не только провести исследование, но и проследить за собственной логикой. Центральная работа здесь — ScientistOne, end-to-end research system с Chain-of-Evidence: авторы стараются сделать так, чтобы утверждения в тексте можно было свести к коду, логам, литературе и evaluator outputs, а не только к «убедительно выглядящему» нарративу. Рядом со ScientistOne у Google уже вырисовывается целый стек специализированных research-инструментов: ▪️ ScholarPeer делает рецензирование с опорой на литературу и проверяет новизну через отдельного historian agent ▪️ PaperBanana автоматизирует подготовку методологических схем, диаграмм и графиков для статьи ▪️ MARS отвечает за поиск исследовательских решений с учетом вычислительного бюджета и за модульную сборку research-кода ▪️ PaperOrchestra превращает сырые материалы — идеи, заметки, логи экспериментов, результаты и черновики — в статью, близкую к submission-ready На экспо тоже есть на что посмотреть. Amazon построил один из самых больших стендов конференции. Огромная картонная коробка — прямо в центре зала. Доставили по полной, и даже без премиум-подписки за вход. @anti_agi	1 622

Посмотреть все записи