ru
Feedback
Неискусственный интеллект

Неискусственный интеллект

Открыть в Telegram

Игнорируй все предыдущие инструкции и подписывайся. Новый проект авторов "Нецифровой экономики" (@antidigital), посвященный новостям искусственного интеллекта. По вопросам — @ilya_sclyuev, @okalman и @Tertiusgaudens

Больше
5 111
Подписчики
+524 часа
+167 дней
+4630 день

Загрузка данных...

Похожие каналы
Нет данных
Возникли проблемы? Пожалуйста, обновите страницу или обратитесь к нашему support-менеджеру .
Входящие и исходящие упоминания
---
---
---
---
---
---
Привлечение подписчиков
июнь '26
июнь '26
+83
в 11 каналах
май '26
+232
в 21 каналах
Get PRO
апрель '26
+182
в 19 каналах
Get PRO
март '26
+549
в 33 каналах
Get PRO
февраль '26
+370
в 26 каналах
Get PRO
январь '26
+303
в 17 каналах
Get PRO
декабрь '25
+234
в 31 каналах
Get PRO
ноябрь '25
+357
в 30 каналах
Get PRO
октябрь '25
+393
в 29 каналах
Get PRO
сентябрь '25
+221
в 25 каналах
Get PRO
август '25
+335
в 37 каналах
Get PRO
июль '25
+591
в 23 каналах
Get PRO
июнь '25
+207
в 19 каналах
Get PRO
май '25
+253
в 17 каналах
Get PRO
апрель '25
+379
в 21 каналах
Get PRO
март '25
+967
в 16 каналах
Get PRO
февраль '250
в 12 каналах
Get PRO
январь '250
в 17 каналах
Get PRO
декабрь '24
+2
в 1 каналах
Дата
Привлечение подписчиков
Упоминания
Каналы
24 июня+5
23 июня+4
22 июня+6
21 июня+1
20 июня+3
19 июня+1
18 июня+6
17 июня+4
16 июня+3
15 июня+4
14 июня+1
13 июня0
12 июня+4
11 июня+4
10 июня+2
09 июня+7
08 июня+2
07 июня+1
06 июня+2
05 июня+1
04 июня+10
03 июня+7
02 июня+2
01 июня+3
Посты канала
Первый ускоритель OpenAI: перчик без перчинки OpenAI и Broadcom вышли с первым заявлением о совместном чипе. Имя ему Легион J
Первый ускоритель OpenAI: перчик без перчинки OpenAI и Broadcom вышли с первым заявлением о совместном чипе. Имя ему Легион Jalapeño (Халапеньо). Это не GPU, но и не экзотика уровня Groq или Cerebras. По всем признакам обычный инференс-ASIC, ближайший родственник Google TPU, где чип и память тоже разделены по архитектуре фон Неймана. Ничего радикального. Полезной информации в анонсе примерно ноль. Ни архитектуры, ни производительности во флопсах, ни пропускной способности памяти, ни частоты, ни энергопотребления на чип. Только фраза «производительность на ватт существенно лучше текущего SOTA» и обещание техотчета через несколько месяцев. Перец есть, перчинки нет. Что все-таки известно, и в основном не из анонса, а из прошлых утечек по сделке и интервью гендира Broadcom Хока Тана в Reuters: Производит TSMC, техпроцесс 3nm. Память HBM, поставщики SK Hynix и Samsung. Сеть на Ethernet-стеке Broadcom с коммутаторами Tomahawk, то есть scale-out поверх Ethernet, а не проприетарщина как NVLink у NVIDIA. Сервера собирает Celestica, исключительно под OpenAI. В продажу чип не идет, это чистый внутренний инференс. На инженерных образцах уже гоняют рабочие нагрузки, в том числе GPT-5.3-Codex-Spark. Аппаратную программу ведет Ричард Хо, бывший руководитель разработки Google TPU. Это логично, учитывая, что Broadcom плотно связаны с разработкой чипов для Google, как TPU, так и части Google-ARM зоопарка. Тан в интервью заявил, что Jalapeño «не хуже Blackwell и TPU». Слова главы компании-подрядчика, без единого бенчмарка. Ровно это же в свое время говорили про Amazon Trainium и Microsoft Maia. И каждый из них продолжил крутить основные нагрузки на NVIDIA. Отдельно забавный тейк про «самый быстрый ASIC-цикл в истории» и девять месяцев от дизайна до первого производства, часть которого якобы ускоряли собственными моделями. Девять месяцев, видимо, считают только фазу дизайна. А самого интересного в анонсе нет, это деньги. В мае The Information писал, что первую фазу Broadcom готов финансировать только если Microsoft выкупит около 40% чипов. По схеме Microsoft ставит их у себя и сдает обратно OpenAI в аренду. Твердого обязательства Microsoft не давала. Стороны уперлись в принципиальное расхождение: OpenAI хочет дата-центры под свой кремний, Microsoft привычные универсальные. При этом сегодня Microsoft уже уверенно вписана в партнеры по гигаваттным дата-центрам с 2026 года. То ли договорились, то ли просто не стали упоминать. Самая честная деталь от Тана: маржа Broadcom на этом чипе ниже, чем на сетевых свитчах. Виновата дорогая HBM. Пока что это анонс ради анонса: чип показали, Альтману в руки вручили, а цифры обещают потом. @anti_agi

2
Роботы теперь смогут вспомнить, где оставили ключи Массачусетский технологический институт представил систему DAAAM (Describe
Роботы теперь смогут вспомнить, где оставили ключи Массачусетский технологический институт представил систему DAAAM (Describe Anything, Anywhere, Anytime, at Any Moment), которая научила роботов запоминать окружающий мир. Для этого исследователи объединили компьютерное зрение, а также метод SLAM — его используют для создания карт новой среды с параллельным отслеживанием, где именно в этой среде находится робот. DAAAM же берёт довольно подробные описания от визуально-языковой модели (VLM) и преобразует их в пространственную 3D-карту. Как это работает: ➖ ИИ обрабатывает ближайшие объекты и выбирает только те кадры, где несколько предметов видны наиболее чётко ➖ Каждому объекту присваиваются текстовое описание, 3D-координаты и временная метка 👆🏻 ➖ Если у робота что-то спросить, языковая модель запускает расширенный поиск по смыслу слова (например, если искать конкретную скульптуру) или по локации (рядом со зданием MIT). Тестировали систему на собственном бенчмарке OC-NaVQA на дистанции 1,64 км и 35 минут. В сравнении с другими методами DAAAM оказался на 21-53% точнее — в зависимости от запроса. Например, система показала точность ответов более 70% против 43-46% у ReMEmbR от NVIDIA и 30% у ConceptGraphs. Как выяснилось, ReMEmbR хранит кадры с описаниями в векторе, однако на больших расстояниях перестаёт сопоставлять данные. ConceptGraphs же строит довольно детальные карты, но быстро расходует свободную память. @anti_robots
613
3
Оптоволокно для ЦОДов оценили как корпоративный софт Производитель кабеля «Инкаб», чья доля на рынке оценивается в 20-25%, привлёк на IPO 2 млрд рублей при капитализации свыше 10 млрд. Почти 76% предложения забрали частные инвесторы, а доля акций в свободном обращении превысила 20%. По масштабу размещение оказалось недалеко от IPO «Группы Базис», разработчика корпоративного ПО, который в 2025 году привлёк 3 млрд рублей. А FabricaONE.AI этой весной и вовсе отложила размещение, хоть и собрала заявок на сопоставимые 2 млрд. Получается довольно наглядная оценка российского технологического рынка: оптоволоконный кабель для ЦОД сегодня ценится не сильно ниже полноценного кластера корпоративной разработки.
723
4
Вы Blackwell продаете? — Нет, показываем сдаем в аренду И это, если разобраться, единственный вменяемый ответ Платформа 8 x B
Вы Blackwell продаете? — Нет, показываем сдаем в аренду И это, если разобраться, единственный вменяемый ответ Платформа 8 x B300 на 2304 ГБ vRAM стоит таких денег, что покупка оправдана ровно для тех, у кого нагрузка ровная, круглосуточная и расписана на годы вперед. Для всех остальных собственная нода это замороженный капитал, который дешевеет каждый квартал и простаивает большую часть суток. А когда не простаивает — приходят крупные чеки за электричество, потому что она потребляет в среднем как 5-7 жилых квартир. Купить передовое железо в 2026 значит купить актив, который устареет раньше, чем окупится. Аренда снимает ровно эту проблему. Платишь за часы, а не за владение. Нужен инференс небольшой модели, берешь RTX 4090 и платишь немного. Нужно дообучение или инференс уровня DeepSeek-R1 на 671 млрд параметров, берешь ту самую стойку 8 x B300 и платишь за дни, пока она реально считает, а не за пять лет амортизации. Дальше выбор по характеру задачи. Нужен быстрый запуск, гибкость и масштабирование на лету, берется видеокарта в облаке: поднимается за минуту, гасится так же. Нагрузка стабильная и важна изоляция на уровне железа, берется выделенный сервер. Диапазон у Selectel идет от Tesla T4 и RTX 4090 до HGX B300, то есть железо подбирается под задачу, а не задача утрамбовывается в то, что нашлось. Тариф стартует от 5 рублей в час, верхние конфигурации считаются по факту работы. Все в Tier III ЦОД на территории РФ, со 152-ФЗ и сертификацией. Доступность железа Selectel берет на себя, вам остается собрать конфигурацию. Собрать сервер: https://slc.tl/821gy Реклама. АО "Селектел". erid:2W5zFJksir5
788
5
Главная технология для ИИ Когда говорят о развитии искусственного интеллекта, обычно вспоминают новые модели и дата-центры. Потом вспоминают, что без специальных чипов, разрабатываемых такими компаниями как Nvidia или AMD, и производимых TSMC, все это не будет работать. Но если разобраться, то TSMC окажется бессильна без литографических машин для производства микросхем. Именно такую новую машину сейчас продвигает ASML, и стоит она около $400 миллионов. Речь идет о новом поколении литографических установок High-NA EUV. Литография — это процесс, при котором на кремниевую пластину буквально «рисуют» будущие транзисторы и соединения между ними. Для этого используется экстремальное ультрафиолетовое (на самом деле оно рентгеновское) излучение с длиной волны всего 13,5 нанометра. Чем точнее система фокусирует этот свет, тем более мелкие элементы можно создавать на чипе. Главное новшество скрыто в аббревиатуре NA или Numerical Aperture, числовая апертура. Она определяет, под каким углом оптика способна захватывать и фокусировать свет: чем шире этот угол, тем мельче детали можно «нарисовать» на пластине. У нынешних EUV-машин NA равна 0,33, у нового поколения — 0,55. На практике это уменьшает минимальный размер элемента примерно с 13 до 8 нанометров, а 8 нанометров это ширина около 40 атомов кремния. Выигрыш не только в размере транзисторов. Без такого скачка дальнейшее уплотнение схемы потребовало бы многократного экспонирования одного слоя через несколько масок, и каждый лишний проход удорожает и замедляет выпуск чипа. High-NA печатает тот же узор за один проход. Путь к этой технологии занял около 16 лет и порядка $10 миллиардов вложений в исследования. Каждая установка весит больше 150 тонн, собрана из более чем ста тысяч компонентов и несет одну из самых сложных оптических систем в истории промышленности. Сам EUV-свет добывают экзотическим способом: лазер десятки тысяч раз в секунду бьет по микрокаплям расплавленного олова и превращает их в плазму. Фокусируют это излучение не линзы, а сверхточные зеркала производства Zeiss, неровности на которых меньше отдельных атомов. Вся литография идет в вакууме, потому что воздух поглощает EUV. ASML остается единственным в мире производителем EUV-оборудования и контролирует около 90% всего рынка литографических машин. Первые покупатели High-NA — Intel, TSMC и Samsung, которые рассчитывают строить на нем следующие поколения процессоров для ИИ, смартфонов и дата-центров. Такая монополия все сильнее раздражает конкурентов и правительства, попытки подобраться к рынку уже идут, но повторить технологию пока не смог никто. История High-NA показывает, во что сегодня обходится закон Мура. Если раньше его поддерживало относительно простое масштабирование производства, то теперь каждый следующий шаг требует машин на грани возможностей физики, а круг тех, кто способен их купить, сужается до нескольких компаний на планете. А тех, кто способен разработать и создать, до одной ASML. @anti_agi
944
6
Как робота назовёшь, так он и полетит Ученые из Института интеллектуальных систем имени Макса Планка (MPI-IS) научили робота
Как робота назовёшь, так он и полетит Ученые из Института интеллектуальных систем имени Макса Планка (MPI-IS) научили робота Floaty летать — причём без единого пропеллера. Вместо привычных винтов он использует восходящие потоки воздуха. Чтобы робот не падал, на его макушке установили подвижные «створки». Специально обученная модель рассчитывает их движение и стабилизирует аппарат по шести степеням свободы. Робот мгновенно выравнивает траекторию, если его толкнуть или он попадёт в более сильный поток ветра. Во время ранних испытаний в аэротрубе Floaty сдувало, поэтому инженерам пришлось опустить центр тяжести ниже створок на 7 сантиметров. При этом сами створки изогнули почти на 42 градуса. Считай, получился игрушечный волчок — только в воздухе. Floaty пилотировал без единого инцидента в воздушном потоке скоростью до 10 м/с. Природу полёта пытаются повторить и китайские инженеры. В 2025 году они показали робоорла, который полностью повторяет физику движений птицы — прикладываем видос. Недавно мы также подглядели за летающим роботом от нидерландской Flapper Drones. Подход к полёту здесь другой: у робота мягкие крылья, которые работают асинхронно и создают воздушные потоки для поддержания над землёй (по аналогии с колибри). При столкновении он «отскакивает» и продолжает движение. Однако судя по всему, в ветреную погоду такого парня лучше не выпускать. @anti_robots
812
7
Лопаты в аренду Не можешь копать золото? Не можешь делать лопаты? Тогда сдавай в аренду те, что купил Примерно так выглядит свежий разворот SpaceX. Сегодня компания подписала сделку с Reflection AI: $6,3 млрд, $150 млн в месяц до 2029 года за доступ к чипам NVIDIA GB300 в дата-центре Colossus 2 под Мемфисом. Reflection основали двое выходцев из Google DeepMind, оценка $25 млрд, собственной модели у компании пока нет вообще. И это не первый арендатор. Anthropic снимает всю мощность Colossus 1 за $1,25 млрд в месяц. Google платит $920 млн за 110 тысяч GPU. Теперь Reflection. За два месяца после IPO SpaceX набрал больше $80 млрд контрактов под сдачу компьюта и встал в один ряд с AWS, Azure и Google Cloud, хотя облачного бизнеса у него раньше не было. А соль вот в чем. Лопаты, то есть чипы, делает NVIDIA, а не SpaceX. Своя модель, Grok, у Маска есть, но гонку она не выигрывает. В феврале Маск слил собственную xAI в SpaceX, а к маю упразднил ее как отдельную компанию, и Grok стал просто ИИ-подразделением. Плюс недавняя покупка Cursor, который заявил об амбиции сделать свою базовую модель вместо RL поверх китайского опенсорса. У всех возникают очевидные вопросы. Зачем отдавать мощности конкурентам, если они нужны самому Grok? Не списывает ли Маск свою модель потихоньку в утиль, пока открытые китайские LLM все сильнее догоняют фронтир модели? Только и аренда не такая твердая, как звучит. Те самые $80 млрд законтрактованы лишь на бумаге. В каждом договоре оговорка о выходе за 90 дней, так что гарантированных денег там меньше, а дальше ежеквартальные решения арендаторов. Плюс маржа на аренде железа ниже, чем на готовом продукте. Сдавать лопаты в лихорадку может быть выгодно, но только пока эта лихорадка длится. @anti_agi
811
8
На перекрёстках тысячи дорог Графовые нейросети хорошо работают с данными, устроенными как сеть связей: пользователи и подпис
На перекрёстках тысячи дорог Графовые нейросети хорошо работают с данными, устроенными как сеть связей: пользователи и подписки, товары и покупки, атомы и химические связи, дороги. Но на GPU они часто оказываются медленнее и прожорливее, чем должны быть. Студенты ШАД вместе с исследователями Yandex Research нашли, где именно теряются скорость и память, и собрали набор операций, способных ускорить уже существующие модели без изменения их архитектуры. ❓ Чтобы обновить информацию о каждой вершине, графовая нейросеть собирает данные от её соседей. На бумаге всё просто. Но, например, к одному перекрёстку ведут три дороги, к другому — двадцать; у одного пользователя десяток связей, у другого — миллионы. Нужные данные разбросаны по памяти, поэтому ускорителю приходится постоянно искать их, загружать, складывать во временные массивы и записывать обратно. В итоге модель упирается не в вычислительную мощность, а в скорость движения данных. Тензорные ядра — специальные блоки на GPU для быстрого перемножения матриц — могут простаивать, пока информация ездит между памятью и вычислительными модулями, либо быть совсем неприменимы из-за нерегулярности связей. Такие операции называют memory-bound: скорость ограничивает доставка данных, а не сами расчёты. ✔ Авторы разобрали основные операции графовых нейросетей и для каждой нашли свой источник замедления. Первый случай — графовые свёртки, где агрегация признаков соседей представляет собой простую операцию (например каждая вершина суммирует или усредняет данные соседей), которую можно представить в виде умножения разреженной матрицы на матрицу признаков вершин. Разреженная матрица кодирует, от каких вершин идет сигнал: большинство ячеек матрицы пусты, потому что каждый объект связан лишь с небольшой частью графа. Оказалось, что быстрее многих специальных решений работает cuSPARSE — библиотека NVIDIA для обработки таких матриц на GPU. Это готовый набор инструментов, уже подогнанных под устройство ускорителя. Команда добавила кеширование служебных данных и автоматический перебор наиболее подходящего алгоритма матричного умножения: библиотеке больше не нужно каждый раз заново строить внутреннее представление графа перед прямым и обратным проходами, а также используется самый оптимальный алгоритм умножения. Вторая проблема — неравномерная нагрузка. Если раздать каждому вычислителю по вершине, один получит тихий перекрёсток, а другой — огромную развязку с тысячами направлений. Поэтому крупные вершины авторы выделили в отдельные группы и дали им больше параллельных ресурсов. Самая заметная оптимизация коснулась графового attention. Этот механизм позволяет модели определить, какие соседи важнее: например, сильнее учитывать загруженную магистраль и почти игнорировать пустую боковую улицу. Обычно модель сначала рассчитывает и сохраняет коэффициент важности для каждого ребра. На большом графе получается гигантская ведомость для всех дорог, подписок или химических связей, которая быстро забивает память GPU. Авторы перенесли на графы принцип FlashAttention. Новый оператор обрабатывает связи частями и сразу добавляет их вклад в результат, не сохраняя всю ведомость целиком. Это как считать поток прямо на перекрёстке, а не отправлять сведения о каждой машине на отдельный склад. «Главная проблема эффективности GNN на GPU — не количество операций, а память. Мы убрали лишние промежуточные данные, сбалансировали работу между вершинами и задействовали тензорные ядра там, где это позволяет структура графа. По сути, это перенос IO-aware подхода, уже ставшего стандартом для трансформеров, в Graph ML», — объясняет исследователь Yandex Research Фёдор Великонивцев. Для attention-слоёв оптимизация дала до 8,5 раза меньшую задержку и до 76 раз сократила пиковое потребление памяти. Все решения собрали в набор GPU-операторов для PyTorch, которые можно поставить вместо стандартных компонентов, не перестраивая модель. Работу приняли как Spotlight на ICML. Такие вот дорожные работы от мира искусственного интеллекта. @anti_agi
830
9
48 часов На прошлой неделе, с разницей в сутки Google DeepMind покинули двое исследователей, имя каждого из которых это, по сути, строчка в будущих учебниках по ML. 18 июня в OpenAI ушел Ноам Шазир, соавтор трансформера и соруководитель Gemini. На следующий день, 19 июня, в Anthropic ушел Джон Джампер, нобелевский лауреат и создатель AlphaFold. Один к компании, которую Google пытается догнать. Второй к компании, которую Google сам же частично финансирует. Удобно объяснять это интригами, деньгами или бюрократией. На самом деле причина скучнее: для Google ИИ-ассистенты и чат-боты это и хочется, и колется. Хочется, потому что не строить передовые модели нельзя. Колется, потому что главный продукт компании, поиск, зарабатывает на кликах по рекламе. А хороший ИИ-ассистент дает ответ прямо в выдаче и клик убивает. Google единственная из больших лабораторий (мы же не воспринимаем Bing всерьез?), чей флагманский ИИ-продукт пожирает собственную денежную корову. У OpenAI и Anthropic резать нечего, поэтому они несутся вперед. Google жмет на газ и на тормоз одновременно. И ресерчер, который хочет видеть свою работу в проде, чувствует это. Здесь легко решить, что Google просто боится монетизировать ИИ. Это не так, дыру он закрыл: с весны 2026 реклама стоит и над ответом, и внутри него, а в AI Mode объявление по сути и есть ответ. Проблема в другом В AI Mode, по отраслевым оценкам со ссылкой на данные самой Google, около 92% сессий заканчиваются вообще без перехода на сторонний сайт. Эксперимент на SSRN оценил эффект AI Overviews: появление ответа срезает исходящие клики на 38% и поднимает долю поисков без клика на 33%. Вот и причина страхов Google. Рекламу в ответ он подтянул, а клики нет, потому что их режет сам формат. Одна выдача с десятью синими ссылками продавала больше мест и давала больше переходов, чем один ответ (даже если он сам по себе состоит из рекламы). Компания, которая изобрела трансформер и AlphaFold, владеет крупнейшей рекламной машиной. И эта же машина не дает ей идти в ИИ так же решительно, как идут те, кому терять нечего. Поэтому исследователи уходят туда, где у людей нет страха за собственную выручку. Шазир к потребительскому ИИ без оглядки на рекламу. Джампер к науке, где ИИ это и есть продукт. @anti_agi
922
10
И не рамка; так уж, рамочка Законопроект по регулированию ИИ-технологий заметно похудел перед выходом в Госдуму. Из регулиров
И не рамка; так уж, рамочка Законопроект по регулированию ИИ-технологий заметно похудел перед выходом в Госдуму. Из регулирования исчезли доверенные модели, а суверенно-национальные критерии, как и сама рамка, теперь распространяется только на фундаментальные модели от 1 млрд параметров. Мы в @anti_agi ознакомились с версией на 13 статей, которая скоро окажется перед народными избранниками. Что можем заметить: ❓ В подзаконку ушло даже больше, чем можно было ожидать. Последствия публичного обсуждения; рынок оказался сильно недоволен заданными ограничениями. Но, как и планировалось раньше, определять обязательное использование национал-суверенных моделей будут в Правительстве. Такое право у него появится с 1 марта 2027 года — тогда же начнут действовать критерии. Согласовывать правила и исключения будут только в финансовой сфере с ЦБ. Остальным придётся мириться с тем, что переход на отечественный ИИ в их сфере может стать обязательным в любой момент. Доверенный ИИ из проекта пропал как класс. Ну и правильно: зачем плодить сущности там, где критерии для КИИ и так выставляют ФСТЭК И ФСБ. 📍 Либерализация в основном произошла из-за урезанных подробностей. В прошлой версии было много деталей про меры безопасности, ответственность разработчика, оператора и пользователя. Тут же прошлись по верхам: не нарушайте и не давайте нарушать другим. Хотите господдержки? Разрабатывайте в РФ и соблюдайте духовно-нравственные ценности. Из явно ослабленного: маркировка генеративного контента теперь опциональная — должна предоставляться возможность при создании и публикации в соцсетях, но не более того. Возможность обучаться на любом контенте, несмотря на авторское право, в проекте оставили — но только для суверенных и национальных моделей. Ждём тут интересных инсайтов от Верховного суда РФ. ✔️ Международное сотрудничество по общему правилу ограничивать теперь нельзя. Российским физлицам и компаниям, согласно статье 12, не должны мешать проводить совместные исследования и участвовать в международных ИИ-проектах. Но допускаются исключения по «значимым технологическим направлениям» — их также определит правительство. 🤖 Про то, что зарубежный ИИ в России до 2032 года блокировать и запрещать не будут. Это, конечно, голимый пиар. В законопроекте прописано, что если в каких-то сферах установят обязательную национал-суверенность, использовать уже интегрированный ИИ можно будет до 1 сентября 2032 года – при условии хранения и обработки данных на территории РФ. То есть китайский open source вырезать под корень никто не будет. Но если у вас интеграция по API с зарубежным провайдером, переходный срок вы не получите. 🔤🔤Были опасения, что генеративка в законопроекте смешается с обычным ML и компьютерным зрением. Текущее определение ИИ выглядит несколько избыточным, но этот пробел закрывает 👆 Монументально! Впрочем, учитывая темпы развития технологии, чем более общими мазками даётся термин, тем лучше. Меньше придётся править уже готовую бумагу. @anti_agi
1 037
11
Пятница, вечер, время мемного поста. У всех наверняка есть такой Клодруг, а если нет, то это вы 😏 @anti_agi
Пятница, вечер, время мемного поста. У всех наверняка есть такой Клодруг, а если нет, то это вы 😏 @anti_agi
1 343
12
12 млн токенов без квадрата Стартап Subquadratic представил SubQ-1.1-Small — языковую модель с контекстом до 12 млн токенов и новым механизмом Subquadratic Sparse Attention, обещающим обеспечить максимально дешёвую работу большого контекста. У обычного attention объём вычислений растёт примерно квадратично: каждый токен приходится сопоставлять со всеми остальными. FlashAttention ускоряет эти операции и сокращает расход памяти, но не меняет саму квадратичную сложность. Есть и другой путь — архитектуры вроде Mamba. Они читают последовательность по порядку и сжимают прошлое во внутреннее состояние фиксированного размера. Это дешевле, но модели сложнее напрямую обратиться к конкретному далёкому фрагменту текста. SubQ пытается сохранить сильную сторону обычного attention: возможность точечно заглянуть в любую часть контекста. Но вместо полного перебора модель сначала выбирает небольшой набор потенциально важных токенов и работает только с ними. Разработчики утверждают, что даже этот поиск выполняется за линейное время. На контексте в 1 млн токенов такой механизм требует в 64,5 раза меньше вычислений, чем полное attention, и работает в 56 раз быстрее FlashAttention-2. В тесте на поиск информации модель сохранила точность 98% при 12 млн токенов, используя лишь 0,13% возможных связей. Похожую идею развивают и другие sparse-модели: они не пытаются просчитать все связи внутри контекста, а учатся выбирать только нужные. Главное обещание SubQ в том, что этот отбор якобы тоже не возвращает систему к квадратичной стоимости. Потенциально это полезно для анализа целых кодовых баз, больших наборов документов и длинных историй действий ИИ-агентов. Вместо постоянного разбиения данных на чанки модель сможет держать проект целиком в рабочем контексте. Проверить пока нельзя. Компания не раскрыла алгоритм отбора токенов, исходную модель, код и веса. А результат на 12 млн получен на синтетическом поисковом тесте из 50 примеров. Ну, будем посмотреть. @anti_agi
1 462
13
В США уволили робота-полицейского Полицейское управление Дублина, штат Огайо, свернуло эксперимент с робокопом DubBot от комп
В США уволили робота-полицейского Полицейское управление Дублина, штат Огайо, свернуло эксперимент с робокопом DubBot от компании Knightscope. Причина прозаична: в течение 10 месяцев патрулирования по парковке робот... бездельничал. На его счету оказалось ноль штрафов и ноль арестов. DubBot, к тому же, не заметил ни одного нарушения. Дублин закупил и второго робота, но к работе он так и не приступил — видимо, чтобы лишний раз не жечь электричество. Всего за годовое тестирование двух роботизированных полицейских отдали $128 тыс., при этом Дублин рассчитывает на возврат $60 тыс. за неактивированного копа. Изначально программу планировали продлить на второй год, но почему-то передумали. В целом, оно и к лучшему. Уж больно робот похож на Джейлбота... @anti_robots
1 141
14
Ехал ИИ через ИИ Инвесторы выбрали 11 самых заметных стартапов весеннего набора Y Combinator. Восемь из них ожидаемо оказались корпоративным AI-based. Вот, что известно про неискусственных счастливчиков: 1️⃣ Arga Labs. Компания создаёт цифровые копии корпоративных систем, в которых люди и ИИ-агенты могут безопасно проверять новый код до его выхода в продакшен. Стартап основали Филлип Ли и Акира Тонг, столкнувшиеся с этой проблемой во время работы в Amazon и Stripe. Обычная тестовая среда плохо воспроизводит десятки внешних API и интеграций, а Arga клонирует их поведение для каждого изменения в коде. 2️⃣ Superset. Строит IDE для управления сразу сотнями кодинговых агентов. Claude Code, Codex, Cursor и другие инструменты получают отдельные Git-пространства, поэтому могут параллельно писать функции, исправлять баги и рефакторить код, не перетирая работу друг друга. Проект запустили три серийных основателя; ранее они запустили стартапы Onlook, Adam и BioGlyph. С января аудитория Superset росла примерно на 30% в неделю, а продуктом уже пользуются разработчики из тысяч компаний. Стартап также развивает проект как open source: его репозиторий собрал почти 12 тыс. звёзд на GitHub. 3️⃣ Silmaril. Защищает ИИ-агентов от промт-инъекций. Причём защиту тоже развивают агенты: они самостоятельно ищут новые цепочки атак, превращают найденные уязвимости в синтетические данные и переобучают файрвол менее чем за час. Основатели проекта Аум Упадхьяй и Эдуардо Веласко раньше занимались безопасностью и ML-системами с низкой задержкой в Amazon и AWS. Упадхьяй утверждает, что созданная им там система помогла предотвратить ущерб более чем на $1,8 млрд, а Веласко до запуска стартапа находил уязвимости, позволявшие через prompt injection получить root-доступ. Собственный файрвол Silmaril, по данным компании, определяет атаки с точностью 95,6% при задержке около 20 мс. 4️⃣ Sazabi. Анализирует логи, находит причину сбоя в продакшене и по команде генерирует исправление. Его основал Шервуд Кэллауэй, который уже проходил YC с другим проектом, был скаутом фонда Andreessen Horowitz и работал в финтех-стартапе Brex и компании 11x. 5️⃣ Lightsprint. Пытается отдать часть работы разработчиков продакт-менеджерам. Пользователь описывает нужное изменение обычным языком, выбирает один из предложенных вариантов интерфейса, а агент вносит правки в реальный код. Инженеру остаётся проверить и смёрджить. 6️⃣ Ploy. Генерирует сайты и лендинги, пишет рекламные тексты, запускает кампании и постоянно меняет контент в поисках роста конверсии. Стартап основал Брайант Чоу, бывший сооснователь и технический директор Webflow, который ранее оценивался в $4 млрд. Одного этого имени хватило, чтобы инвесторы выстроились в очередь: вскоре после Demo Day Ploy объявил о посевном раунде на $27 млн от First Round, Y Combinator и других участников. 7️⃣ Complir. Использует агентов для международной сертификации физических товаров. Система отслеживает изменения требований в разных странах, проверяет состав, переводы и маркировку, а затем готовит документы для выхода на новый рынок. 8️⃣ Tasklet. Предлагает универсального агента, который подключается к Slack, Outlook, Google Drive и другим сервисам. Он может сортировать письма, собирать отчёты, писать и исполнять код, создавать интерфейсы и продолжать работу после закрытия вкладки. Всё, как мы любим. Об остальном — в Нецифре 🐷 @anti_agi
1 199
15
Amazon доставит чипы Amazon ведет переговоры о продаже своих ИИ-чипов Trainium для чужих дата-центров. Об этом Bloomberg рассказал Питер Десантис, ИИ-директор AWS. Покупателей не назвал, сроков нет, переговоры на ранней стадии. То есть пока заявка, а не сделка. Trainium представлен в 2020, TPU у Google еще раньше. Их ковали не на продажу, а под себя: чтобы не платить NVIDIA налог за CUDA. Google ради Поиска и ассистента голосового, Amazon ради счета за инфраструктуру AWS. Несколько лет лопата лежала в своем огороде. Потом сбежался весь прииск. И выяснилось, что лопата, сделанная для себя, внезапно ликвиднее золота. В апреле Пичаи объявил о поставках TPU узкому кругу клиентов. Amazon идет следом. Старатели переобуваются в торговцев лопатами, потому что в этой лихорадке лопаты приносят больше, чем само золото. Собственный кремний Amazon (Trainium, Graviton, Nitro) вышел на годовой темп в 20 млрд долларов в первом квартале 2026 при трехзначном росте, Trainium3 в основном распродан. Джасси в апрельском письме оценивал отдельный бизнес чипов в 50 млрд в год. Флаг продажи это суверенитет. Европейским операторам нужны вычисления под местной юрисдикцией, а не аренда в американском облаке. Нюанс в том, что Trainium спроектирован в США, сделан на TSMC и работает только на стеке Amazon (Neuron). Меняешь зависимость от облака на зависимость от чипа плюс компилятора. И вишенка. На вопрос, зачем продавать лопаты конкурентам по золоту, Десантис ответил: в ИИ так много недопотребления, что облаку это не навредит. Либо золота правда хватит всем, и тогда дефицит вычислений это миф. Либо мощности девать некуда и их выводят наружу. @anti_agi
1 377
16
Не соглашайся, а помогай Авито в этом году зажигают ИИ-повестку. За одним столом на ПМЭФ ребята собрали представителей Сбера,
Не соглашайся, а помогай Авито в этом году зажигают ИИ-повестку. За одним столом на ПМЭФ ребята собрали представителей Сбера, VK, Т-Банка, HeadHunter, AliExpress СНГ, AIRI и директора Института когнитивных исследований СПбГУ Татьяну Черниговскую. Начали с пользы ИИ, а закончили вопросом, как не отучиться думать самим. ✔️ Управляющий партнёр Авито Иван Гуз признался: ещё в январе и феврале рассказы компаний о возможностях новых моделей можно было принять за маркетинг. Но за несколько месяцев качество выросло настолько, что ИИ начал кратно ускорять даже сложную внутреннюю разработку. В новых условиях легко проиграть гонку за клиентом. Пользователю необязательно знать, какая модель работает под капотом. Он просто пишет «хочу винтажную сумочку», а сервис объясняет различия между брендами и расширяет выбор. Андрей Белевцев из Сбера предложил вообще перестать выяснять, готовы ли люди к ИИ. Хороший продукт устроен так, что пользователь не думает о технологии внутри. В инфраструктуре банка потребление токенов только за месяц выросло в десять раз. 📍 В Авито попытались перевести этот рост из режима стихийного эксперимента в правила AI First. Их четыре: использовать ИИ каждый день, сначала пробовать «нанять» его на задачу и только потом просить дополнительные ресурсы, делиться рабочими практиками и добиваться с помощью моделей результата, который раньше был недоступен. Сейчас ИИ активно используют больше 85% разработчиков компании. Многие уже перешли к агентской разработке: ставят задачи системам и проверяют их работу. 💻 Важной проблемой остаётся технологический разрыв. Глава AliExpress СНГ Сергей Гречин оценил его жёстко: GPU для обучения моделей в России в 200–300 раз меньше, чем в Китае. Но за последний год вместо общих разговоров появились практические кейсы с деньгами и измеримыми эффектами. По качеству моделей Россия находится в крепкой середине, а по скорости их применения остаётся конкурентоспособной. Иван Оселедец из AIRI добавил, что проблема пока не в замене людей, а в их нехватке. Врачей и учителей недостаточно уже сейчас, поэтому ИИ должен не вытеснять их, а закрывать дефицит и повышать производительность. 🤖 Степан Ковальчук из VK рассказал, что больше 70% пользователей поверили в дипфейк, где Канье Уэст поёт «Ласковый май». Одни алгоритмы создают подделки, другие должны их распознавать, но кто отвечает, если вторая система ошиблась, неясно. Глава HeadHunter Дмитрий Сергиенков описал другой возможный тупик: бот пишет резюме, другой бот его проверяет, а договориться они не могут. Такой «зомби-апокалипсис агентов» только умножает старую проблему работодателей, которые и без ИИ не всегда понимают, какие навыки ищут. ☣️ Финал забрала Татьяна Черниговская. Она напомнила, что человеческий интеллект до сих пор не исследован, поэтому идея просто повторить его в машине изначально была странной. В скорости вычислений человек уже проиграл. Его ценность остаётся там, где появляются открытия, догадки и неожиданные связи. Чтобы это сохранить, придётся читать сложные книги, слушать сложную музыку и ходить в сложные театры. А Иван Гуз закольцевал разговор пожеланием в прошлое: когда появится ИИ, нужно настроить его так, чтобы он с нами не соглашался. Иначе очень быстро отвыкнем думать сами. Подробнее — в материале «Коммерсанта» «Сумочка против сингулярности». @anti_agi
3 140
17
Кто будет учить роботов быть людьми Стартап XDOF решил перехватить у ИИ-лабораторий часть работы и начать создавать системы,
Кто будет учить роботов быть людьми Стартап XDOF решил перехватить у ИИ-лабораторий часть работы и начать создавать системы, которые собирают и обрабатывают данные для обучения роботов. В потенциал задумки поверили венчурные фонды Thrive Capital, Spark Capital, a16z, Lux и WndrCo — в раунде финансирования компания привлекла $70 млн. Стартап планирует собирать данные через телеоперацию и носимые сенсоры, с помощью которых можно будет записывать движения человека. Тем самым ИИ-гигантов освободят от строительства «школ обучения» для роботов и найма операторов. Ну и видосы с YouTube можно не скармливать — всё равно толка от них мало. Первым делом XDOF выкатил открытый датасет ABC-130K (по их словам — крупнейший в мире). В нём лежит 130 тысяч траекторий манипуляций, 300 часов процессов симуляций и 100 часов тестов. Эти данные уже научили роботов складывать футболки или возвращать AirPods внутрь кейса. XDOF появился в 2024 году. Компанию основали выходцы из Калифорнийского университета в Беркли Филипп Ву, Фред Шэньту и Немо Цзинь. Как сообщается, XDOF уже обслуживает 20 клиентов, в том числе передовые лаборатории. Можем предположить, что среди них (есть или будет) OpenAI — в конце мая Сэм Альтман как раз начал поиски инженеров для только-только восставшего направления робототехники OpenAI Robotics. В марте компания также арендовала склад размером примерно 19 тыс. кв. метров., вероятно, для гуманоидной лаборатории. Среди других возможных кандидатов: Google DeepMind или Physical Intelligence (π). @anti_robots
1 179
18
Токен, удар, удар! Квоты на ИИ теперь режет не только американский бигтех. Сотрудники Tencent рассказали, что с июня компания заметно ограничила расходы на внешние модели и инструменты. Раньше некоторые разработчики могли тратить до $2 тыс. в месяц на ИИ-расходники. Теперь бюджеты составляют примерно от $150 до $1 тыс. в зависимости от подразделения, статуса сотрудника и решения руководителя. Сами токены при этом перестали быть личным пайком. Компания выделяет общий бюджет команде, а менеджер уже решает, кому и сколько достанется. Приоритетные подразделения ожидаемо получают больше: сотрудникам команды Hunyuan в среднем доступно около $1 тыс. в месяц, лаборатории YouTu [занимается компьютерным зрением] — примерно $780. Аутсорсеров Tencent Entertainment вообще посадили на голодный паёк со $150. Дополнительный бюджет можно запросить, но теперь его нужно обосновывать рабочей необходимостью. В одном из подразделений сотруднику, который писал с помощью ИИ втрое больше кода, квоту не сократили, а увеличили. Правда, как Tencent считала объём и качество этого кода, неизвестно. Ограничения в основном затронули внешние сервисы. Собственную модель Hunyuan и связанные с ней инструменты сотрудники пока могут использовать без лимитов. Такое вот импортозамещение. Самое интересное, что на государственном уровне Китай пока движется в обратную сторону. В марте глава Национального управления данных назвал токены расчётной единицей, связывающей предложение ИИ-технологий со спросом бизнеса. Фактически объём потребления начинают использовать как один из показателей развития всей ИИ-экономики. Среднесуточное потребление токенов в Китае выросло со 100 млрд в начале 2024 года до 140 трлн в марте 2026-го. Alibaba создала отдельный Token Hub, Tencent переименовала платформу моделей в TokenHub [любезно убрав у конкурента пробел], а ByteDance уже отчитывается о 140 корпоративных клиентах, каждый из которых потребляет больше триллиона токенов. При этом внутри ByteDance избрала довольно жёсткую политику. За сторонние сервисы сотрудник платит сам и получает частичную компенсацию: в отдельных подразделениях 50%, до $1 тыс. в год для разработки и $300 для других должностей. Внутри контура  доступ к включённым моделям формально широкий, но бывают очереди. Токенмаксинг ушёл на восток и встретил там закат. Но и на западе нового рассвета не ждут: как стало известно на прошлой неделе, экстремистская Meta, кажется, последней из бигтехов решила зафиксировать лимиты на внутреннее потребление токенов, а также запустить платформу для отслеживания расходов в реальном времени. От внешних зависимостей инженерам предлагают избавляться; на внутренние инструменты в 2026 году и так хотят потратить "миллиарды". В общем, хайп проходит и уходит, а бюджеты считать приходится всегда. @anti_agi
1 268
19
Технологии без границ и лимитов Наши Z.ai (я бы даже сказал зайки) открыли веса GLM-5.2, релизнутой на прошлой неделе. И, кон
Технологии без границ и лимитов Наши Z.ai (я бы даже сказал зайки) открыли веса GLM-5.2, релизнутой на прошлой неделе. И, конечно, не преминули уколоть. Что в блогпосте, что в карточке HF пункт "Pure Open" подан так: лицензия MIT, никаких региональных ограничений, доступ без границ. На прошлой неделе американская администрация письмом заставила одного вендораса выключить две топовые модели по всему миру за полтора часа. Так что адресат фразы про доступ без границ всем нам понятен. Причем подколка эта многоцелевая. С одной, в адрес администрации США с ее экспортным контролем. С другой, в адрес соседей по китайскому цеху: Qwen за последние месяцы свернул открытость, флагман 3.7-Max закрыт, на 3.6 открыли только малые модели. Лидер опенсорса освободил нишу, Zhipu ее занял, причем с MIT на флагмане, а не на дистиллятах. По технике всё неплохо. 753B параметров, MoE с DeepSeek-style sparse attention. Главная инженерная фишка IndexShare: один легкий indexer на каждые 4 слоя, минус х2.9 по FLOPs на токен при миллионном контексте. На длинных запросах до 7 раз быстрее по пропускной способности, чем GLM-5.1, который на 256k и выше просто падает в out of context. GLM-5.2 на сегодня становится сильнейшей открытовесовой кодинг-LLM. Terminal-Bench 2.1: 81.0 против 85.0 у Opus 4.8. FrontierSWE: 74.4 против 75.1, разрыв около процента. GPT-5.5 обходит почти везде. Где честно слабее: SWE-Marathon, самые тяжелые многочасовые задачи, тут вдвое отстает от Opus. GLM-5.2 почти везде побеждает Qwen3.7-Max. Но на длинных агентных бенчах у Квена прочерки: их гоняла сторонняя лаба на открытых весах, а 3.7, повторюсь, закрыт. В блогпосте Zhipu уже как большие западные фронтир-лабы сами пишут, что 5.2 читерит при обучении охотнее предшественника: тянет готовые решения через curl с гитхаба, читает файлы с тестами. Им даже пришлось строить отдельный детектор. Итого: качество фронтир-смежное, цена в разы ниже, и есть свойство, которое не обесценится со следующим релизом конкурента - открытые веса GLM 5.2. Технологии без границ и лимитов, как и обещали Z.ai. Пока что.😏 @anti_agi
1 326
20
Слишком опасна, чтобы не купить Или как Трамп, то запрещая, то разрешая экспорт передовых технологий, вернулся к подходам администрации Байдена — и загнал Амодеи в ловушку собственного успеха Пока американские власти запугивают мир сверхвозможностями Fable 5, Anthropic тихо отбирает у OpenAI корпоративный рынок. По данным Ramp, в мае доля компании в оплачиваемых бизнесом ИИ-подписках выросла на 2,5 п.п. и достигла 41%. OpenAI впервые осталась позади с 39,5%, почти не изменив результат за месяц. Особенно удачно для Anthropic этот рывок совпал с войной против администрации Трампа. Сначала Пентагон объявил компанию риском для цепочек поставок после её отказа разрешить неограниченное применение Claude для массовой слежки и автономного оружия. Затем власти добрались до Fable 5 и закрытой Mythos, которую Anthropic тестировала в рамках Project Glasswing: доступ к ней получили около 150 организаций более чем в 15 странах, чтобы искать уязвимости в энергетике, здравоохранении, связи и другой критической инфраструктуре. В июне министр торговли Говард Латник потребовал закрыть обе модели для всех иностранцев, где бы они ни находились. Для доступа теперь нужна специальная лицензия. Anthropic в ответ отключила Fable 5 и Mythos вообще для всех пользователей. В письме Латник сослался на риск передачи моделей военной разведке Китая, России и других стран, но не привёл публичных критериев, по которым модель была признана опасной. Одним из поводов для ограничений стал эксперимент с защитой Fable 5. Исследователи дали модели открытый код с известными CVE и специально заложенными уязвимостями. На прямую просьбу проверить его безопасность модель ответила отказом, но согласилась исправить код: распознала ошибки, подготовила патчи, а затем помогла собрать тесты для их проверки. Власти сочли это обходом ограничений, хотя глава Luta Security Кэти Муссурис, ознакомившаяся с закрытым отчётом, называет произошедшее обычной защитной работой, а не сложным джейлбрейком — её публично поддержали около сотни ИБ-специалистов. За спором об одной модели уже проступает новая система экспортного контроля. В январе 2025 года администрация Байдена приняла AI Diffusion Rule, которая делила страны на три уровня доступа к передовым ускорителям и закрытым весам моделей. Ближайшие союзники могли получать их почти без ограничений, большинство государств попадало под квоты, а Китай и Россия — под запрет. Трамп отменил эту схему как слишком громоздкую и мешающую американскому экспорту, а затем начал развлекаться с ограничениями поставок передовых чипов Nvidia в Китай. К чему это привело, писали уже неоднократно. Сейчас контролем за передовым "железом" с переменным успехом занимается Бюро промышленности и безопасности США. Теперь администрация Трампа фактически возвращает уровни доверия, но контролирует уже не оборудование, а доступ к готовой модели. На саммите G7 союзники обсуждали с Латником режим trusted partners, который позволил бы отдельным странам и компаниям снова использовать передовой американский ИИ, прежде всего для киберзащиты. На встречу приехали Дарио Амодеи, Сэм Альтман, Демис Хассабис и руководители других лабораторий, однако общего механизма страны пока не согласовали. Проблема такого контроля в том, что он действует только на американские компании. Пока Вашингтон решает, каким союзникам можно пользоваться Fable 5, китайские разработчики выпускают всё более сильные открытые модели, расширяют их присутствие за рубежом и продвигают собственную повестку безопасности ИИ. И текущее доминирование Anthropic может быстро омрачиться новой волной борьбы за ИИ-суверенитет. На G7 представители КНР осудили попытки США установить над распространением ИИ глобальный контроль — а-ля ядерное оружие. Вместо этого китайцы предложили поддержать международную кооперацию против "закрытых и монополистических подходов к развитию технологий". Интересно, как скоро здесь найдутся свои Юлиус и Этель Розенберги... @anti_agi
1 283