Неискусственный интеллект
Відкрити в Telegram
Игнорируй все предыдущие инструкции и подписывайся. Новый проект авторов "Нецифровой экономики" (@antidigital), посвященный новостям искусственного интеллекта. По вопросам — @ilya_sclyuev, @okalman и @Tertiusgaudens
Показати більше5 087
Підписники
+124 години
+127 днів
+9030 день
Архів дописів
Бывший сооснователь xAI продает идею персонального ИИ за $5 миллиардов
Игорь Бабушкин, один из первых сооснователей xAI Илона Маска, официально запустил свой новый стартап River AI. До этого он успел поработать в OpenAI и Google DeepMind, так что резюме для прогрева инвесторов сбора денег получилось идеальным.
Концепция звучит максимально актуально, но размыто: разработка персональных цифровых агентов, которые обучаются на привычках пользователя и полностью ему подконтрольны. Вместо очередного корпоративного чат-бота вам предлагают личного дворецкого, который не сливает ваши данные на сторону. Что будет на самом деле — бабка надвое сказала 😏
🐷 Но самое интересное это, конечно, бабки. Бабушкин привлекает до миллиарда долларов при оценке в пять миллиардов. При этом River AI зарегистрировали в Неваде только в конце апреля. На данный момент у стартапа нет ни публичного продукта, ни выручки, ни даже внятного описания архитектуры.
Чтобы показать венчурным фондам серьезность намерений, основатель вкладывает сто миллионов собственных денег. В команду он уже активно переманивает бывших коллег из xAI и Tesla.
Запуск River AI происходит на фоне тотального исхода топов из компании Маска. Из двенадцати оригинальных сооснователей xAI к апрелю 2026 года не осталось ни одного. Сам Бабушкин покинул проект еще в августе 2025 года. А в феврале 2026 SpaceX вообще поглотил xAI в рамках подготовки к мега-IPO с оценкой в 1.25 триллиона долларов. Похоже, работать над глобальным доминированием под руководством Илона больше не так весело, как запускать свои проекты с оценкой в пять ярдов на старте.
Рыночек ИИ настолько перегрет, что идея персонального ассистента легко продается за пять миллиардов долларов еще до того, как написана первая строчка кода. Йет эназер стори, как инвесторы покупают не технологии, а строчку в резюме основателя.
@anti_agi
Repost from N/a
General Motors начнёт снабжать дата-центры для ИИ
Гонка за энергией для ИИ-инфраструктуры докатилась и до автопрома. General Motors анонсировал стратегию по производству систем накопления энергии (ESS), подхватив эстафету у Ford.
Совместно со стартапом Peak Energy компания начнёт создавать натрий-ионные батареи для энергосетей. Они дешевле, дольше живут и почти не перегреваются. GM стала первым автопроизводителем за пределами Китая, который заявил о планах по выпуску именно таких ячеек.
На разработку и вывод технологии в производство уже выделили $900 млн, а пилотный запуск намечается на 2028 год. Чтобы не терять время, General Motors будет производить литий-железо-фосфатные аккумуляторы (LFP) совместно с LG Energy Solution.
Почему не автомобильные аккумуляторы? В электрокарах критичен каждый грамм, поэтому там используют дорогие никель-кобальтовые составы. А вот для дата-центра ни размер, ни вес не имеют значения. В приоритете — низкая себестоимость и долговечность, ради которых отрасль и переходит на LFP и натрий-ионные батареи.
General Motors также направит около 10 тысяч отслуживших EV-аккумуляторов компании Redwood Materials (её основал выходец из Tesla). Из этих батарей создают накопители для локальных энергосистем. Например, такой проект мощностью 63 МВт·ч уже питает ИИ-дата-центр Crusoe в Неваде. Для собственного завода в Мичигане GM заказала у Redwood систему на 7,2 МВт·ч, а в будущем планирует оснастить такими решениями все свои предприятия.
Возможно, заход в ESS — несколько вынужденная мера. На фоне охлаждения рынка электрокаров и серьёзных убытков (у того же Ford из-за низкого спроса на EV чистый убыток составил $13 млрд к концу 2025 года) компании решили сменить профиль — лишь бы не простаивали заводы. При этом отдельную «дочку» Ford запустил только в мае 2026 года, а первые поставки батарей планируются на конец 2027-го. На развитие нового бизнеса компания перенаправила $2 млрд.
@antimobility
Математики объявили войну ИИ-хайпу
Более 150 ведущих мировых математиков опубликовали "Лейденскую декларацию". Суть: бигтехи превращают фундаментальную науку в (сюрприз-сюрприз) маркетинговый инструмент, и это нужно остановить.
Технологические гиганты и ИИ-лабы обожают анонсировать "прорывы" через пресс-релизы и блог-посты, в обход нормального научного рецензирования.
Математики прямо говорят политикам и инвесторам: не верьте хайпу. Проблема в том, что нейросети научились генерировать очень правдоподобные, но откровенно ошибочные доказательства. Отличить машинную галлюцинацию от реальной теоремы становится всё сложнее. Система экспертного рецензирования трещит по швам.
Отдельная боль: авторские права. ИИ-модели обучаются на гигантских массивах опубликованных работ, систематически нарушая лицензии и игнорируя авторство. Декларация требует: хотите использовать наши статьи для трейнинга, спрашивайте разрешения.
Документ выдвигает жесткие требования. ИИ не может быть автором. Вся ответственность за корректность формул и доказательств лежит исключительно на человеке. Использовал нейросеть, обязан сделать дисклеймер.
Отдельный пункт: этика. Математики напоминают, что их труд используется для создания систем массовой слежки, политманипуляций и военного ИИ. Ученые призывают коллег отказываться от партнерства с компаниями, чьи ценности противоречат научной этике.
Среди подписантов нет ноунеймов. В рабочей группе ученые из Колумбийского, Кэмбриджского, Оксфордского и других университетов. Люди, которые определяют повестку в мировой математике.
По сути, математическое сообщество пытается защитить себя (и нас) от булшита бигтехов. Есть реальный риск, что повестка исследований будет определяться не глубиной задач, а тем, насколько легко их можно автоматизировать, завернуть в красивый бложик, показать на встрече с инвесторами. Пока Уолл-стрит хеджирует риски на аренду GPU, математики хеджируют риски самой науки. И их страховка называется "не верьте хайпу".
@anti_agi
Пятилетку за два триллиона 🐷
Пекин готовит около 2 трлн юаней ($295 млрд) на ближайшие пять лет под национальную сеть дата-центров. Проект разрабатывает Госкомитет по развитию и реформам, главный орган экономического планирования КНР, наследник Госплана. Операторами большей части мощностей назначены госкомпании China Mobile и China Telecom. Требование по локализации жесткое: не менее 80% железа, включая ИИ-чипы, от местных поставщиков. Nvidia и AMD из госпроектов выдавливают. Платить собираются суверенным долгом и сверхдлинными спецоблигациями, связать все в единую сеть рассчитывают к 2028-30 году.
Любопытна не сумма, а ее адрес. Деньги потекут не к создателям моделей как таковым, а к тем, кто владеет вычислениями: операторам связи, производителям чипов, строителям дата-центров. Ставка на лопаты, а не на золотоискателей. Чистые модельные команды вроде MiniMax или Zhipu работают в минус ради общей задачи и прямой выгоды от плана не получают. А выигрывает вся обойма производителей железа: Huawei с Ascend, Cambricon, Moore Threads, Biren, плюс вертикально интегрированные облака вроде Alibaba с собственными чипами Zhenwu от T-Head.
С другой стороны, всё познается в сравнении: $295 млрд за пять лет это меньше, чем американские техногиганты (Microsoft, Amazon, Alphabet и др.) закладывают на ИИ за один 2026 год ($725+ млрд). Но модель другая. У американцев частный капитал гонится за мощностями, у Китая государство строит вычисления как общественную инфраструктуру и раздает к ней доступ.
Сама идея нацсети не новая, она прописана в пятилетке до 2030. Новизна в двух числах: $295 млрд и 80% локализации. Оговорка стандартная: план на ранней стадии, цифры и детали еще поплывут.
@anti_agi
Repost from N/a
Waymo оцифровал водителя
Waymo представил новую модель Reference Driver (ReD), которая работает как виртуальный краш-тест для поведения водителя. Модель имитирует его реакцию в критической ситуации, заранее просчитывая возможные сценарии и тем самым помогая избежать столкновений. Именно с этим «эталоном» сравнивают работу автопилота, чтобы убедиться в его безопасности.
Как это работает:
▪️ ReD исходит из того, что все вокруг едут по правилам, и меняет своё поведение, только когда замечает нарушение
▪️ Определяет, насколько близко опасность, по тому, как быстро объект перед глазами становится больше
▪️ Учитывает, что человеку нужно 0,2 секунды, чтобы убрать ногу с газа и нажать на тормоз.
Waymo собирается использовать ReD для оценки систем автономного вождения. Код модели уже лежит в открытом доступе. Это, кстати, не первый опыт Waymo в «оцифровке» реакции. Ранее для внутренних тестов компания использовала модель NIEON (Non-Impaired with Eyes ON the conflict), однако этот виртуальный водитель был ну слишком внимательным. Он не уставал и всегда был идеально сосредоточен на дороге, что не совсем отражало состояние реального человека.
Аналогичные разработки ведут компании Nuro и Aurora. Nuro с помощью концепции Fractional Collisions просчитывает даже гипотетические риски и тем самым снижает их на 62%. А вот Aurora сразу готовит автопилот к худшему — для этого воссоздаются реальные смертельные ДТП, которых удалось бы избежать.
@antimobility
Нет, мы конечно ждали продолжение, но что в итоге его выпустит не Питер Молиньё... Амодеи натурально покусился на святое.
Впрочем, играть в бога им обоим не впервой...)
@anti_agi
Repost from N/a
Гуманоид учится выживать в дикой природе
Пока мы привыкаем к роботам на складах и в доставке, команда энтузиастов отправила роботизированного альпиниста на вершину вулкана Чимборазо — самой удалённой точки от центра Земли. Этот подвиг совершил Unitree G1 по имени Пемба. Путь самурая занял 16 часов: робот шёл автономно на участках с уклоном до 30 градусов, а на более крутых склонах его несла команда.
Инженеры разработали специальную систему вентиляции в куртке робота, которая защищала его от экстремальных перепадов температур. Ранее этот же G1 побывал на Алтае, где выдержал температуру около -50 градусов.
Восхождение стало первым этапом проекта «Тройная корона». В конце 2026 года Пемба отправится покорять Мауна-Кеа на Гавайях, а в 2027 году заберётся на Эверест. Что интересно, в Непале нет никаких законов о развёртывании робототехники на Эвересте, и команде приходится работать с властями, чтобы «расчистить» гору для подъёма.
По словам руководителя проекта Пабло Берланга Боэмаре, 97% поверхности Земли недоступно для колёсных и гусеничных платформ, а проводить исследования в некоторых местах для человека попросту опасно — здесь помогут именно роботы-гуманоиды. Пока Пемба единственный в своём роде, хоть насколько-то приблизившийся к Эвересту. Но не первый робот на высоте: с 2024 года на горе Тайшань (Китай) роботы-собаки убирают мусор, который оставляют туристы.
@anti_robots
Неискусственная вещь в себе
Или как Яндекс сделал свои первые наушники с Алисой. Коллеги из @antidigital уже написали свой обзор, но так как Нецифра едина во многих лицах — дополним от себя.
Искренне радует, что компания не стала изобретать велосипед, и первым устройством не стал какой-нибудь кулон — при всём стиле Цукерберга, AI-native устройство, бесполезное без того самого эйайя, успеха на рынке бы не возымело.
Сам гаджет за свою цену в 9к деревянных вышел интересным. Меломанов, конечно, не впечатлит, но звук и шумодав неплох. Фишки Алисы — работают. Пишешь заметки на ходу, правишь события в календаре, узнаёшь интересные факты об окружающей обстановке. Переключаешь музыку, не поднимая рук!
Но без нюансов конечно не обошлось. Во-первых, жёсткая привязка к телефону и интернету. Даже если подключить устройство к ноутбуку, почти весь функционал скажет пока-пока. Офлайн должна вызываться Алиса и срабатывать быстрые команды на то же управление музыкой. Но в наших тестах при потере сигнала управление при вызове через Алису тоже пропадало.
Набор экосистемных фишек пока базовый — можно управлять умным домом, но нельзя узнать, когда приедет такси, например. Про это говорят и наши коллеги из других медиа. Но, учитывая, что мы тестировали раннюю прошивку, это можно простить — возможности явно будут добавляться. Потенциала для интеграций у Яндекса хватает.
Ждём расширения линейки за счёт условной Про-модели и экспериментов с форм-фактором. Ну и невзначай напомним, что уже в скором времени ожидается выход первого ИИ-диктофона с Алисой — интересно, как там забалансируют фишки с памятью и синхронизацию с экосистемой Яндекс 360.
@anti_agi
Уолл-стрит готовится хеджировать ИИ
Goldman Sachs и JPMorgan Chase изучают возможность торговли фьючерсами на аренду GPU. Биржи планируют запустить их уже в этом году, если одобрят регуляторы.
Сегодня в ИИ-дата-центры и чипы вкладываются сотни миллиардов, и банки хотят защититься от риска перепроизводства вычислительных мощностей. Если предложение GPU резко превысит спрос, цены на аренду могут упасть, что ударит по кредитам, лизинговым программам и залогам, связанным с ИИ-инфраструктурой. Все хотят иметь страховку на случай такого негативного сценария.
Вокруг вычислительных мощностей сейчас формируется полноценный финансовый рынок. Биржи, поставщики данных и трейдинговые компании пытаются сделать стоимость аренды GPU такой же стандартной и прозрачной, как цены на нефть, газ или электроэнергию. Цель — создать единый рыночный ориентир, который можно отслеживать и хеджировать.
Два крупнейших оператора срочного рынка США — CME Group и Intercontinental Exchange — уже объявили о планах запустить фьючерсы на вычислительные мощности до конца года после одобрения CFTC. А стартап Architect Financial Technologies строит специализированную биржу вычислительных фьючерсов и рассчитывает запустить ее в третьем квартале. По сути, такие контракты будут похожи на обычные товарные фьючерсы: компании, арендующие или сдающие GPU-мощности, смогут делать ставки на рост или падение цен аренды. Контракты будут беспоставочными, то есть физической передачи серверов или чипов в аренду не предполагается.
Такие контракты, очевидно, привлекут не только тех, кто хочет захеджировать риски, но и спекулянтов, для которых такие фьючи станут способом заработать на изменении цен вычислительных ресурсов без необходимости рискованных инвестиций в железо.
Чикагская трейдинговая фирма DRW уже торгует вычислительными мощностями на спотовом рынке и станет одним из партнеров CME по новым фьючерсам.
Интерес проявляют даже компании из криптоиндустрии: криптофонды заинтересованы как в хеджировании, так и в спекуляциях (кто бы сомневался).
Практическая польза таких инструментов может быть широкой. Для банков фьючерсы станут способом страхования рисков. Если цены на аренду GPU начнут падать, банк сможет заработать на короткой позиции по фьючерсам и компенсировать потери по кредитам, выданным под ИИ-инфраструктуру.
Банки Кремниевой долины, финансирующие ИИ-стартапы, смогут защитить своих клиентов, которым не хватает вычислительных ресурсов, постоянно растущих в цене.
Облачные провайдеры вроде CoreWeave смогут использовать короткие позиции по фьючерсам, чтобы компенсировать возможное снижение доходов.
Однако проблема в том, что пока нет общепринятого эталона цены вычислительных мощностей. Стоимость аренды одних и тех же GPU может сильно различаться в зависимости от конфигурации серверов, стоимости электроэнергии, региона размещения дата-центра и других факторов. Кроме того, многие крупные сделки заключаются в частном порядке и не раскрываются.
Для решения этой проблемы биржи привлекают независимых поставщиков данных: CME будет использовать данные компании Silicon Data, а ICE выбрала поставщика данных Ornn.
Именно надежность таких индексов станет одним из ключевых вопросов для регуляторов. CFTC предстоит проверить, насколько сложно манипулировать этими показателями и отражают ли они реальные рыночные цены.
Пока американские биржи только проходят согласования, аналогичные инструменты уже появились на внебиржевом рынке. Платформа прогнозов Polymarket и криптобиржа Lighter уже запустили контракты на стоимость вычислительных мощностей.
Например, на Polymarket можно делать ставки на то, какой будет цена аренды GPU модели NVIDIA H100 в конце июня. Для расчета используется индекс все той же компании Ornn.
@anti_agi
GPU – уже не главная проблема: три барьера внедрения ИИ в бизнес, о которых не думают
Карту можно арендовать в облаке, а саму ИИ-модель — использовать по подписке. Цена за токен снижается, а для базовых задач хватает и бытовых графических ускорителей. Так что мифы о непосильно дорогом ИИ уже давно далеки от реальности.
Гораздо актуальнее три другие проблемы — рассказывает Михаил Воронин, эксперт БСС ИИ.
1️⃣ Некачественные данные. Начнем с самой очевидной из трех проблем, о которой тем не менее забывают: плохое качество данных на входе — плохое качество на выходе.
Поэтому важно сначала привести в порядок базу знаний: обновить информацию, устранить дубли и противоречия. В нашей практике это повышало качество ответов сразу не менее чем на 30%.
2️⃣ Завышенные ожидания. Компании ориентируются на качество облачных моделей из мирового ТОП (OpenAI, Anthropic и т.д.), но забывают про применимость компактных и тем более локальных решений.
Да, они имеют свои ограничения, и это надо учитывать. Поэтому важно как можно раньше протестировать модель, которая будет использоваться в продакшене. Кроме того, ИИ хорошо справляется с общими вопросами, но для задач, где требуется учитывать контекст заказчика, необходимы источник качественного контента (база знаний) и правильно настроенный RAG.
3️⃣ Неподготовленные процессы. ИИ нужно встроить в бизнес-процессы — для этого необходимо проработать риски, дообучить сотрудников, а зачастую и вовсе пересмотреть их роли и KPI.
Например, в контакт-центре голосовые и чат- боты берут на себя типовые обращения, а операторы уходят на вторую линию, где решают сложные вопросы — и теперь больше ценится экспертиза и эмпатия. Ключевой метрикой становится не скорость обработки обращения, а удовлетворённость клиентов.
@anti_agi
LLM delenda est
или Язык до AGI не доведет
Свежее интервью Яна Лекуна подтвердило за ним статус версии римского сенатора Катона Старшего от мира ИИ/ML. О каких бы прорывах ни рапортовала индустрия, Лекун неизменно выходит на трибуну со своим бессменным: «Впрочем, я считаю, что авторегрессионные LLM ведут в тупик, и должны быть отброшены». В интервью прозвучало традиционное скептическое ворчание, а также интересная фактура изнутри Meta*.
🤖 Суть лекуновского «Карфагена» проста: кремниевая долина тратит сотни миллиардов долларов на продвинутый Т9, путая имитацию с разумом. LLM работают авторегрессионно в пространстве токенов, у них нет здравого смысла и способности планировать. Они принципиально небезопасны на системном уровне, а значит никакие фильтры, RL и файнтюн не избавят их от галлюцинаций, поскольку внутри архитектуры нет понимания физики реальности.
🐷 Лекун резонно иронизирует над стадным поведением бигтехов, которые пытаются залить проблему неэффективности данными, сжигая ресурсы на генерацию синтетического видео и обучение роботов банальному подражанию (imitation learning). Он приводит простой пример: 17-летний подросток схватывает навыки вождения за 20 часов без всяких симуляций, а беспилотникам требуются миллионы часов данных, и они всё равно пасуют перед редкими ситуациями. Язык — слишком узкий субстрат, LLM уперлись в непрерывный физический мир.
Ну и на закуску корпоративная драма. Лекун откровенно рассказал, почему покинул Meta*. В 2023 году на волне успеха первой Llama Цукерберг поддался панике и краткосрочному давлению инвесторов, создав подразделение GenAI. В итоге средний менеджмент и коммерческие задачи полностью сожрали долгосрочное видение: фундаментальные поисковые исследования в FAIR лишились приоритета, а команду робототехники просто распустили. Внутри корпорации развивать науку Лекуну больше не дали, и он ушел делать стартап AME Labs, развивать архитектура JEPA. Вместо предсказания пикселей или токенов его система учится прогнозировать последствия действий в абстрактном пространстве представлений.
👁 Параллельно Лекун продвигает проект Tapestry — платформу глобального федеративного обучения. Через обмен весами параметров (без передачи самих данных) он хочет дать условной Индии или Бразилии цифровой суверенитет, чтобы их граждане не подвергались «промывке мозгов» базовыми моделями с зашитыми ценностями Калифорнии или Пекина.
📚📚📚Катон твердил свою фразу годами, пока Рим действительно не сравнял Карфаген с землей. По прогнозу Лекуна, всеобщее осознание того, что парадигма LLM зашла в тупик и бесконечное расширение дата-центров не сделает модели умнее, наступит уже в 2027 году. Посмотрим, засыплют ли солью серверные стойки с трансформерами 😏
* — Meta признана экстремистской и запрещена в России
@anti_agi
GigaCode CLI: спасибо опенсорсу за это
Сбер представил GigaCode CLI: «мультиагентного ассистента разработчика, который запускается из терминала независимо от IDE и ОС: автоматизирует сборку, тесты, рефакторинг, ищет уязвимости, и все это в защищенном контуре организации».(C) Внутренние тесты Сбера показали «прирост производительности инженеров на 30-70%». Чьи тесты, такой и прирост.
Дальше интереснее, если посмотреть на всю линейку
GigaIDE Desktop это сборка IntelliJ IDEA Community от JetBrains, доукомплектованная опенсорсными плагинами, чтобы дотянуться до платной Ultimate. GigaIDE Cloud это VS Code. Суверенная среда разработки оказалась ровно той кодовой базой, которую JetBrains держит открытой под Apache 2.0, но плюс шильдик‼️
С CLI-агентом вопрос происхождения встает еще острее. Открытых терминальных агентов сейчас столько, что под капотом можно собрать что угодно: OpenCode, Aider, OpenHands, Codex CLI, Goose, Cline, и список растет каждый месяц. А весной Anthropic еще и «случайно заопенсорсила» собственный Claude Code, выложив в npm полмиллиона строк его исходников, после чего попыталась собрать их обратно копирайтными исками.
Так что насчет оригинальности того, что крутится внутри GigaCode CLI, у нас есть некоторые сомнения.
Любопытно, что единственный продукт линейки, про который Сбертех настойчиво повторяет «это не клон, мы написали сами», это GitVerse. Там, где под капотом честно лежит чужой опенсорс, IntelliJ и открытые модели, об этом скромно умалчивают. А там, где, возможно, и правда сделали свое, бьют себя в грудь. Закон сохранения гордости: чем больше заимствовано, тем тише про фундамент.
И на этом фоне финальный штрих выглядит почти обезоруживающе честным. Понимая весь расклад, Сбертех сделал GigaCode CLI совместимой с любой LLM 😏
@anti_agi
I have a dreaming
OpenAI выкатила в ChatGPT новую систему памяти под названием Dreaming v3. Ни v1, ни v2 публично не было: нумерация сразу прыгнула через две версии, что само по себе классика маркетинга. Но цимес не в нумерации. Цимес в том, что когда-то лидер фронтира тут только догоняет конкурентов.
Коротко, что такое dreaming. Это фоновый процесс, который периодически пересобирает память о пользователе из истории чатов, без явной команды запомнить, и хранит ее как редактируемую сводку. Качество OpenAI меряет по трем осям: перенос контекста, следование предпочтениям и актуальность во времени (память сама стареет, формулировка «еду в Сингапур в июле» со временем превращается в «съездил в Сингапур»). По собственным тестам компания заявляет рост фактического recall с 67,9% до 82,8%, следования предпочтениям с 55,3% до 71,3%, точности во времени с 52,2% до 75,1%. Цифры приятные, но это внутренний тест самой OpenAI, а не независимая проверка.
Теперь про догонялки. Ровно та же техника, фоновый синтез сжатого профиля пользователя поверх недавнего контекста, доступна у двоих конкурентов с лета и осени 2025 года.
🤖 Gemini: Personal Context, август 2025, и сразу включен по умолчанию. Под капотом периодически обновляемый в фоне user_context, не в реальном времени. В комплекте инкогнито-режим Temporary Chats. По умолчанию Google зашел дальше всех.
🤖 Claude: поиск по прошлым чатам по запросу (август 2025), затем автоматическая генерация памяти (осень 2025), редактируемая сводка, изоляция памяти по проектам, импорт и экспорт памяти между ассистентами. Anthropic при этом память по умолчанию не включает и упирает на приватность.
То есть новизны по существу немного. Разница в умолчаниях по приватности (Google включает сам, Anthropic спрашивает) и в подаче. Единственное, что OpenAI реально добавила, это не функциональность, а экономика: компания утверждает, что снизила вычислительную стоимость фоновой памяти примерно в 5 раз, и за счет этого раскатывает dreaming на бесплатный тариф.
@anti_agi
Заимствованный Intel'лект 🤖
На Computex 2026 Intel показала стоечную ИИ-систему под инференс и агентные нагрузки и подала это как возвращение в большую игру. Но цимес в том, что основной компьют в этой системе делает не Intel.
👁 Стойка собрана из Intel Xeon и SambaNova SN-50 RDU, собирает и готовит стойку Foxconn. В облачном демо Vector Core Compute картина та же: Xeon отвечает за оркестрацию, decode идет на SambaNova SN40, prefill на NVIDIA Blackwell. Intel сама называет это гетерогенной платформой, где под каждую задачу свой чип. Жаль, что только один из этих чипов интеловский 😏
Берет чужое Intel не от хорошей жизни. Своего инференс-ускорителя у нее сейчас просто нет. Gaudi 3 доживает свой век и продается через IBM Cloud, на смену готовят GPU Crescent Island, но его образцы появятся у заказчиков только во втором полугодии 2026, а полноценный запуск это уже 2027.
💻 Вот Crescent Island как раз интересный, ну или как минимум необычный. Intel сознательно отказалась от HBM. Вместо дорогой и дефицитной памяти, на которой сидят NVIDIA и AMD, тут ставят обычную LPDDR5X: 160 ГБ в референсе и до 480 ГБ на партнерских платах. Чип только под инференс, 350 Вт, воздушное охлаждение, прицел на провайдеров tokens-as-a-service.
💻 HBM сейчас в остром дефиците и стоит как золото, а LPDDR5X дешевая, емкая и холодная. Расплата известна, мы ее разбирали на DGX Spark и AMD Strix Halo: пропускная способность LPDDR в разы ниже, поэтому быстрый просчет промпта есть, а на генерации токенов чип упирается в шину памяти. Crescent Island не обгонит Blackwell по скорости и не пытается. Это ставка на дешевый и емкий инференс, где платят не за токены в секунду, а за гигабайты и ватты.
Если убрать риторику про возвращение CPU в центр вычислений, под ней обнаруживается скромная, но осмысленная стратегия: не лезть на проигранный фронтир, а занять нишу дешевого инференса в расчете на то, что дефицит HBM сделает вариант «медленно, зато много и недорого» привлекательным. Сработает или нет, зависит от того, выйдет ли Crescent Island в срок и какие будут реальные цифры, которых Intel пока не дала.
@anti_agi
Свой ИИ-контур, но без страданий
За последний год разговоров про on-prem AI стало заметно больше. Компании хотят использовать ИИ для работы с внутренними документами, базами знаний, клиентскими данными. При этом вопрос часто упирается не только в безопасность или регуляторику. На практике бизнесу приходится решать вполне прикладные задачи: где запускать модели, как обеспечить контроль над данными, какой инфраструктуры будет достаточно сегодня и хватит ли ее через полгода.
Классический путь какой? Купить дорогое GPU-железо и заодно собрать команду из ML-инженеров, бэкендеров и безопасников, чтобы все это развернуть и обслуживать. Тендеры на месяцы, капзатраты, роль оператора кластера в придачу.
В итоге на рынке сформировался любопытный запрос: компаниям нужен собственный ИИ-контур, но без необходимости самостоятельно строить и обслуживать GPU-инфраструктуру.
Видимо для компаний с таким запросом Selectel, Yandex B2B Tech и MetaMentor представили новый ПАК. По сути, это попытка совместить требования к локальному размещению ИИ с моделью потребления, которая больше напоминает облачный сервис. Железо арендованное, стоит у заказчика, разворачивать и настраивать инфраструктуру самому не нужно.
💻 Что внутри. GPU-серверы Selectel (от NVIDIA HGX B300 и H200 до A100 и RTX PRO 6000, плюс сервер собственной разработки), платформа Yandex AI Studio и услуги MetaMentor по внедрению. Все работает в изолированном контуре, обслуживание и обновление железа на провайдере.
🐷 Зачем. Разовые капзатраты превращаются в операционные, выкладываться на закупку единовременно не нужно. При этом получаешь доступ к актуальным ускорителям без полугодовых тендеров. Конфигурацию подбирают под задачу, доставляют и устанавливают на площадке клиента, полная готовность ПАК от двух недель. Самостоятельная закупка и развертывание обычно тянется от нескольких месяцев до года.
🤖 Под что берут. Корпоративные ассистенты, поиск по внутренним документам и базам знаний, обработка и генерация документов, кодогенерация и другие сценарии использования LLM внутри корпоративного контура.
Похоже, что рынок постепенно движется к модели, в которой компаниям уже не обязательно выбирать между облаком и самостоятельной сборкой ИИ-инфраструктуры. Появляется промежуточный вариант: собственный контур с сервисной моделью эксплуатации.
@anti_agi
Искусственный интеллект требует естественного
Планы Alphabet привлечь $80 млрд через продажу акций выглядят необычно сами по себе: компания не выпускала новые акции уже 21 год. Формально деньги нужны для финансирования гигантских расходов на инфраструктуру искусственного интеллекта.
Однако в документах скрыта любопытная деталь: почти 40% привлечённых средств, около $30 млрд, пойдут вовсе не на дата-центры, а на уплату налогов, связанных с акциями, переданными сотрудникам для их мотивации остаться с компанией и дальше. То есть по сути это следствие развернувшейся благодаря ИИ войны за таланты.
Речь идёт о налогах, которые формально должны платить сами работники при получении акций в рамках компенсации. Но на практике компании обычно удерживают часть этих акций, продают их и перечисляют деньги налоговым органам. Для сотрудников это удобно, поскольку им не приходится самостоятельно продавать бумаги для уплаты налогов.
Проблема возникает, когда акции компании быстро дорожают. Чем выше цена акций в момент их перехода в собственность сотрудников, тем больше налоговые обязательства. В результате компания вынуждена тратить всё больше наличных именно тогда, когда одновременно наращивает инвестиции в ИИ.
У Alphabet этот эффект стал особенно заметен. Ожидается, что в 2025 году компания потратит около $30 млрд на такие налоговые выплаты — почти вдвое больше, чем годом ранее. Это соответствует примерно 14% прогнозируемого операционного денежного потока компании против 9% год назад.
Ситуация характерна не только для Alphabet. Пять крупнейших компаний, находящихся в центре ИИ-бума — Nvidia, Meta*, Microsoft, Alphabet и Amazon — в прошлом году суммарно направили почти $60 млрд на покрытие налогов, связанных с вознаграждением сотрудников акциями. А предстоящие IPO SpaceX, Anthropic и OpenAI, могут привести к новым многомиллиардным налоговым выплатам.
Особенно показательна ситуация в Meta*. В прошлом году компания удержала более $18 млрд для покрытия налогов по акциям сотрудников — даже больше, чем Alphabet, хотя ее штат вдвое меньше. Эти выплаты составили около 16% операционного денежного потока компании. Массовые увольнения примерно 8 000 сотрудников в этом году могут снизить будущие налоговые обязательства, поскольку уволенные работники не получат часть акций, которые должны были перейти им позже.
Хотя налоговые расходы Alphabet значительно меньше ожидаемых капитальных затрат на ИИ-инфраструктуру — около $186 млрд в этом году, — инвесторы обычно уделяют гораздо меньше внимания этим выплатам. Капитальные расходы считаются частью стандартных инвестиций бизнеса и включаются в привычные финансовые модели. Налоги по акциям сотрудников отражаются иначе и часто остаются в тени.
Тем не менее они быстро растут. В 2021 году, когда росли котировки БигТехов, эти выплаты тоже увеличивались, но тогда расходы на дата-центры были намного ниже. Сейчас сочетание капитальных затрат и налоговых выплат съедает уже 64% операционного денежного потока Alphabet и 75% у Meta*.
В итоге от гонки за искусственным интеллектом выигрывают не только поставщики электроэнергии, производители чипов и облачные провайдеры. Одним из крупнейших бенефициаров оказывается и налоговая служба США.
* — Meta запрещена за экстремизм в России и только у нас
@anti_agi
AI First, но не AI Only
Главный «прыжок веры» в ИИ-мир — не в том, чтобы заменить человека нейросетью. А в том, чтобы наконец понять, каким должен быть человек, когда ИИ становится базовой инфраструктурой.
4 июня на ПМЭФ Авито соберёт сильное комьюнити экспертов, чтобы поговорить о стратегии и роли людей внутри экономики AI First. Как быстрее других перейти к новой трудовой этике, добиться кратного роста результата и при этом сохранить за человеком роль субъекта, а не интерфейса?
За одним столом — эксперты из Авито, Сбера, AliExpress СНГ, HH.ru, Т-Банка, VK и Института AIRI, нейроучёный Татьяна Черниговская. Модерирует Ксения Собчак.
Если вы на ПМЭФ, приходите в павильон F, зал F4. Если нет — смотрите вместе с нами онлайн, будет интересно.
4 июня, 11:00–12:15
@anti_agi
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
