Тест Тьюринга
الذهاب إلى القناة على Telegram
Актуальное в сфере искусственного интеллекта в России и в мире: • Дайджест новостей • Аналитические обзоры, переводы, справки Для связи - @nastyapvlv28
إظهار المزيد2 134
المشتركون
-324 ساعات
-67 أيام
-330 أيام
جاري تحميل البيانات...
القنوات المماثلة
سحابة العلامات
الإشارات الواردة والصادرة
---
---
---
---
---
---
جذب المشتركين
يونيو '26
يونيو '26
+11
في 0 قنوات
مايو '26
+20
في 0 قنوات
Get PRO
أبريل '26
+11
في 0 قنوات
Get PRO
مارس '26
+22
في 1 قنوات
Get PRO
فبراير '26
+34
في 0 قنوات
Get PRO
يناير '26
+19
في 2 قنوات
Get PRO
ديسمبر '25
+49
في 2 قنوات
Get PRO
نوفمبر '25
+50
في 5 قنوات
Get PRO
أكتوبر '25
+66
في 5 قنوات
Get PRO
سبتمبر '25
+63
في 4 قنوات
Get PRO
أغسطس '25
+64
في 4 قنوات
Get PRO
يوليو '25
+86
في 5 قنوات
Get PRO
يونيو '25
+122
في 0 قنوات
Get PRO
مايو '25
+92
في 3 قنوات
Get PRO
أبريل '25
+106
في 4 قنوات
Get PRO
مارس '25
+85
في 1 قنوات
Get PRO
فبراير '25
+118
في 0 قنوات
Get PRO
يناير '25
+93
في 2 قنوات
Get PRO
ديسمبر '24
+82
في 4 قنوات
Get PRO
نوفمبر '24
+94
في 4 قنوات
Get PRO
أكتوبر '24
+205
في 19 قنوات
Get PRO
سبتمبر '24
+150
في 5 قنوات
Get PRO
أغسطس '24
+110
في 7 قنوات
Get PRO
يوليو '24
+102
في 1 قنوات
Get PRO
يونيو '24
+67
في 1 قنوات
Get PRO
مايو '24
+70
في 0 قنوات
Get PRO
أبريل '24
+108
في 0 قنوات
Get PRO
مارس '24
+397
في 8 قنوات
Get PRO
فبراير '24
+101
في 1 قنوات
Get PRO
يناير '24
+77
في 0 قنوات
Get PRO
ديسمبر '23
+317
في 3 قنوات
| التاريخ | نمو المشتركين | الإشارات | القنوات | |
| 27 يونيو | 0 | |||
| 26 يونيو | 0 | |||
| 25 يونيو | 0 | |||
| 24 يونيو | +1 | |||
| 23 يونيو | 0 | |||
| 22 يونيو | +1 | |||
| 21 يونيو | 0 | |||
| 20 يونيو | 0 | |||
| 19 يونيو | +1 | |||
| 18 يونيو | +1 | |||
| 17 يونيو | 0 | |||
| 16 يونيو | 0 | |||
| 15 يونيو | 0 | |||
| 14 يونيو | 0 | |||
| 13 يونيو | 0 | |||
| 12 يونيو | +1 | |||
| 11 يونيو | +1 | |||
| 10 يونيو | 0 | |||
| 09 يونيو | 0 | |||
| 08 يونيو | 0 | |||
| 07 يونيو | 0 | |||
| 06 يونيو | +2 | |||
| 05 يونيو | 0 | |||
| 04 يونيو | 0 | |||
| 03 يونيو | +1 | |||
| 02 يونيو | +1 | |||
| 01 يونيو | +1 |
منشورات القناة
⚫️ Для оценки ИИ нужно всего 5 бенчмарков
Современный релиз языковой модели сопровождается отчётом с результатами на 40+ бенчмарках, причём те же самые оценки прогоняются многократно ещё до публичного релиза — чтобы отслеживать прогресс обучения, сравнивать архитектурные решения и выбирать лучший чекпоинт.
Авторы работы "You Don't Need to Run Every Eval" Ючень Зэн и Димитрис Папаилиопулос из подразделения Microsoft Research, AI Frontiers, задаются вопросом: а нужно ли вообще запускать все эти оценки?
Исследователи создали публичную матрицу оценок (score matrix), собрав результаты тестов 84 передовых моделей от 13 провайдеров (OpenAI, Google, Anthropic и др.) по 133 бенчмаркам. Матрица содержит 2604 наблюдаемых значения, что составляет лишь 23.3% от всех возможных ячеек.
📌 Ключевое открытие — матрица имеет эффективный ранг 2 (rank-2). Это значит, что оценки модели по всем 133 тестам в значительной степени определяются всего двумя скрытыми факторами. Матричное разложение с использованием SVD показало, что два фактора объясняют более 90% вариативности в оценках моделей;
Скрытые «два числа» — это не «интеллект» и «знания». Авторы не интерпретируют, что именно означают эти два фактора. Это приглашение для будущих исследований: что такое «ось X» и «ось Y» в пространстве способностей LLM?На основе этой структуры был создан BenchPress — метод, который по небольшому набору известных оценок модели предсказывает все остальные с точностью ~4.6 балла. Авторы обнаружили набор из пяти бенчмарков {GPQA-D, HLE, Codeforces, MMLU-Pro, ARC-AGI-1}, который восстанавливает остальные публичные оценки модели с точностью до 3.93 балла. Для меньшего вычислительного бюджета более дешёвый набор {GPQA-D, MMLU-Pro, Aider Polyglot, MATH-500, AIME 2026} позволяет предсказывать оценки с точностью до 4.55 балла. О чем следует задуматься индустрии и не только? 1️⃣ Для разработчиков AI-моделей — прямая экономия ресурсов при итерациях. Вместо запуска десятков бенчмарков на каждом чекпоинте достаточно запустить 5, предсказав остальные. При сотнях итераций в процессе обучения это может сэкономить миллионы долларов и недели времени. 2️⃣ Для ИИ-исследователей — новая парадигма понимания способностей LLM. Если матрица оценок имеет ранг 2, значит за разнообразием задач стоят всего несколько фундаментальных способностей. Это ставит вопросы о природе «интеллекта» в современных LLM. 3️⃣ Для регуляторов и политиков — сигнал к пересмотру требований к тестированию. Если 133 бенчмарка несут не больше информации, чем 5, то регуляторные требования об «исчерпывающем тестировании» могут нуждаться в переосмыслении. Неочевидные выводы 👉 «Гонка бенчмарков» теряет смысл. Компании публикуют десятки цифр при каждом релизе — не потому что они информативны, а потому что это стало индустриальным стандартом. 👉 Ранг 2 — это диагноз нынешнему поколению моделей. Авторы честно оговариваются: ранговая структура условна на текущем снапшоте из 84 моделей. Если появятся модели с принципиально новыми архитектурами или специализацией, например, только для биоинформатики, матрица может изменить ранг. 👉 Предсказание хорошо работает для «обычных» моделей, но ненадёжно для аутлаеров. Авторы разработали «уровень уверенности» именно потому, что для нетипичных моделей предсказания могут сильно ошибаться. Если вы разрабатываете действительно инновационную модель, вам всё равно придётся запускать полный набор оценок. 💬 Тест Тьюринга. События в сфере ИИ. Подписаться
| 2 | 🤩 Японский путь в ИИ: оркестрация вместо масштабирования
На этой неделе токийский стартап Sakana AI выпустил Sakana Fugu и его флагманскую версию Fugu Ultra. Это мультиагентный оркестратор, работающий как обычная модель через единый OpenAI-совместимый API. Это событие является продолжением пяти параллельных трендов в развитии ИИ.
Япония выходит в мировые лидеры и делает это своим способом
Sakana AI основана двумя бывшими исследователями Google: Льоном Джонсом, один из восьми соавторов «Attention Is All You Need» — статьи, давшей миру архитектуру Transformer, и Дэвидом Ха. Лаборатория базируется в Токио, специализируется на эволюционных алгоритмах и коллективном интеллекте.
Япония не пытается догнать США в гонке масштабов и не строит, например, какой-нибудь ЦОД на 220 000 GPU. Вместо этого японский путь оказался изобретательным: не тренировать ещё более крупную модель, а обучить маленькую модель управлять чужими крупными.
Параллельно правительство Японии 22 июня опубликовало обновлённый Базовый план по ИИ с фокусом на кибер-риски и дипфейки. Регуляторная и коммерческая стратегии движутся синхронно, например, в отличие от ЕС.
Экспортный контроль становится центральной
Sakana прямо называет повод для выпуска своего сервиса:
«Anthropic приостановила Fable 5 и Mythos по приказу правительства США — это не абстрактный риск, если ваш банк, министерство или завод построили workflow вокруг одной модели».
Это первый в истории случай, когда frontier-продукт позиционируется через защиту от суверенного риска как центральный элемент.
Этот вопрос становится новой нормой: входит ли «доступность модели для пользователей с любым гражданством» в SLA-контракт? Sakana не единственная идет этим путем: Kimi K2.7, GLM-5.2, MiniMax M3 — все позиционируются через MIT лицензию, развёртываемую где угодно. Таким образом, сформировалась новая маркетинговая категория «инфраструктура ИИ-суверенитета».
Наука как фундамент нового продукта
Fugu в отличие от решения OpenRouter — это не «несколько API-запросов в пайплайне». Это обученная политика координации, описанная в двух статьях Sakana, представленных на ICLR 2026.
➡️ Trinity: маленький самообучаемый координатор, который управляет пулом LLM. Это эволюционный подход, координатор «совершенствуется» в управлении командой.
➡️ Conductor: метод обучения coordinator-модели через RL на естественном языке. Здесь координатор учится не «правилам», а гибкому поведению.
Архитектура Fugu представляет собой одну координирующую LLM на 7 млрд параметров, которая обучена решать, когда, какую модель из пула, для чего и сколько раз вызвать, включая рекурсивный вызов себя. Разница между Fugu и обычным оркестратором — как между обученной собакой-поводырём и GPS-маршрутом.
Frontier-модели — это дорого. Оркестратор может быть дешевле, но не всегда
Fugu Ultra: $5 input / $30 output за миллион токенов. Подписки: $20 / $100 / $200 в месяц. Выглядит дешевле, чем Fable 5 "при жизни" ($10/$50).
НО $5/$30 — это цена запроса к координатору. Реальная стоимость = Fugu + стоимость всех вызовов к GPT-5.5, Opus 4.8 и Gemini «под капотом», которая пользователю не раскрывается. Аналогия тут такая: умный роутер может сэкономить деньги, выбирая правильную модель, но может и скрыть дорогую цепочку вызовов за одним аккуратным ответом.
Подтверждение тренда после OpenRouter Fusion
За одну неделю случилось четыре события про одну идею:
1️⃣ OpenRouter Fusion: ансамбль моделей с судьёй-синтезатором.
2️⃣ Cursor Origin: GitHub-инфраструктура для агентных workflow.
3️⃣ OpenAI Record & Replay: превращение действий пользователя в скиллы агента.
4️⃣ Sakana Fugu: обученный координатор для пула frontier-моделей.
Все четыре — об одной концепции. Выигрывает не одна модель, а система, которая умеет выбирать, спорить и собирать ответ.
Экономический смысл прост: если frontier-качество достигается через оркестрацию, то гонка «ещё более мощная одиночная модель» теряет смысл — за исключением задач, требующих внутренней согласованности длинных рассуждений.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 165 |
| 3 | 👨💻 Как заставить GPU меньше ждать: исследование Яндекса вошло в топ ICML
6 июля в Вене откроется ICML — Международная конференция по машинному обучению. Это не просто крупнейшее ежегодное собрание в области ML — это место, где определяется направление движения всей науки о данных на следующие несколько лет.
В 2026 году заявки на публикацию докладов конференции прислали около 24 тыс. исследовательских групп со всего мира. Из них программный комитет выделил лишь чуть более 500 работ со статусом Spotlight — самыми высокими оценками. Это 2,2% от всех поданных заявок.
Одна из этих 536 работ принадлежит команде Яндекса. Гордимся нашими большими друзьями и коллегами из российской компании-лидера в сфере ИИ!
Что решали ученые Яндекс и почему это сложно?
Графовые нейронные сети (GNN) — архитектура, которая работает не с изображениями или текстами, а с графами: объектами, между которыми есть связи. Например, графами являются социальная сеть (пользователи и их подписки), молекула (атомы и химические связи), интернет-магазин (пользователи, товары, покупки). Именно GNN лежат в основе лучших рекомендательных систем, инструментов разработки лекарств и детекторов мошенничества.
Но проблема и специфика работы с GNN состоит в том, что GPU, современный вычислительный инструмент для обучения нейросетей, спроектирован для другой задачи. Он умеет молниеносно умножать большие матрицы: ровные, плотные, предсказуемые структуры.
А в графах всё иначе. Каждый узел связан с разным количеством соседей. Данные лежат в памяти в разброс. Когда GPU начинает работать с графом, он постоянно прерывается и ждёт пока нужные данные загрузятся из разных мест памяти.
В это время тысячи вычислительных ядер простаивают. Сами вычисления при этом несложные, но проблема именно в ожидании.
Команда Яндекса — исследователи из Yandex Research, инженеры команд ML-инфраструктуры и инференса, студенты ШАД — разработала алгоритм, который меняет порядок обращения к памяти так, чтобы видеокарта ждала как можно меньше. Данные о результатах будут публичны после публикации доклада на конференции, но сам статус Spotlight говорит, что программный комитет счёл работу значимой как теоретически, так и практически.
Почему это важно именно сейчас?
Яндекс — не просто исследовательская компания с хорошей наукой. Это организация, чьи сервисы ежедневно обслуживают сотни миллионов запросов: в поиске, навигации, музыке, видео, такси. Каждый раз, когда алгоритм рекомендует вам трек или предлагает маршрут, за этим стоит GNN. Ускорение этой архитектуры — это снижение стоимости инференса, ускорение обучения моделей, способность работать с более крупными графами в те же сроки.
Работа будет опубликована в открытый доступ. Значит, тем же алгоритмом смогут воспользоваться исследователи в медицине, климатологии, фармацевтике — везде, где графовые нейросети применяются сегодня.
Отдельно стоит сказать о ШАД — Школе Анализа Данных, которую Яндекс основал ещё в 2007 году и которая уже почти двадцать лет готовит ML-специалистов класса мирового уровня. То, что студенты ШАД стали соавторами работы в топ-2,2% ICML — это результат выстраивания образовательной экосистемы, где граница между учёбой и передовой наукой намеренно размыта.
Статус Spotlight на ICML — не просто строчка в резюме. Это сигнал, который читают исследователи по всему миру: из России приходят идеи, которые стоит изучить.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 171 |
| 4 | 👨🏫 ИИ помогает учиться или незаметно отучает думать?
Недавно вышло интригующее исследование CEPR Discussion Paper DP21577 о влиянии ИИ на качество образования. Это 30 месяцев исследований по более чем 26 тыс. китайских учеников в 7–12 классе, 9 предметов, ежемесячные экзамены, вступительные испытания в старшую школу и университет, плюс оценки домашних заданий с фиксацией времени их выполнения.
Ключевой вывод — использование генеративного ИИ повышает оценки за домашние задания на 18% и сокращает время их выполнения на 30%.
! Но оценки за ежемесячные экзамены падают на 20% уже через шесть месяцев. Результаты вступительных экзаменов (аналог ЕГЭ) снижаются на 18–24% и полный эффект проявляется только спустя два года.
Главный вопрос: это потеря знаний или просто развитие других навыков?
Наибольшее снижение оценок за экзамены отмечается среди примерно 80% пользователей ИИ, которые делали «ИИ-аутсорсинг домашней работы». Такие ученики показывали исключительно короткое время выполнения ДЗ при высоких оценках за само задание. Потери оказались наибольшими в общественных науках, затем в STEM и языках. Особенно большой эффект — у учеников младших классов.
Оставшиеся 20%, которые тратили на домашнюю работу столько же времени, что и те, кто ИИ не использовал, показали лишь минимальное снижение результатов на экзаменах.
Это ключевое разграничение. ИИ как замена мышлению даёт одни результаты. ИИ как наставник, который объясняет и уточняет материал, — другие.
Механизм: когнитивное делегирование
В исследовании измерялись знания, которые хранятся в долгосрочной памяти. Когда мозг тратит усилия на решение учебных задач, возникает то, что нейробиологи называют «консолидацией» — переносом знаний из рабочей памяти в долговременную через ошибки, повторение и усилие.
Когда ребёнок 30 месяцев не работает с задачами, а делегирует их, мозг перестаёт инвестировать в поддержание соответствующих нейронных путей. Этот механизм хорошо изучен: rалькуляторы ослабили навык счёта в уме, а GPS ослабляет пространственную память.
Исследователи формулируют простой принцип:
«Использование ИИ в поддержку занятий — это хорошо. Использование ИИ вместо выполнения домашней работы — очень плохо».
Потеря или перепрофилирование?
Исследование измеряло именно то, что должен измерять традиционный экзамен. И на этом поле у обучения с ИИ однозначный минус.
Но ни одно измерение в работе не охватывало другого. Те же 26 тыс. детей параллельно учились формулировать запрос так, чтобы получить полезный ответ; оценивать, насколько ИИ прав или ошибается; совмещать несколько инструментов для решения задачи; рефлексировать о том, что они знают и чего не знают. Это реальные навыки 2026 года, и они нигде в исследовании не измерены.
Честный ответ на вопрос «дети стали учиться хуже?» звучит так: они стали хуже справляться с тестами, проверяющими знание без доступа к инструментам.
Является ли это «учёбой» — вопрос не педагогический, а философский. Пока мы отвечаем «да», данные CEPR — однозначный приговор. Если мы готовы переопределить, что значит «учиться», то разговор становится сложнее.
Что это значит для педагогики?
Прямой вывод из 20% пользователей, у которых эффект был минимальным: детей нужно учить другому режиму взаимодействия с ИИ — не «дай ответ», а «объясни, проверь моё понимание, укажи на ошибку». Разница в поведении — это разница в исходе. И это то, чему можно и нужно учить.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 177 |
| 5 | 📚 В Российской государственной библиотеке появился инструмент анализа кандидатских и докторских
Российские диссертации — один из самых трудоемких форматов научного знания. При этом их невозможно найти в международных базах статей, которые сейчас легко анализировать при помощи ИИ и ML-инструментов.
Конечно, каждая отечественная диссертация обязана поступать в РГБ по требованиям о хранении обязательного экземпляра. Но найти их тоже было почти невозможно: только по ключевым словам, или только если знаешь точный заголовок или фамилию автора.
На Всероссийском библиотечном конгрессе 2026 года РГБ объявила о запуске национальной ИИ-платформы, которая открывает беспрецедентный доступ к 200 млн единиц хранения. Это значит, что появился инструмент поиска всего, что было написано и защищено в российской науке за 200 лет существования «Ленинки».
➡️ В основе платформы лежит Аналитическая нейросетевая справочно-информационная система — АНСИС, разработанная на отечественном ПО, включённом в реестр Минцифры. Вся инфраструктура и данные находятся на серверах РГБ, что гарантирует суверенитет информации.
➡️ Партнёром в разработке стала MWS AI — AI-подразделение МТС Web Services, в 2025 году объединившее ключевые AI-активы МТС, включая VisionLabs и Big Data МТС. Проект реализован совместной командой — технологами РГБ и инженерами MWS.
В РГБ теперь работает семантический поиск
Старый поиск в библиотечном каталоге работал буквально: если в заголовке диссертации написано «нейронные сети», а автор использовал термин «многослойный перцептрон», поиск не найдёт ничего.
Семантический поиск преобразует каждый текст в числовой вектор — математическое «отображение смысла» в многомерном пространстве. Близкие по смыслу тексты дают близкие векторы, даже если в них нет ни одного общего слова.
Например, запрос «применение глубокого обучения в кардиологии» найдёт диссертации про нейросетевую диагностику аритмий, ИИ в ЭКГ-анализе и предсказательные модели сердечно-сосудистых рисков вне зависимости от конкретной терминологии автора.
Все публикации включены в граф знаний
NER (Named Entity Recognition) — технология, которая в тексте автоматически распознаёт именованные сущности: людей, организации, даты, географические названия, научные концепции. Из этих сущностей строится граф: каждая сущность — узел, каждая связь между ними — ребро.
Диссертация «Иванова А.П., МФТИ, 2018, о методах сжатия нейронных сетей» соединяется с другими работами по смежным темам, с публикациями той же научной школы, с последующими работами, которые цитировали те же концепции. Вместо изолированных документов получается сеть: кто с кем работал, какие темы пересекаются, где есть научные школы.
Что теперь доступно?
Принципиально важно, что фонд главной библиотеки страны, отражающий 200 лет истории и знаний, становится доступен не только в виде полных текстов, но и в формате структурированных датасетов, которые могут использоваться для обучения собственных языковых моделей и создания новых ИИ-сервисов.
Почему это важно именно сейчас?
В контексте ограничений на западные ИИ-платформы вопрос о том, на каких данных обучать отечественные LLM, стоит остро. 200 миллионов единиц РГБ с задокументированным происхождением, сохранённых на российских серверах и открытых для использования в ML-задачах — это ресурс, которого раньше не существовало.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 272 |
| 6 | 🖥 Главный тренд десятилетия на рынке труда: человек + ИИ
На прошлой неделе компания PwC выпустила свой ежегодный доклад «2026 Global AI Jobs Barometer». Это масштабное исследование, которое анализирует более миллиарда онлайн-вакансий с шести континентов и 27 стран, а также финансовую отчетность тысяч компаний. По сути, это один из самых всеобъемлющих срезов того, как ИИ прямо сейчас меняет глобальный рынок труда — не в теории, а в реальных цифрах найма, зарплат и требуемых навыков.
Исследование делит все профессии на две категории:
➡️ Профессионализируемые (Professionalised) — профессии, где ИИ автоматизирует базовые задачи, повышая потребность в человеческой экспертизе (рентгенологи, рекрутеры, авиадиспетчеры) — 22% вакансий.
➡️ Демократизируемые (Democratised) — профессии, где ИИ автоматизирует более экспертные задачи, снижая порог входа (разработчики ПО, кредитные специалисты, финансовые менеджеры) — 78% вакансий.
Ключевые выводы
1️⃣ ИИ создаёт двухскоростной рынок труда (two-track labour market): профессионализируемые профессии растут вдвое быстрее демократизируемых и демонстрируют на 42% более высокий рост зарплат с 2021 года.
2️⃣ Бóльшая подверженность ИИ связана с ростом численности персонала, а не с его сокращением. В наиболее подверженных ИИ компаниях рост численности сотрудников вдвое выше, чем в наименее подверженных.
3️⃣ Самое интересное — это эффект «суперзвёзд». Среди компаний, наиболее активно использующих ИИ, топ-20% показали рост производительности труда на 163% с 2018 года — почти в 5 раз выше среднего по отрасли.
4️⃣ Навыки в наиболее подверженных ИИ профессиях меняются вдвое быстрее, чем в наименее подверженных. Новые задачи, добавляемые в ИИ-подверженные роли, в 2,5 раза чаще требуют «человеко-интенсивных» способностей: эмпатии, креативности, суждений, лидерства.
О чем всем стоит задуматься
Во-первых, о «сеньоризации» начальных позиций: анализ 2,4 млн вакансий в США показал, что ИИ-затронутые начальные роли в 7 раз чаще требуют навыков, которые раньше считались «старшими» — лидерства, креативности, умения вести переговоры. При этом такие «усложненные» начальные позиции выросли на 35% с 2019 года, тогда как обычные entry-level jobs сократились на 10%.
Иными словами, порог входа в профессию для молодых специалистов не снижается, а растёт.
Во-вторых, о пересмотре ценности человеческих навыков. Спрос на «чисто человеческие» способности — эмпатию, креативность, стратегическое мышление — взлетает. ИИ автоматизирует анализ, но не заменяет суждение.
И в-третьих, о новом неравенстве: выигрывают не те, кто просто внедряет ИИ, а те, кто использует его для усиления человеческого потенциала, а не для слепой автоматизации.
Наконец, PwC подчёркивает: для работодателей переобучение сотрудников может быть менее эффективным, чем перепроектирование их ролей с учётом сильных сторон ИИ и человека. В будущем конкурентоспособность компаний будет определяться не тем, как быстро они внедряют ИИ, а тем, как умно они перестраивают организацию работы вокруг ИИ.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 262 |
| 7 | 💥 Зачем выбирать между Claude, GPT, Gemini и DeepSeek, если можно использовать все сразу?
У каждой frontier-модели есть сильные и слабые стороны, и это давно не секрет. Например, некоторые считают, что Claude лучше рассуждает и следует инструкциям, а GPT-5.x сильнее в аналитике данных. При этом мы и сами заметили, что Gemini опережает в работе с длинными документами и поиском в сети. DeepSeek и Kimi неожиданно сильны в математике и стоят в разы дешевле.
Возникает логичный вопрос: а нельзя ли задать вопрос всем сразу и выбрать лучший ответ?
Можно. OpenRouter превратил эту идею в продукт — Fusion API. Система прогоняет запрос через 3–5 моделей одновременно. Пользователь может выбрать преднастроенный вариант Quality или Budget, и модели-участники будут работать параллельно. Также в панели включён web search, то есть каждая модель может найти актуальные данные перед ответом.
Стадии обработки запроса:
1️⃣ Ваш запрос поступает в Опенроутер ▶️ 2️⃣ несколько (от 1 до 8) моделей параллельно исполняют его, также происходит поиск в сети ▶️ 3️⃣ "судья" сравнивает все ответы ▶️ 4️⃣ финальная модель пишет итоговый текст.
Самое интересное — шаг судьи
Судья не просто выбирает лучший ответ. Судья возвращает структурированный JSON с пятью разделами:
➡️ consensus — в чём все модели согласны
➡️ contradictions — где прямо противоречат друг другу
➡️ partial coverage — что одна модель затронула, другая нет
➡️ unique insights — что нашла только одна модель
➡️ blind spots — что никто не заметил
Это уже не выбор победителя, а карта разногласий.
Реальные цифры
OpenRouter тестировал Fusion на бенчмарке DRACO: 100 задач глубокого исследования, разработан Perplexity. Панель Fable 5 + GPT-5.5 с судьёй Opus 4.8 смогла набрала 69,0%. Это выше, чем Fable 5 в одиночку — 65,3%. Бюджетная панель из Gemini 3 Flash, Kimi K2.6 и DeepSeek V4 Pro достигла 64,7% при вдвое меньшей стоимости.
Окупается ли?
Платить нужно за вызов каждой модели в панели плюс вызов судьи. Вариант "Quality" стоит больше чем в 3 раза дороже одного вызова модели Opus 4.8. Но качество превзойдет пока недоступный Fable 5. Если задача требует глубокого анализа, и ошибка обойдётся дорого, то это подходящий вариант.
Если нужен быстрый ответ на простой вопрос — один дешёвый Claude Haiku будет в сотни раз дешевле и достаточен. OpenRouter сам признаёт: Fusion не подходит для realtime-взаимодействий и задач, где важна скорость ответа — параллельный запуск нескольких моделей увеличивает задержку ответа пропорционально.
Можно ли собрать судью самостоятельно?
Технически — да, и это не очень сложно. Основа будет, например, на Python с несколькими API-ключами. Логика такая: один и тот же запрос отправляется параллельно к Claude, GPT и Gemini. Далее все три ответа собираются, формируется мета-промпт:
Вот три ответа на один вопрос. Определи: в чём они согласны, где противоречат, что каждый упустил, выбери лучшие элементы и синтезируй финальный ответ.
Такой запрос отправляется судье — любой достаточно умной модели.
Это паттерн, давно известный как «mixture of agents» в академической литературе. Идея существует давно, но упаковать её в продуктовый API, чтобы вызывать так же, как любую одну модель - это то, что делает Fusion практически полезным.
Что OpenRouter добавляет сверх самодельной сборки: удобство, web поиск в каждой модели, пресеты из проверенных комбинаций и прозрачность логов. Сколько это стоит? 5.5% сверх стоимости всех вызовов.
Когда имеет смысл, когда нет?
Fusion работает хорошо там, где у моделей разные слепые зоны: юридический анализ, медицинское исследование, стратегические решения, глубокий фактчекинг. Модели галлюцинируют по-разному и ансамбль снижает вероятность того, что ни одна не поймала ошибку.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 266 |
| 8 | 🖥 Опенсорс как страховка от произвола БигТеха
Неделю назад правительство США впервые в истории приказало Anthropic отключить Fable и Mythos для всех неграждан США. Компания не смогла технически разделить пользователей и закрыла доступ для всего мира. Прецедент создан, и теперь если паттерн повторится для Sonnet или Opus, неамериканские пользователи Claude Code могут мгновенно остаться без инструмента.
На этом фоне три новые открытые модели выглядят как альтернатива или страховка:
1⃣ MiniMax M3: 428 млрд параметров, активных 23 млрд, 1 млн токенов контекста. Главная инновация — это MiniMax Sparse Attention, что дает экономию в 20 раз по вычислениям на больших контекстах, чем это было у предыдущего поколения.
3⃣ Kimi K2.7 Code: 1 трлн параметров, 32 млрд активных, 256 тыс. токенов контекста. Модель от Moonshot AI, реально открытые веса на HuggingFace под лицензией Modified MIT. Тратит на ~30% меньше токенов на размышление, чем у предыдущей версии K2.6.
3⃣ MiMo Code: форк популярного open-source агента OpenCode с собственной моделью MiMo-V2.5-Pro на 1 трлн параметров, временно бесплатной через анонимный режим без настройки. Поддерживает долговременную память проекта, голосовой ввод, совместим с навыками и командами Claude Code.
Что значит «открытые веса» на самом деле?
«Открытые веса» — это файлы с обученными параметрами модели, которые можно скачать и запустить на своём оборудовании без участия компании-разработчика.
Оговорка — для топовых моделей из этой тройки «своё оборудование» означает не домашний компьютер. По тестам независимых обзорщиков, 256-гигабайтный Mac способен запустить ужатую версию с заметной потерей качества, а для практичной интерактивной работы нужны минимум 8 видеокарт уровня H100. Это серверный кластер ценой в десятки тысяч долларов.
Открытые веса дают возможность кому-то развернуть модель и предложить доступ другим. Для обычного человека открытые веса практически означают «появился дешёвый облачный API», а не «можно запустить на ноутбуке».
Что реально доступно прямо сейчас?
Облачный API через агрегаторы вроде OpenRouter — это самый реалистичный путь. MiniMax M3 на старте стоила $0,30 за миллион токенов на входе и $1,20 на выходе. Kimi K2.7 Code — $0,95/$4,00 за миллион токенов. Для сравнения, Claude Sonnet 4.6 стоит $3/$15 за миллион токенов.
MiMo Code — самый простой вариант для старта: команда curl -fsSL https://mimo.xiaomi.com/install | bash ставит инструмент, режим MiMo Auto работает бесплатно и без настройки.
Что говорят бенчмарки?
Здесь данные расходятся в зависимости от того, кто их публикует. MiniMax сама заявляет 59% на SWE-Bench Pro — это ниже, чем у Opus 4.8, но некоторые независимые агрегаторы дают MiniMax M3 80,5% на SWE-bench Verified против 72,7% у Sonnet 4.6. Разброс в 17–21 пункт между разными методиками тестирования — это норма: модель показывает разные результаты в разных обвязках.
Kimi K2.7 по независимому обзору Flowtivity достигла 60,4% на SWE-bench Verified — новый максимум среди открытых моделей, и обогнала Opus 4.8 по точности вызова инструментов через MCP.
Отдельное исследование Kili Technology показало: между лабораторными бенчмарками и реальной работой агентов разрыв в среднем составляет 37%.
Удобство и реальные отзывы
Взгляд независимого теста VentureBeat особенно интересен. Одну и ту же модель MiMo-V2.5-Pro прогнали через два разных движка: фирменный MiMo Code и Claude Code. MiMo Code показал 62% на SWE-bench Pro против 57% у Claude Code. Разница пришла не от модели, а исключительно от того, как агент организует работу. На задачах длиной более 200 шагов MiMo Code, по заявлению Xiaomi, не входит в "петли галлюцинаций", в которые попадает Claude Code.
Вывод
Реалистичный сценарий для нетехнического пользователя — подключить дешёвый API через OpenRouter или поставить MiMo Code и пользоваться бесплатным режимом. Это не равноценная замена Claude Code по качеству на сложных задачах, но это работающая страховка на случай, если завтра доступ к Claude станет недоступен без американского паспорта.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 240 |
| 9 | 🧠 ИИ – это источник нового взгляда на старые проблемы ученых и топ-менеджеров
Большинство ИИ систем, которые применяют ученые в науке и топ-менеджеры в бизнесе, делают одно из двух: либо извлекают что-то из неструктурированной базы знаний, либо перебирают и перепроверяют варианты в заданном пространстве. Это полезно и очень быстро. Но это не позволит сделать открытие или эвристический ход.
Чтобы немного разобраться в этом, обращаем внимание на новый препринт MIT, который проводит чёткую линию между тремя вещами:
➡️ Извлечение — найти что-то в базе.
➡️ Поиск — исследовать известное пространство в поисках нового.
➡️ Открытие — распознать, что само пространство нужно изменить.
Маркус Бюлер из MIT с коллегой Фионой Ван сформулировали это в форме математического фреймворка:
Научное открытие требует, чтобы пространство поиска само менялось, и ИИ-учёный должен инициировать этот сдвиг без вмешательства извне.
Бюлер — пионер AI for science, его лаборатория в MIT специализируется на мультиагентных системах, которые превращают разнородные данные в научные инсайты. Его новая работа переносит эту логику на уровень метода: не «найди ответ», а «обнаружь, в каком пространстве искать».
В чем суть?
В качестве примера авторы разработали подход к агентному открытию в материаловедении. В основном режиме система работает внутри заданной схемы. Но для открытия инициируется переход системы в другой режим: полученные новые данные постоянно сравниваются с исходным состоянием для выявления реальной новизны.
Ключевой механизм кроется в «типизированных артефактах»: каждый фрагмент информации несёт метаданные о том, что это за объект и откуда он взялся. Это отслеживание происхождения позволяет системе проверять собственную цепочку рассуждений и точно определять, дает ли её текущий подход сбой или порождает открытие.
Почему это важно для менеджера, а не только для учёного?
Различие «поиск / открытие» описывает не только проблему ИИ — оно описывает разницу между оптимизацией существующего бизнеса и созданием нового.
Большинство ИИ-инструментов, внедряемых в организациях сегодня, работают в режиме поиска: они оптимизируют процессы внутри заданной схемы. Это быстрее, дешевле, точнее. Но прорывные проекты случаются тогда, когда кто-то понимает, что старая схема устарела и нужна другая карта реальности.
Amazon не «искал» лучший способ доставлять книги, он понял, что сама новая логистика — это уже новый бизнес. Netflix не «оптимизировал» прокат DVD — он сменил носитель. Pixar не «улучшил» традиционную анимацию — он изменил инструмент и язык описания пространства.
Фреймворк Бюлера даёт этому явлению математическую форму: момент, когда «карта» устарела, не очевиден изнутри системы. Нужен механизм верификации — проверяемый граф данных, гипотез, провалов и принятых моделей, — который позволяет отличить «мы ищем не там» от «мы ищем не то».
Для менеджера прорывных проектов это означает конкретный вопрос при любом застревании команды: мы застряли потому, что не перебрали достаточно вариантов — или потому, что работаем с устаревшей картой проблемы? Это разные диагнозы и разные способы преодоления.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 225 |
| 10 | 📖 Переворот в рецензируемой науке
В начале июня на arXiv появилась статья двух физиков, которые в разделе о методологии добавили фразу, которую раньше никто не писал в рецензируемой науке: «Доказательство было получено в результате взаимодействия с Claude (Sonnet 4.6 и Opus 4.7) и проверено нами».
Один из авторов — Джорджо Паризи, лауреат Нобелевской премии по физике 2021 года за открытие взаимодействия беспорядка и флуктуаций в физических системах от атомного до планетарного масштаба. Его соавтор — Франческо Дзампони.
Что именно доказали?
В рамках теории полного нарушения симметрии реплик (fullRSB) для плотных твёрдых сфер в бесконечном измерении Паризи с коллегами ещё в 2014 году ввели три критических показателя a, b, c, описывающих переход к джаммингу. Первое соотношение b=(1+c)/2 было доказано аналитически. Второе — a+b=1 — численно проверено с произвольной точностью, но аналитически не доказывалось 12 лет.
За 40 раундов диалога Claude вернулся к теоретическому фреймворку, который создал сам Паризи, и заполнил недостающий элемент доказательства. Физики проверили результат вручную и подтвердили корректность.
Ирония ситуации в том, что уравнение a+b=1 относится именно к теории, за которую Паризи получил Нобелевскую премию.
Другие случаи, когда ИИ вышел за рамки просто помощника
1⃣ AlphaFold и Нобелевская премия по химии 2024 года.
Дэвид Бейкер из Вашингтонского университета, Демис Хассабис и Джон Джампер из Google DeepMind получили Нобелевскую премию по химии именно за ИИ-системы предсказания структуры белков. Это первый случай, когда Нобелевский комитет напрямую наградил разработчиков ИИ-инструмента, а не учёных, которые его использовали.
2⃣ OpenAI и задача об единичном расстоянии 2026 года.
Внутренняя модель OpenAI опровергла 80-летнюю гипотезу, применив метод из алгебраической теории чисел — башни классовых полей — к геометрической задаче, где никто не ожидал такой связи. Результат верифицировали лауреат Филдсовской премии Тим Гауэрс и Мелани Вуд из Гарварда. Группа математиков немедленно применила тот же метод и опровергла гипотезу сумм-произведений. Томас Блум написал: «Это превосходит самые смелые мои ожидания».
3⃣ Co-Scientist от Google DeepMind 2026 года.
Мультиагентная система независимо предложила механизм поведения cf-PICIs в антимикробной резистентности — тот же, который исследовательская группа только что открыла сама, но не успела опубликовать. Система не была знакома с неопубликованными данными, она вывела механизм из публичной литературы.
Почему это меняет норму?
В случае Паризи ключевое не то, что Claude «помог». Ключевое — что слово «помог» уже недостаточно точно. Нобелевский лауреат написал, что доказательство было получено через взаимодействие с Claude, и поставил модель в методологическом разделе рядом с «проверено нами». Это не сноска и не acknowledgment — это описание механизма получения результата.
Для учёных вывод практический: ИИ сейчас работает лучше всего не как автор, пишущий за человека, а как «суперколлега», способный удерживать в рабочей памяти весь корпус литературы по области, предлагать нестандартные переносы методов из смежных дисциплин и работать в режиме структурированного диалога с верификацией на каждом шаге. Именно так работал Паризи: 40 раундов, каждый с проверкой результата.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 331 |
| 11 | 🧪 OpenAI объявила третью фазу своего развития: от проведения исследований и разработки продуктов к превращению ИИ в массовую инфраструктуру
Сэм Альтман и главный исследователь OpenAI Якуб Пахоцки опубликовали текст Built to benefit everyone: our plan. По статусу это публичное стратегическое заявление о том, как компания видит следующий этап развития AGI.
Три фазы развития OpenAI:
➡️ Первая — исследования на пути к AGI.
➡️ Вторая началась, когда исследования стали продуктами: ChatGPT, API, корпоративные решения, обучение на реальном использовании.
➡️ Третья — сделать продвинутый ИИ «обильным», доступным, безопасным и достаточно простым, чтобы им могли пользоваться люди, компании и организации.
Поэтому корректнее говорить не о том, что «главный продукт теперь не чат-бот». ChatGPT остаётся ключевым продуктом и каналом доступа к ИИ. Но акцент смещается: OpenAI говорит уже не только о чат-боте как интерфейсе, а об ИИ как базовой инфраструктуре для экономики, науки, образования и повседневной жизни.
В тексте говорится о трех главных целя OpenAI:
1️⃣ построить автоматизированного ИИ-исследователя;
2️⃣ ускорить экономику через научный прогресс, рост производительности и новые возможности;
3️⃣ дать каждому человеку персонального AGI-помощника.
Самая важная часть — ИИ-исследователь
OpenAI пишет, что ИИ, способный делать AI research, станет определяющим фактором скорости прогресса уже в ближайшие годы. Но формулировка осторожная: речь не о машине, которая полностью заменяет исследователя, а о системе, которая ускоряет и всё больше автоматизирует исследовательский процесс, оставаясь управляемой, подотчётной и связанной с людьми. Это принципиально.
Если ИИ научится участвовать в научном цикле — читать литературу, находить ошибки, проверять гипотезы, писать код, проектировать эксперименты, сравнивать альтернативы и итеративно улучшать решения, — тогда экономический эффект будет намного глубже, чем от автоматизации офисных задач.
Наука — это верхний контур экономического роста. Новые лекарства, материалы, инженерные решения, энергетические технологии, биотехнологии и промышленные процессы появляются из исследовательского цикла. Ускорение науки означает ускорение будущей экономики.
Экспертная реакция сдержанная
The Decoder отмечает, что OpenAI фактически отходит от риторики полной автономии и подчёркивает связку человека и машины. Business Insider делает акцент на переходе компании к «третьей фазе» — массовой доступности и практической полезности ИИ. Reuters в параллельном материале об Anthropic показывает более широкий контекст: ведущие лаборатории всё чаще обсуждают не только ускорение, но и необходимость координации, контроля и даже возможного замедления фронтирных разработок при росте рисков.
Насколько мы далеко от автономного ИИ-исследователя?
Мы уже близко подошли к сильному исследовательскому ИИ-ассистенту и видим первое поколение исследовательских агентов, но мы крайне далеко от автономного учёного «под ключ».
Современные системы уже умеют делать обзоры литературы, писать код, анализировать данные, помогать в генерации гипотез. Но полноценный автономный исследователь должен отличать красивую гипотезу от воспроизводимого открытия, понимать ограничения данных, проверять собственные ошибки и не терять научную цель в многошаговом процессе.
Поэтому горизонт 2028 года выглядит правдоподобно для внутреннего ускорения сильных исследовательских команд в OpenAI и других frontier-лабораториях. Но массовый автономный ИИ-исследователь, которому можно безопасно поручить научную задачу от постановки до результата, скорее всего, потребует больше времени.
Главная новость здесь не в том, что OpenAI обещает очередной продукт. Главная новость в другом: крупнейшая ИИ-компания прямо называет автоматизацию научного исследования одним из центральных механизмов будущего экономического роста. Если эта ставка сработает, ИИ будет ускорять экономику не только через замену отдельных операций, а через ускорение появления новых знаний.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 437 |
| 12 | 📚 Александра Элбакян: девушка, которая взломала научные журналы и добавила к ним ИИ
Александра Элбакян запустила Sci-Bot. Это ИИ-чатбот, который отвечает на вопросы, опираясь непосредственно на корпус Sci-Hub: синтезирует ответы из найденных статей, даёт кликабельные ссылки и одним кликом открывает полный текст. Без подписки, без институционального доступа, без оплаты.
Систем поиска научной литературы уже много, поэтому нужно пояснить почему это замечательная новость.
Это не просто ещё один инструмент
Например, Google Scholar — это бесплатно, широко известно, но полного текста нет, только ссылки. Или Semantic Scholar — это отличный ИИ-поиск, но только открытые публикации. PubMed — это лишь биомедицина и только про публикации с открытым доступом. Elsevier, Web of Science, Springer — здесь за деньги или через университет. Consensus, Elicit — ИИ-поиск, но по открытой литературе. Perplexity в режиме Academic — ищет по открытому вебу.
Но большинство LLM при обучении не прошли за барьеры Elsevier и Springer. Sci-Hub прошёл и накапливает архив с 2011 года, не считаясь с авторским правом. Правда, есть проблема с публикациями последних лет.
Что умеет Sci-Bot технологически?
Это RAG над корпусом Sci-Hub. Принципиальное отличие от обычного LLM: модель не генерирует ответ из выученных паттернов, она сначала ищет релевантные статьи, потом формирует ответ на основе найденного. Именно поэтому риск «галлюцинаций» здесь низкий: ответ привязан к конкретным текстам, которые можно открыть прям в системе.
Об Александре Элбакян
Sci-Hub основала Александра Элбакян в 2011 году как студентка из Казахстана, которая не могла позволить себе платить $30 за доступ к каждой научной статье. Она написала скрипт, который получал тексты через украденные институциональные логины, и выложила их в открытый доступ. За 15 лет архив вырос до более чем 88 млн документов (~100 ТБ), покрывает свыше 90% всех статей из крупных журналов до 2022 года и обслуживает почти 2,8 млн обращений в сутки при полном отсутствии рекламы, подписки и регистрации.
Элбакян намеренно отвергает термин «пиратство», называя своё детище red open access и политическим актом, а не технической услугой: «доступ к информации — право человека».
Sci-Net — следующий слой той же идеологии: не автоматический обход пейволов, а взаимопомощь живых людей. Исследователи с институциональным доступом выкладывают статьи по запросу, за что получают Sci-Hub Tokens на блокчейне Solana, а сам материал после загрузки становится вечно бесплатным для всех без регистрации.
По сути оба проекта — это вызов системе научных публикаций: коммерческие издатели Elsevier, Springer и Wiley зарабатывают миллиарды на публикации исследований, которые оплачивались государством и писались учёными бесплатно, и Элбакян принципиально не намерена с этим мириться.
Честно об ограничениях
Альфа-версия отвечает на один вопрос без продолжения беседы — диалога пока нет. Последние несколько лет исследований в базе отсутствуют — издатели ужесточили защиту от Sci-Hub. Ещё одно ограничение: отбор источников не всегда самый релевантный, бот может дать ответ, но не из оптимальных статей.
Кому нужен Sci-Bot прямо сейчас?
Для учёных из университетов с полным институциональным доступом, возможно, это не первый выбор: им важны свежие публикации, которых здесь нет. Но независимый исследователь, журналист, популяризатор науки, врач из провинциальной больницы, аспирант из страны с ограниченным университетским бюджетом — все они традиционно видят только абстракты. Sci-Bot меняет это: инструмент превращает Sci-Hub из пассивного хранилища PDF в активную систему синтеза знаний.
Как получить доступ
Бесплатно. Из России доступно напрямую, из ряда других стран через VPN, поскольку Sci-Hub продолжает работать под новыми доменами вопреки судебным решениям в нескольких юрисдикциях. Регистрации нет, платёжных данных не нужно. Параллельно у Элбакян работает Sci-Net — платформа, где можно запросить статью, отсутствующую в Sci-Hub, у учёных с институциональным доступом.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 412 |
| 13 | 🧿 Модель мира: технология, которая станет важнее LLM
В начале июня Фей-Фей Ли опубликовала новую статью «A Functional Taxonomy of World Models», которая начинается эпиграфом из Витгенштейна: «Мир — это всё, что имеет место». И немедленно продолжает: «Мир не состоит из слов».
Этой статьей компания Ли World Labs ($1,23 млрд инвестиций от AMD, NVIDIA, Autodesk) ответила на вопрос, который постоянно заставляет ИИ-сообщество спорить: что именно мы строим в ИИ-системе, когда говорим «модель мира»?
Что такое модели мира и почему это не LLM?
В нашем канале мы постоянно следим за этой темой. Кратко напомним: языковые модели выучили статистическую структуру текста, как слова следуют друг за другом. Модели мира должны выучить статистическую структуру пространства и времени: как свет падает на поверхность, как объекты реагируют на силу, как физика работает без описания физики. Это принципиально разные подходы.
Ли предложила три функциональных класса систем, связанных с моделями мира:
1️⃣ Renderer: генерирует высококачественные визуальные представления из входных данных. Большинство того, что сейчас называется «моделями мира», — это рендеры. Ли отмечает, что системы, застрявшие на этом уровне, вообще не содержат настоящих моделей мира — это просто дорогостоящие видеогенераторы реалистичных изображений.
2️⃣ Simulator: возвращает геометрически и физически достоверные параметры состояния. Это уже не картинка, а физика объекта и процесса. Объект падает, потому что модель понимает гравитацию, а не потому что видела много видео падающих предметов.
3️⃣ Planner: агент использует симулятор для планирования последовательности действий. Мир познаётся через цикл: агент совершает действие ➡️ состояние меняется ➡️ агент наблюдает изменение ➡️ планирует следующий шаг. Это POMDP — математическая основа, которую нейробиологи и ИИ-исследователи использовали независимо друг от друга, называя разными словами.
Кто вообще занимается моделями мира и каковы инвестиции в это направление?
✔️ World Labs — $1 млрд при оценке $5,4 млрд.
✔️ AMI Labs — $1,03 млрд при оценке $3,5 млрд.
✔️ Physical Intelligence — $600 млн при оценке $5,6 млрд.
✔️ Wayve — $1,2 млрд при оценке $8,6 млрд.
За это направление идёт одна из крупнейших инвестиционных гонок в ИИ-индустрии.
Ян Лекун, основатель стартапа AMI Labs, давно утверждает: LLM никогда не дойдут до настоящего интеллекта, потому что текст не содержит физики. Его I-JEPA и V-JEPA — модели на основе самосупервизируемых предсказаний в пространстве признаков, а не пикселей. Мозг не предсказывает конкретные ощущения, он предсказывает абстрактные состояния мира. Лекун и Ли расходятся в деталях архитектуры, но сходятся в главном тезисе: физический мир нельзя выучить из текста.
Связь с нейронаукой и как это касается природы разума
Научный руководитель докторантуры Фей-Фей Ли — Кристоф Кох, нейробиолог, ближайший соратник Фрэнсиса Крика в исследованиях сознания.
Теория предиктивного кодирования утверждает: мозг постоянно строит и обновляет внутреннюю модель реальности, минимизируя разницу между предсказанным и наблюдаемым. Это ровно тот же цикл, который Ли описывает математически как POMDP.
Нейробиология и ИИ пришли к одному и тому же описанию с разных сторон — и не знали об этом, потому что говорили на разных языках.
Таксономия Ли создаёт точку пересечения:
Рендеринг ➡️ это то, как мозг генерирует «образ» реальности.
Симуляция ➡️ это предсказательная модель физических законов.
Планирование ➡️ это то, что классически называют «произвольным действием».
Почему это важнее текущей гонки LLM?
LLM масштабируются на тексте и достигают потолка там, где нужна физическая интуиция. Робот, обученный на инструкциях, не понимает, что чашка упадёт, если её толкнуть, если только не видел тысячи примеров. Модель мира понимает гравитацию как структуру, а не как паттерн.
Ли формулирует это так: языковые модели освоили концепции и рассуждения. World models — это следующий рубеж, пространственный интеллект. Пространство и время не передаётся словами.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 257 |
| 14 | ⚔️ Начинается война SEO и GEO
В июне 2026 года произошло то, что аналитики прогнозировали лишь через год: боты впервые обогнали людей в HTTPS-трафике. По данным Cloudflare Radar, 57,5% всех обращений к страницам — это работа автоматизированных агентов, большинство из которых ИИ-системы, собирающие информацию по чьему-то запросу.
CEO Cloudflare Мэттью Принс написал: «Welp, that happened faster than I predicted».
Одновременно Ahrefs опубликовал анализ 1 млрд строк данных о том, что именно цитирует ChatGPT: 67% самых популярных источников — ресурсы с низкой частотой обновления и маркетинговые материалы (Wikipedia — 29,7%, главные страницы сайтов — 23,8%, магазины приложений — 6,6%).
Главная аномалия: 28,3% страниц, которые ChatGPT цитирует чаще всего, имеют нулевую видимость в Google. Их не видит поисковик — но видит ИИ-агент. Это изменение природы аудитории.
Два параллельных рынка видимости
SEO (Search Engine Optimization) и GEO (Generative Engine Optimization) — разные игры с разными правилами. Поисковый алгоритм оценивает граф ссылок, свежесть, глубину расположения страницы. LLM оценивает семантическую плотность, подтверждение достоверности и, главное, наличие такого источника в обучающих данных.
Поэтому страница, которая была авторитетной в 2021–2023 годах, может цитироваться ChatGPT в 2026-м, даже если Google её давно понизил в выдаче. Модель «помнит» источник по обучению. Новый контент, опубликованный вчера, для LLM без RAG-надстройки не существует вообще.
Для автора это означает то, что один и тот же материал нужно оценивать в двух системах координат одновременно.
Как повысить агентную видимость?
1⃣ ИИ-агент извлекает конкретные утверждения, цифры, определения — не сюжет.
2⃣ Формат «Топ-X» доминирует (40% самых цитируемых ChatGPT страниц), потому что из него легко извлечь дискретные факты.
3⃣ Уникальные данные и исследования, на которые ссылаются другие придают авторитет: агент доверяет источникам, которые цитируют другие авторитетные тексты.
4⃣ Присутствие в Wikipedia или ссылки из энциклопедических ресурсов — по-прежнему самый надёжный путь в обучающий корпус следующего поколения моделей.
Проблема измерения и реклама
Агент читает страницу один раз и кэширует данные. Он не возвращается, не кликает по рекламе, не генерирует повторный трафик. При этом информация из материала может «транслироваться» миллионам пользователей — через ответы ChatGPT, Perplexity, Gemini.
Прямое следствие — метрика «просмотры страницы» разрывается с реальным охватом. Традиционная аналитика не регистрирует большинство агентных посещений и не измеряет вторичное распространение через ИИ-ответы.
Инструменты нового поколения — AEO Sensor (HubSpot), Profound, GEOrank — измеряют «присутствие бренда в ответах LLM», но не источниковую атрибуцию. Пока полноценной замены для авторов нет. Рабочий подход: отслеживать рост брендированных запросов в поиске и прямого трафика. Они косвенно отражают влияние ИИ-цитирования.
Теперь о рекламных блоках в тексте. Контекстная реклама строилась на предположении, что человек прочитает материал и увидит баннер. ИИ-агент объявление не видит, не кликает и даже не передаёт пользователю. Рекламная модель, основанная на показах, теряет смысл для той части трафика, которая уже перешла 50% отметку. Новая монетизация для авторов — не рекламный инвентарь, а цитируемость: быть источником, которому доверяют агенты, и затем конвертировать «агентную известность» в прямые обращения и аудиторию.
Основные выводы
📍 Пишите для извлечения, а не для чтения: структурированные утверждения, цифры, определения в начале разделов.
📍 GEO и SEO — разные задачи: материал должен быть оптимизирован для обоих рынков, иначе он невидим для половины аудитории.
📍 Измерение охвата сломано: просмотры страниц занижают реальный охват в новой среде.
📍 Реклама по показам теряет смысл: агентная аудитория не конвертируется в клики.
📍 Авторитет в ИИ-эпоху строится иначе: через уникальные данные, ссылки от авторитетных хабов и присутствие в обучающих корпусах, а не через трафик.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 284 |
| 15 | ❗ Мо Гавдат: следующие 15 лет будут адом до рая
Один из крупнейших мировых экспертов Мо Гавдат дал интервью для Diary of a CEO с заголовком "You Only Have 3 Years Left Before It Hits".
Гавдат — бывший Chief Business Officer Google X — подразделения, где рождались Waymo, Project Loon и Wing. Он ушёл из компании в 2018 году после смерти сына Али, написал книги "Solve for Happy" и "Scary Smart", которые опередили общественную дискуссию о важности счастья человека в современном мире. Сейчас Гавдат строит AI-стартап Emma.love.
Его авторитет — не академический. Он был в команде, где принимались решения, определившие современный технологический мир. Его прогнозы — сочетание внутреннего знания и моральной позиции.
Главные идеи из интервью
Он приводит сравнение, от которого нельзя отмахнуться: Великая депрессия уничтожила всего 6% рабочих мест за десятилетие — Гавдат же говорит о 30% сокращении к 2028 году в ряде секторов. Масштаб больше в 5 раз.
Главный механизм капитализма — арбитраж труда, и он начинает ломаться: компания всегда платит человеку меньше, чем он создаёт. Но когда ИИ выполняет задачи за цену, стремящуюся к нулю, механизм разрушается. Покупательская способность общества падает раньше, чем появляется новая занятость.
Среднего класса не будет. Гавдат утверждает: «Если вы не в топ-0.1%, вы крестьянин. Среднего класса нет. Новые рабочие места от ИИ — это 100% бессмыслица».
Главное противоречие
В майском выпуске MIT Technology Review при этом говорится, что данные пока не подтверждают волны увольнений сотрудников. Цифра в 30% — это интуитивое предупреждение, а не эконометрический прогноз. Исторически каждая технологическая революция в итоге порождала больше рабочих мест, чем уничтожала. Но вопрос в том, сколько времени занимает адаптация. Гавдат считает, что в этот раз будет недостаточно.
Это коснется всех?
Развитые страны пострадают первыми и сильнее всего. Автоматизация начинается с офисных профессий — аналитики, юристы, маркетологи, менеджеры среднего звена.
Развивающиеся страны, казалось, в безопасности: дешёвый труд был их конкурентным преимуществом. Теперь ИИ обнуляет это преимущество раньше, чем у них появится инфраструктура для переподготовки. Россия здесь не исключение: большой сектор офисных профессий уязвим не меньше, чем в развитых странах.
Что делать?
Гавдат не даёт утешительных советов, но его логика подсказывает направление:
✅ Стать лучшим в своём деле: выживет не «хороший», а тот, кто незаменим в своём контексте.
✅ Инвестировать в неавтоматизируемые навыки: эмпатию, лидерство, этический суд, творческое мышление.
✅ Не ждать, пока шок придёт: у нас есть окно в три года, говорит Гавдат, 2026–2029 — самые критические годы.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 369 |
| 16 | 💻 Самый популярный блогер мира внезапно выпустил конкурента ChatGPT
Несколько дней назад YouTube блогер Феликс Шёльберг, известный во всем мире как PewDiePie, выложил в открытый доступ новую платформу Odysseus. Он сообщил об этом своей аудитории фразой: «MY trillion $Dollar Project is finally OUT». И уже за первые 48 часов получил 30 000 звёзд на GitHub. Многие стартапы с миллионными венчурными деньгами не видят такого за целый год.
PewDiePie — это автор обзоров видеоигр и рассказчик о своих путешествиях. Но за последний год он тихо переквалифицировался: собрал свой GPU-суперкомпьютер за $20 000, дообучил собственную модель и задокументировал всё публично. Результат — не ИИ-модель и не чатбот, а полноценный ИИ-воркспейс, который работает целиком на железе частного пользователя.
Что умеет Odysseus?
Довольно многое: Chat + Agents + Deep Research + Email + Model Serving + Markdown-редактор + слепое сравнение моделей. Агенты выполняют команды в терминале, редактируют файлы, ходят в сеть. Cookbook — автоматически сканирует ваше железо и скачивает подходящие веса. Никакой телеметрии, никакой подписки, никаких данных на чужих серверах.
Три варианта запуска без покупок:
1️⃣ Бесплатно через API: подключаете OpenAI или Anthropic API-ключ и работаете в одном интерфейсе вместо пяти разных вкладок. Данные хранятся локально.
2️⃣ Локально на маке M2/M3: модели 7B–14B через Ollama работают плавно, бесплатно, всё оффлайн.
3️⃣ Полноценно на GPU (RTX 3080/4070 и выше): модели 70B+ прямо на вашем железе, ответы быстрые, полный контроль.
Самая сложная часть проекта — не кодинг
PewDiePie нужно было правильно решить, для кого это. Все существующие решения, такие как Open WebUI, LM Studio, AnythingLLM, сделаны для разработчиков.
Odysseus целится в обычного человека, чья первая реакция на Ollama обычно выражается в большом удивлении.
В итоге получилось сделать интерфейс без настройки CUDA, без ручной загрузки весов, без JSON-конфигов. Слоган на сайте тоже подкупает: «No sales team, no demo request, no Trojan horse».
Кому это вообще может быть нужно?
Например, журналисту, ведущему расследование, у которого источники и документы не должны уходить за пределы машины. Еще юрист или врач, работающий с персональными данными пациентов. Малый бизнес, где вся переписка с ИИ есть коммерческая тайна, а не обучающие данные OpenAI. Любой, кому надоело платить $20/мес за Claude, $20 за ChatGPT и ещё $20 за Gemini.
30 000 звёзд за 48 часов набрал не разработчик, а блогер, которому доверяет аудитория и который построил что-то, в чём он сам нуждался. Новая ниша выглядит именно так: не сверхмодель, а инструмент с душой, экспертизой и пониманием проблемы, которую никто рядом не решал достаточно доступно.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 350 |
| 17 | ➕ ИИ не просто решил задачу 80-летней давности. Он показал математикам новый способ думать
20 мая внутренняя reasoning-модель OpenAI опровергла гипотезу, которую математик Пол Эрдёш сформулировал в 1946 году и которую 80 лет никто не мог ни доказать, ни опровергнуть. Само по себе это уже большое событие. Но интереснее то, что произошло дальше.
Математики Томас Блум, Уилл Сэвин, Карл Шилдкрат и Дмитрий Железов из Манчестерского университета взяла ключевой приём из доказательства OpenAI и немедленно опровергла уже другую гипотезу сумм-произведений для действительных чисел — о соотношении между множествами сумм и произведений элементов конечного множества. Эта гипотеза считалась верной для целых и действительных чисел одновременно и не вызывала сомнений ни у кого из специалистов.
Лауреат Филдсовской премии Тим Гауэрс и математик Мелани Вуд из Гарварда подтвердили доказательство. Вуд при этом заметила: если бы эксперты, которые разбирали ответ модели, потратили то же время на поиск контрпримера, они бы, вероятно, нашли его сами. Метод не был принципиально недоступен людям, но ИИ помог его найти.
Что-то похожее было и после победы AlphaGo над Ли Седолем в 2016 году, когда игроки в го начали копировать тактики, которые ИИ применял впервые. За несколько лет средний уровень игры в го среди людей заметно вырос. Модель не заменила игроков — она расширила их пространство возможных ходов.
Здесь происходит аналогичное. Модель не решала задачу традиционными геометрическими методами — она зашла с другого конца и применила аппарат из смежной области.
Математики увидели приём, поняли его структуру и сразу воспользовались им там, где сами не догадались бы искать.
Что именно перенесли математики?
Задача о единичном расстоянии относится к геометрии: как расставить n точек на плоскости, чтобы число пар на расстоянии равное единице было максимальным? 80 лет все предполагали, что лучшее — это квадратные решётки. Модель OpenAI нашла бесконечные семейства конфигураций.
Модель решила геометрическую задачу инструментами алгебраической теории чисел — бесконечными башнями классовых полей и теоремой Голода-Шафаревича 1964 года. Эти инструменты теоретики чисел знали хорошо. Никто не думал их применять к вопросу о точках на плоскости. Связь была неочевидна.
Именно этот приём — перенос башен классовых полей в геометрический контекст — математики взяли и немедленно применили к другой задаче.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 392 |
| 18 | Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🧑⚖️ Верховный суд впервые урегулировал применение ИИ в ходе судебного разбирательства
Впервые на уровне пленума разъяснено: если сторона представила сведения о фактах, полученных с использованием нейросети, она обязана уведомить об этом суд.
⚡️ В реестр российского ПО внесли первый ИИ для чиновников
Задача платформы «ИИ-ассистент для чиновников» — помощь в принятии решений, удаление ненормативных выражений из отчетов и создание списков поручений.
📞 Билайн AI внедрила систему видеоаналитики для мониторинга качества обслуживания в 10 поликлиниках Поволжья
За 6 месяцев ИИ помог сократить очереди на 30% и снизить число инцидентов с пустой стойкой и длинными очередями на 57%.
🍏 ИИ-решения принесли Х5 5 млрд руб. дополнительной операционной прибыли
С 2025 г. компания начала промышленное применение ИИ в ряде направлений — от коммерции и логистики до клиентского опыта и корпоративных функций.
🏦 Исследователи «Т-Технологий» разработали новый метод обучения визуально-языковых моделей
Эксперименты показали, что при дообучении методом VL-DAC модели требуется в 1,5—2,5 раза меньше шагов для успешного выполнения задачи.
⚡️ Институт ИИ и цифровых наук ВШЭ представил платформу предиктивной аналитики для бизнеса
Система позволяет на ранних стадиях идентифицировать аномалии, основываясь на данных компании и внешних источниках.
🖥 Anthropic стала самой дорогой компанией в сфере ИИ, обогнав OpenAI
В результате рыночная капитализация компании достигла $965 млрд.
👱♂️ Великобритания с 2027 года будет использовать ИИ для выявления реального возраста беженцев
Сотрудники иммиграционной службы будут применять ИИ-систему "оценки возраста лица" для определения возраста через "просмотр фотографии лица".
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 303 |
| 19 | 🧠 Глава DeepMind Демис Хассабис впервые публично использовал слово «сингулярность». Почему это важно?
Он закрыл ежегодную конференцию Google I/O фразой "мы стоим у подножия сингулярности" намеренно, и затем подтвердил это в интервью Axios: слово выбрано, чтобы заставить экономистов и политиков воспринимать темп происходящих изменений максимально серьёзно.
Почему это высказывание заслуживает отдельного внимания, хотя кажется, что это просто красивая фраза?
Хассабис — нейроучёный по образованию, нобелевский лауреат по химии за AlphaFold, CEO исследовательского подразделения Google, которое первым решило задачу создания ИИ-алгоритма для победы над человеком в Go, проектирования модели сворачивание белка и разработки подхода для освоения ИИ формальной математики.
У него редкая комбинация компетенций: понимание того, что происходит внутри ИИ-моделей с точки зрения вычислительной нейронауки, и понимание того, что такое интеллект с точки зрения биологии. До Google I/O его прогноз появления AGI звучал как «после 2030». Теперь 2029 назван реальным возможным сроком для появления AGI. И это сдвиг в его оценке, предполагающий более быстрое наступление новой эры.
Он предложил конкретный бенчмарк — тест Эйнштейна: взять фронтирную модель, дать ей блок знаний человечества до 1901 года и проверить, может ли она самостоятельно прийти к открытиям 1905-го года — специальной теории относительности, фотоэффекту, броуновскому движению, анализу устройства и свойств атома. Модель должна построить эти знания "с нуля" из первичных принципов и фактов.
Хассабис говорит: «Сегодня системы явно не могут это сделать. Но я не вижу причины, почему в будущем (...уже до 2030...) они не смогут». Это мягкая, но однозначная формулировка от человека, видящего процесс изнутри.
Многие мировые издания цитируют Хассабиса: «Можно представить агентную эру 2027 года как форму репетиции. Мы учимся управлять системами, которые действуют автономно». И в результате мы увидим масштаб воздействия ИИ на технологическое развитие как 100-кратный от Промышленной революции эффект и всего лишь за десятилетие.
Самое сильное раздражение Хассабиса связно с тем, что его не понимают: «Мои друзья-экономисты, по-моему, всё ещё не воспринимают достаточно серьёзно будущие перемены».
Параллельно сооснователь Anthropic Джек Кларк в Оксфорде спрогнозировал, что в 2028 ИИ уже будет проектировать следующую версию самого себя.
Два соосновтеля двух ведущих лабораторий в одну неделю публично и с цифрами сделали важное заявление с похожим смыслом. И у Google и Anthropic нет мотива синхронизировать такие заявления. Это предупреждение всему миру, которое основано на реальном наблюдении за процессом, а не на посылах для инвесторов.
Конечно, AGI-прогнозы выходят каждые несколько лет, и понятие остаётся аморфным: тест Эйнштейна нельзя верифицировать без дополнительных договорённостей о критериях. Важно другое. Люди, видящие процесс изнутри, начали говорить одинаково. Если они правы хотя бы приблизительно, решения, принимаемые сегодня в регулировании, безопасности и корпоративной стратегии, имеют значительно более короткий горизонт, чем принято считать.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 332 |
| 20 | Дайджест интересных новостей из мира ИИ, созданный нами с использованием нейросетей 📆
🇷🇺 Владимир Путин заявил о создании международного альянса в области ИИ по инициативе РФ
Также Президент РФ предложил провести в 2027 году на территории России встречу на высоком уровне, посвященную вопросам развития суверенных моделей ИИ.
📑 Комитет Госдумы по экономической политике одобрил законопроект, упрощающий введение ЭПР в сфере ИИ-инноваций
Таким образом устранится одно из ключевых препятствий для внедрения ИИ в областях, где нормативное регулирование еще не сформировано.
🧑⚖️ Верховный суд России впервые обобщит судебную практику по делам, связанным с использованием ИИ
Судам предстоит оценить, насколько часто использование ИИ становится предметом судебных споров или совершенных правонарушений.
⛽️ «Газпром нефть» разработала ИИ-сервис для экологичного поиска месторождений с учетом природных особенностей регионов
Система создает высокоточные модели участков и планирует геологоразведку в обход лесов ценных и редких пород деревьев.
🧠 Ученые СПбПУ создали ИИ-модель для анализа активности нейронов мозга
В основе созданной нейросети лежит архитектура, которая изначально была разработана для анализа человеческого языка.
🛒 Fix Price внедряет собственный ИИ-сервис для контроля наличия товаров на полках и актуальности ценников
По итогам внедрения сервиса OSA в 500 магазинах, в отдельных точках зафиксирован прирост оборота до 2%.
💜 Компания Марка Цукерберга Biohub представила новую ИИ-модель для исследования белков
Система научилась настолько точно моделировать биологические процессы, что ученые могут проектировать белки на компьютере, а затем подтверждать их работоспособность в лаборатории.
🇨🇳 Китай вводит ограничения на поездки за границу для стратегически важных ИИ-специалистов
Под требование получать разрешение на поездку в другие страны попали люди, разрабатывающие ИИ-системы, включая высокопоставленных сотрудников Alibaba и DeepSeek.
💬 Тест Тьюринга. События в сфере ИИ. Подписаться | 320 |
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
