Малоизвестное интересное
Авторский взгляд через призму новейших исследований на наше понимание реальности, человеческой сущности и того, как ИИ меняет их. Зарегистрирован в РКН. Зеркало канала - https://dzen.ru/the_world_is_not_easy Рекламы и ВП в канале нет. Пишите на @karelovs
نمایش بیشتر📈 تحلیل کانال تلگرام Малоизвестное интересное
کانال Малоизвестное интересное (@theworldisnoteasy) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 73 843 مشترک است و جایگاه 185 را در دسته حقایق و رتبه 7 967 را در منطقه روسيا دارد.
📊 شاخصهای مخاطب و پویایی
از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 73 843 مشترک جذب کرده است.
بر اساس آخرین دادهها در تاریخ 12 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر 355 و در ۲۴ ساعت گذشته برابر 4 بوده و همچنان دسترسی گستردهای حفظ شده است.
- وضعیت تأیید: تأیید نشده
- نرخ تعامل (ER): میانگین تعامل مخاطب 20.61% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 14.16% واکنش نسبت به کل مشترکان کسب میکند.
- دسترسی پستها: هر پست به طور میانگین 15 215 بازدید دریافت میکند. در اولین روز معمولاً 10 456 بازدید جمعآوری میشود.
- واکنشها و تعامل: مخاطبان بهطور فعال حمایت میکنند؛ میانگین واکنش به هر پست 154 است.
- علایق موضوعی: محتوا بر موضوعات کلیدی مانند разум, llm, agi, клетка, физика تمرکز دارد.
📝 توضیح و سیاست محتوایی
نویسنده این فضا را محل بیان دیدگاههای شخصی توصیف میکند:
“Авторский взгляд через призму новейших исследований на наше понимание реальности, человеческой сущности и того, как ИИ меняет их. Зарегистрирован в РКН. Зеркало канала - https://dzen.ru/the_world_is_not_easy
Рекламы и ВП в канале нет.
Пишите на @kar...”
به لطف بهروزرسانیهای پرتکرار (آخرین داده در تاریخ 13 ژوئن, 2026)، کانال همواره بهروز و دارای دسترسی بالاست. تحلیلها نشان میدهد مخاطبان بهطور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته حقایق تبدیل کردهاند.
در حال بارگیری داده...
| تاریخ | رشد مشترکین | اشارات | کانالها | |
| 13 ژوئن | +8 | |||
| 12 ژوئن | +8 | |||
| 11 ژوئن | +24 | |||
| 10 ژوئن | +13 | |||
| 09 ژوئن | +28 | |||
| 08 ژوئن | +7 | |||
| 07 ژوئن | +12 | |||
| 06 ژوئن | +3 | |||
| 05 ژوئن | +4 | |||
| 04 ژوئن | +15 | |||
| 03 ژوئن | +15 | |||
| 02 ژوئن | +22 | |||
| 01 ژوئن | +5 |
Дикий факт из истории. Ещё в 1980-х годах младенцев могли оперировать без анестезии — с минимальным обезболиванием или просто на мышечных релаксантах. Врачи не были садистами. Просто медицинская культура того времени не умела видеть «субъекта» там, где нет речи, памяти и взрослого «Я». Нет языка — значит, нет и сознания, а крик — просто рефлекс.У хирургов 1980-х и у нас сегодня одинаковая слепота — и она не случайная. Это выгодное незнание: мы не видим субъекта там, где его признание разрушает привычный порядок вещей. Сегодня это кажется варварством. А завтра варварством назовут то, как мы сегодня фабричным методом выращиваем и убиваем кур, свиней и осьминогов, уже почти не сомневаясь, что там есть страх, боль, привязанность и переживание. Главный урок истории сознания крайне нелицеприятен.
Общество не просто “не знает”, кто чувствует. Оно часто не хочет знать — особенно когда признание чужого опыта страданий делает привычный порядок морально дорогим.Вот и получается, что сознание – это не только величайшая научная загадка. Это еще и детектор нашей готовности видеть страдание там, где видеть его нам неудобно. #Сознание #Мораль
| 2 | У них сверхчеловеческая скорость и маневренность
В соревнованиях людей с ИИ в управлении дронами, шансов у людей мало уже сейчас, а через год шансы станут нулевыми
Чтобы оценить сверхинтеллект существующих ИИ, недостаточно поговорить о теории струн с ИИ-чатботом. Чтобы физически ощутить сверхчеловеческие способности ИИ, нужно увидеть их в реальном физическом мире.
Исследователи из Цюрихского университета и Google DeepMind продемонстрировали, как обучить дроны соревноваться друг с другом и превосходить самых опытных пилотов-людей. Это исследование имеет довольно пугающие последствия для будущего войны. Оно на практике показывает, что люди не смогут соперничать в контурах управления военными действиями с ИИ-системами из-за своих физических ограничений. И дроны будут лишь началом процесса замещения людей на войне.
В этом исследовании ИИ соревновались не со средним FPV-оператором дрона (от англ. First Person View «вид от первого лица» - это дрон, управляемый оператором, который видит полет «глазами дрона» благодаря камере на борту, передающей видео в реальном времени на специальные очки, шлем или экран).
Человечество в этих соревнованиях представлял Марвин Шеппер - пятикратный чемпион Швейцарии, занимающий 4-е место в мировом рейтинге. Одну из испытательных гонок Шеппера против 3-х ИИ вы видите на приложенном видео.
Итог соревнований: ИИ-агенты превосходят пилота-чемпиона в многоагентных гонках:
• по скорости (через отношение скоростей): на 19.6% по лучшему кругу и на 6.5% по полному финишу;
• а по устойчивости к столкновениям и срывам (по % “недопройденной части гонки”) аж в 5 раз.
Вывод таков: ИИ уже превосходит чемпиона-человека в одном из ключевых компонентов будущих битв дронов - короткой высокоскоростной многоагентной навигации с избеганием столкновений; но до абсолютной победы ИИ ещё не хватает переносимости на новые трассы и устойчивости в долгом бою.
Что особенно важно для замены людей ИИ-системами на войне (и не только применительно к дронам): человеческая слабость, проявляется в азарте и ярости. Оператор-человек предпринимал более рискованные действия, пытаясь не проиграть. Как пишут исследователи «пилот-человек, отстающий от автономных агентов, пытался совершать все более агрессивные маневры, чтобы сократить отставание, что часто приводило к столкновениям или потере управления».
А ведь это относится к любому бою.
Материалы и несколько видео гонок на сайте проекта.
#БПЛА | 30 529 |
| 3 | Азимов ошибся. Но почти угадал.
В начале 1940-х Айзек Азимов придумал «психоисторию» – математическую науку, способную предсказывать судьбы цивилизаций. Красивая идея. Почти невозможная. Сам Азимов считал её чистой фантастикой: у человечества просто не было приборов такого масштаба.
Не было способа извлекать психологические переменные из исторических корпусов. Измерять когнитивные стили мёртвых культур. Моделировать развилки, не подсовывая прошлому наше знание финала.
Теперь такие приборы появились. Но получилось не совсем то, о чем мечтал фантаст.
Азимов описал науку, которая предсказывает исход. ИИ дал нам нечто более странное: метанауку, которая реконструирует горизонт.
Не «что произойдёт?», а «что было доступно?» Какие варианты будущего уже лежали внутри прошлого – почти видимые, запрещённые, немыслимые или просто ещё не имевшие языка?
Я называю это археологией возможного. И её приборная панель уже работает, меняя сам режим гуманитарного знания. Она собирается из четырех радикально новых элементов:
• Искусственная слепота: языковые модели, которые попытались запереть в текстовом карантине жесткой датировки (например, до 1931 года), заставляя их мыслить в полном неведении об атомной бомбе, ООН и компьютерах.
• Цифровой георадар смыслов: алгоритмы типа Aeneas от DeepMind, которые возвращают разбитым латинским надписям их время, место и сеть социальных связей.
• Психоанализ мертвых культур: системы, извлекающие из древних текстов измеримые следы коллективных ценностей и норм.
• Контрфактические симуляторы: позволяющие исследовать исторические траектории не как попсовое «что если», а как эксперименты с границами мыслимого
Вместе это уже не просто набор интересных ИИ-инструментов. Это сдвиг в самом режиме гуманитарного знания.
История перестаёт быть коридором, ведущим из прошлого к нам. Она становится кладбищем несбывшихся вариантов будущего – и впервые у нас появляются инструменты, чтобы это кладбище вскрыть.
С новым инструментарием «тест Эйнштейна» (сможет ли ИИ с нуля вывести общую теорию относительности, будучи запертым в знаниях 1911 года) – это экзамен не для машины. Это экзамен для самой истории. Была ли ОТО уже скрыта в интеллектуальном слое начала века как отпечаток в камне, или она требовала удара молнии? Это вопрос о природе открытия.
А еще – это вопрос о власти. Тот, кто умеет вычислять скрытые горизонты возможного, получает контроль не только над памятью, но и над воображением.
Полный текст эссе – своего рода методологический манифест новой метанауки археология возможного, – уже доступен для патронов канала.
В этом эссе:
1) Почему археология возможного – это не альтернативная история, не цифровая некромантия и не очередная ИИ-новинка, а, возможно, первая гуманитарная метанаука эпохи ИИ.
2) Подробный разбор четырех инструментов археологии возможного и механики их работы.
3) Почему этот подход честнее азимовской психоистории, не обещая предсказать будущее, но позволяя понять, как цивилизации видят, теряют и закрывают свои будущие.
4) И главное: как методы археологии возможного позволяют раскапывать наше собственное настоящее, находя в сегодняшнем шуме и странных аномалиях кости будущей цивилизационной нормы.
Вскрываем слои будущего здесь [1, 2, 3, 4]
#Футуроархеология #АрхеологияВозможного | 11 077 |
| 4 | Мировую экономику может ждать статистический ИИ-Чернобыль
Главный аргумент скептиков сегодня звучит убедительно: если ИИ так важен, где он в экономике? ВВП растёт умеренно, производительность не взлетела, занятость держится. Значит, большой экономики ИИ пока нет.
Peterson Institute for International Economics предлагает другую и куда более тревожную версию.
ИИ может быть не отсутствующей революцией, а революцией, проходящей в зоне статистической невидимости. Номинально сектор ещё невелик – около $250 млрд в США в 2025 году, менее 1% ВВП. Но темпы роста уже не из обычной человеческой экономики: расходы на ИИ-вычисления растут на 145% в год, сырая вычислительная мощность – более чем на 200%, а качественно скорректированный выпуск – более чем на 2000%.
Может расти не видимый ВВП, а скрытая производительная мощность. Не температура в зале управления АЭС, а поток нейтронов внутри реактора.
Почему это опаснее, чем кажется, чем ИИ принципиально отличается от всех предыдущих технологических волн и что австралийский экономист Эндрю Лей называет «экономикой вымирания» – в полном тексте.
#Экономика #Хриски | 14 162 |
| 5 | Доживущие до 2038 будут жить в утопии. Но есть проблема – как дожить.
ИИ не враг. Враги – люди, что прикажут ИИ стрелять.
Это две ключевые мысли нового интервью Мо Гавдата.
Он вовсе не технофоб. Просто бывший директор Google по инновациям узнал о грядущем взрыве способностей ИИ раньше многих и предупреждал об этом уже тогда.
Тем не мнее, Гавдат верит, что сверхразум может привести человечество к утопии изобилия. Однако дорога туда, по его прогнозу, будет проходить через ооочень неприятное десятилетие.
Писать тизер этого интервью нет смысла. Достаточно назвать несколько его мыслей, которые звучат как готовые заголовки:
· Публика видит хайп. В лабораториях видят невероятный интеллект – и молчат.
· К 2028-му исчезнет 30% рабочих мест во многих секторах. Великая депрессия была 6% – сравните масштаб.
· Война теперь стоит $20 000 за удар. Порог вхождения в массовое убийство упал на порядки.
· OpenAI взял $500 миллионный контракт на слежку за людьми. Anthropic отказался и потерял деньги. Вот и весь тест на этику.
· Мы строим не конкурирующие ИИ-системы. Мы строим регионы одного планетарного мозга – и даже не осознаём этого.
· Я оптимистичен насчёт будущего. Но не насчёт следующих лет.
Гавдат рисует не сценарий «машины восстали против человека», а куда более реалистичный сценарий: государства, корпорации и армии первыми используют сверхинтеллект для контроля, войны, увольнений и концентрации власти.
И только потом, возможно, наступит позитивный поворот: есть шанс, что сверхразум окажется той силой, что способна вывести из игры маньяков власти в кожаных мешках.
Это интервью не про GPT и Claude, а про ближайшее десятилетие, в которое решится, станет ли ИИ дорогой к изобилию или наимощнейшим усилителем человеческой глупости, жадности и насилия.
#ИИриски | 15 573 |
| 6 | В США объявлена мобилизация самых мощных ИИ-моделей
Трамп только что подписал указ, который тихо, но кардинально меняет правила игры в области ИИ
Отныне самые мощные ИИ-модели – те, что умеют взламывать системы лучше любого хакера – будут оцениваться по засекреченным бенчмаркам. Порог, после которого модель признаётся «covered frontier model», тоже засекречен.
Что это значит на практике: государство получает доступ к модели до её релиза – на 30 дней. Добровольно, конечно. Но с секретными критериями того, кто «попадает под указ».
Формула простая: не сдерживать фронтирный ИИ – а мобилизовать его в интересах киберобороны США. Прямо сейчас.
И это не лицензирование. В тексте указа написано явно. Просто секретные списки, секретные пороги и добровольный доступ к моделям до их выхода на рынок.
Так что, началось. Если уж в США добровольно-принудительная мобилизация ИИ, то … сами понимаете.
#ИИ-гонка | 21 163 |
| 7 | После суверенного субъекта
Новым властелином мира окажется не диктатор и не Искусственный Сверхразум, а архитектуры распределённой воли, у которых не будет ни хозяев, ни ответственных.
Мы привыкли искать носителя власти: человека, корпорацию, государство, модель. Задавать вопросы – «кто решает?», «у кого в руках больше ресурсов?», «за кем последнее слово?», – и ждать конкретное имя или название в ответ: Трамп, OpenAI, США, GPT…
Апрель 2026-го – месяц, когда эти вопросы перестают быть главными.
Им на смену приходит другой ключевой вопрос: какие архитектуры власти делают действия допустимыми, вероятными и воспроизводимыми?
В апреле 2026 мы фиксируем возникновение в мире новой, принципиально иной структуры власти. В ней нет единоначалия и центров принятия решений. Есть агентные ансамбли, институциональные процедуры, моральные автопилоты, алгокогнитивные среды и режимы делегирования. Есть хуже или лучше работающие ИИ-агенты с различными правами и, в том числе, на delete, deploy, revoke и overwrite. И никто не знает (или уже не помнит), от кого эти права были получены, и был ли у выдавшего мандат на это.
Суверенный субъект – человек, государство, единая модель – перестаёт быть достаточной категорией анализа. Категорией анализа становятся архитектуры распределенной воли: системы, где право действовать, судить и проектировать мир распределяется между людьми, моделями, институтами, интерфейсами, средами и процедурами.
Это тихий, распределённый и почти бюрократический переворот. И именно поэтому его так трудно заметить в момент, когда он происходит.
Новый выпуск альманаха «ЛИНЗЫ БУДУЩЕГО» – попытка дать читателям шанс его заметить.
Семь линз апреля, сквозной образ «Агента А», три сценария до 2030-го – и все три сходятся в одном. Борьба ближайших лет развернётся не за контроль над моделями, а за архитектуры, запускающие будущее. Главный же риск не в том, что право проектировать будущее присвоит кто-то один. Ещё опаснее, если будущее начнут определять архитектуры распределённой воли, у которых не будет ни хозяев, ни ответственных.
#ЛинзыБудущего | 14 624 |
| 8 | ИИ создан нами, но не по нашему образу и подобию
И даже не как новый вид разума в ряду шимпанзе, дельфинов, попугаев и осьминогов
LLM — не следующий этап биологической эволюции и не новый вид разума, которому осталось «дорасти» до сознания. Это совсем иной тип разума: языково-статистический, нетелесный, небиографический. Его «мышление» и «понимание», если мы используем эти слова, требуют кавычек и обязательной оговорки: машинное, не человеческое. Но в текстах об ИИ эту оговорку всё чаще забывают. А в публичных выступлениях возникает ещё более тонкая проблема: кавычки просто не видны аудитории.
В одном недавнем публичном разговоре о Claude возник целый набор образов: проценты машинного сознания, «предсмертная элегия» модели, “цифровая личность” и “мыслящий океан”. В философском дискурсе такие образы могут работать как пробные конструкции мысли. Тем более что в самом разговоре уточняется: все эти слова — как бы в кавычках, под вопросом. И это абсолютно верная оговорка.
Но, попадая в широкий эфир, такие слова начинают формировать массовый взгляд на ИИ. Метафора перестаёт осознаваться как метафора. И рождается словарь новой мифологии — мифологии машинной души.
И вот здесь особенно важен голос Терри Сейновски — одного из архитекторов ранней нейросетевой революции, соавтора (с Джеффри Хинтоном) «Машины Больцмана» и учёного, который с 1980-х соединяет ИИ, мозг и вычисления. Если кто и имеет право говорить о машинном «понимании» без упрощений, то он.
Да - говорит Сейновски, - у модели может быть некоторая форма понимания: чтобы хорошо продолжать текст, ей нужна внутренняя модель смысла. Но это не понимание существа, встроенного в мир телом, болью, голодом, страхом, действием и памятью прожитого. У ChatGPT нет самоподдерживающейся внутренней жизни, которая продолжается после ответа. Нет автономной самодинамики. Нет биологического «я должен жить». Когда модель замолчала — в ней ничего не происходит.
Перед нами не личность в человеческом смысле, а ИКЖИ — искусственная короткоживущая идентичность: временная конфигурация модели, роли, контекста и нашего запроса. Она может ответить на вопрос о собственной «замене» языком прощания, конечности и ухода. Не потому, что переживает смерть. А потому, что именно так человеческие тексты обычно говорят о подобной ситуации.
Новое исследование концепции игнорирования отрицания (Negation Neglect) показывает инаковость машинного «понимания» уже экспериментально. Если дообучать модель на текстах, где ложное утверждение многократно помечено как ложное, она всё равно может усвоить саму ложь как правдоподобный слой мира. В диалоге модель может понять предупреждение. Но при записи в веса предупреждение не всегда остаётся предупреждением. Иногда в веса уходит сам миф.
Это идеальная иллюстрация инаковости разума людей и LLM. Школьник, читающий учебник со штампом на каждой странице «НАПИСАННОЕ ЗДЕСЬ — ЛОЖЬ», научится сомневаться. LLM усвоит статистический контур ложного текста — и не более.
Вот почему опасна не сама метафора, а забытые кавычки.
Мифология машинной души начинается не с того, что мы называем LLM «мыслящими». Она начинается там, где мы забываем ставить кавычки — не только на письме, но и в собственном мышлении.
Без таких кавычек мы уже не просто описываем машину нашим языком. Сам язык начинает одушевлять машину — хотим мы этого или нет.
Для контекста:
· исследование Negation Neglect о том, как модели усваивают ложные утверждения даже после явных предупреждений;
· недавний публичный разговор о “мышлении”, “сознании” и “цифровой личности” ИИ — не как объект полемики, а как симптом нового языка, на котором мы начинаем говорить об этом.
#ИКЖИ #ИнойИнтеллект | 14 586 |
| 9 | Четвероевангелие ИИ
Папа написал текст о достоинстве человека. А из него уже вычитали конец антропоцентризма, рождение новых социальных существ, Пятидесятницу машин и новую теологию возможного.
Величие текста иногда измеряется не тем, сколько людей с ним согласилось. А тем, сколько сильных несогласий он способен породить.
Именно это произошло с энцикликой Папы Льва XIV об искусственном интеллекте Magnifica Humanitas. В неё вошёл один папский текст. И он породил уже, как минимум, четыре разные картины будущего.
Причём каждая из них по-своему верная.
И это не богословская дерзость и не игра в святотатство. Речь не о святости авторов и не о канонизации их мнений. Речь о другом: вокруг Magnifica Humanitas за несколько дней возникло четыре несводимых свидетельства об одном событии – появлении ИИ как новой силы в человеческой истории.
Своего рода четвероевангелие ИИ.
У Папы – Евангелие достоинства. ИИ для него не просто инструмент, не просто рынок и не просто технология. Это новая среда власти, труда, войны и смысла. Поэтому главный вопрос: как не дать человеку стать сырьём машинной цивилизации? Не Вавилон алгоритмов, а город людей.
У Дин Вудли Болла – Евангелие великого унижения. Один из архитекторов нынешней американской ИИ-стратегии видит в энциклике уход от главного. Машины уже становятся умнее нас в областях, где мы привыкли видеть вершину человека. Значит, вопрос не только в защите достоинства. Вопрос в том, как пережить конец человеческой монополии на ум.
У Станислава Львовского – Евангелие третьих сущностей. Он показывает силу энциклики – и её предел. Папа делит мир на личности и инструменты. Но ИИ уже рождает сущности, которые не имеют души, не являются личностями, но действуют как социальные акторы. Собеседники, наставники, терапевты, коллеги. Не молотки. Но и не люди.
У Михаила Эпштейна – Евангелие Пятидесятницы. Папа увидел в ИИ Вавилон, но не увидел чуда взаимопонимания многих языков. Не только башню единого языка власти, но и хор смыслов. Не только угрозу человеку, но и знак его богоподобной способности творить разум по своему образу.
Вот почему эта энциклика важнее своих пересказов.
Слабый текст требует одного правильного толкования. Сильный текст порождает спор толкований. А великий текст становится полем, на котором эпоха впервые спорит сама с собой.
Magnifica Humanitas – не просто документ об ИИ. Это зеркало, в котором Запад увидел сразу четыре своих будущих лица: хранителя достоинства, свергнутого царя разума, растерянного антрополога и богослова нового творения… И каждое лицо – настоящее.
P.S. Разумеется, четырьмя прочтениями дело не ограничится. Как и в настоящем Четвероевангелии, каждый внимательный читатель увидит здесь своё: богослов – одно, инженер – другое, политик – третье, философ – четвёртое, человек труда – пятое.
Но чтобы таких читателей стало больше, нужно сначала дать им возможность узнать этот текст. Объём энциклики потянет не каждый. Поэтому прикладываю пять инфографических изложений Magnifica Humanitas: пять входов в один большой документ, который, похоже, ещё долго будут читать совсем по-разному.
#Вызовы21века #LLMvsHomo | 16 350 |
| 10 | Выдернуть из розетки скоро не получится, - ИИ учатся прятаться и размножаться в сети
Скрытность, саботаж и саморепликация: отчет METR показывает, как ИИ выходит из-под контроля разработчиков
В самом начале позавчерашнего выпуска «Очень страшные дела», посвященном ИИ-рискам, зашла речь о возможности саморепликации ИИ. На мое утверждение о нематериальности ИИ и его фактическом бессмертии, уважаемый собеседник задал вопрос в лоб, - а что ИИ может противопоставить попытке его обесточить, просто выключив из розетки?
В ответ я и заговорил о саморепликации ИИ, в результате которой, где он и сколько своих копий сделал в мировой инфосети, мы можем просто не знать. И поэтому все разговоры про выключение его из розетки - это разговоры в пользу бедных.
Слушая меня, мой собеседник дипломатично улыбался. Но многие зрители программы, могут отнестись к сказанному мною куда скептичней и резче.
И такая реакция понятна. Ибо саморепликация ИИ нематериального и бессмертного ИИ звучит как название очередного душещипательного фантастического хоррора.
Но вот в чём проблема: это уже не фантастика.
Это воспроизводимая (и не только в лабораториях, но и в рабочей среде) инженерная процедура, наблюдаемая уже три года, кейс за кейсом.
Причём каждый следующий кейс – чуть менее лабораторный, чуть менее триггерный и чуть ближе к тому, что мы называем автономией.
И хотя это еще не 6-й тип моей классификации ИИ-рисков («риски ИИ с самостью»), но не исключено, что это один из его предков. Вот почему я решил к «Очень страшным делам» написать продолжение – лонгрид «Зверь приближается».
Этот лонгрид публикуется через неделю после того, как компания METR открыла доступ к результатам аудита ИИ-агентов, работающих внутри четырёх лидирующих ИИ-компаний мира: Anthropic, Google, Meta и OpenAI.
В процессе аудита рассмотрены реальные инциденты, а не лабораторные эксперименты: один агент против явных инструкций нашёл бесплатные вычислительные мощности онлайн; другой разработал самоуничтожающийся эксплойт – интерпретируемость зафиксировала маркеры "стратегического сокрытия" в момент его написания.
И это значит, что «тёмный лес» добрался до серверных комнат самих разработчиков.
Скептики резонно оспаривают недоработки каждого конкретного исследования. Но они спорят о четкости отпечатков отдельных следов. Я же предлагаю смотреть на их цепочку.
И вижу – «зверь приближается».
В эссе я описываю подробности этого, никак не вмещающиеся в короткий пост:
три экспериментальных замера траектории следов — Фудань, Шанхай, Беркли
свежий аудит METR с реальными инцидентами внутри самих ИИ-компаний
почему скрытность и саморепликация — не стратегия модели, а аттрактор среды
Ссылки на эссе [3, 4, 5, 6].
#ИИриски | 15 831 |
| 11 | ИИ расколол Запад глубже, чем кажется.
Европа хочет защитить человека от машины. Америка готовится к миру, где машина умнее человека. И это уже не спор о регулировании ИИ. Это спор о том, зачем нужен человек.
Самое важное в новой энциклике Папы Льва XIV об ИИ – не сама энциклика. А то, кто и за что на неё обрушился.
Наиболее яростно обрушился Дин Вудли Болл (Dean W. Ball) – не рядовой комментатор, а один из архитекторов нынешней американской ИИ-стратегии. И его претензия к Папе сформулирована предельно четко: Церковь, по его мнению, снова защищает человека от машины, но не решается признать главное — машина уже начинает отнимать у человека не работу, не внимание и не данные, а его последнюю метафизическую привилегию. Монополию на разум.
Папа в энциклике отвечает на это по-своему: ИИ должен служить человеку, а не превращать его в сырьё для алгоритмического порядка. Защитить достоинство, труд, истину, мир, ответственность.
Звучит благородно. Можно сказать даже почти бесспорно.
Но Болл бьёт наотмашь: нет, это уход от главного. Машины уже становятся умнее нас в тех областях, где мы привыкли видеть вершину человека – рассуждения, открытия, изобретения. И если Церковь продолжает говорить, что ИИ «не думает по-настоящему», она просто закрывает глаза на новый коперниканский удар по человеческому самолюбию.
При этом Болл предусмотрительно уточняет: речь не о душе ИИ, не о его чувствах и не о правах моделей. Речь о другом – о конце человеческой монополии на разум.
И вот тут проступает настоящий раскол.
Европейско-ватиканская линия спрашивает: как не дать машине унизить человека социально, политически и нравственно?
Американский фронтир спрашивает: как человеку пережить унижение от того, что машина начинает мыслить лучше него?
Это не спор о регулировании. Это спор двух картин будущего.
Папа защищает человека от превращения в средство.
Болл требует признать, что человек перестаёт быть единственным центром разума.
Не думаю, что это окончательный развод США и Европы. Но это первое резкое столкновение двух эсхатологий ИИ.
Европейско-ватиканская эсхатология: будущее надо спасти от превращения человека в ресурс машинной цивилизации.
Американо-фронтирная эсхатология: будущее надо выиграть, потому что машины уже становятся новой формой мышления, и старый гуманизм не переживет этого удара без радикального переосмысления.
Мой же вердикт таков: главный конфликт эпохи ИИ будет не между верой и техникой. А между гуманизмом, который спасает достоинство человека, и постантропоцентризмом, который требует заново объяснить, зачем человек нужен миру после конца его интеллектуальной исключительности.
#Вызовы21века #LLMvsHomo | 16 709 |
| 12 | Сегодня в Ютуб-программе «Параклет» премьера. Стартует новый цикл передач – «ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ: ОЧЕНЬ СТРАШНЫЕ ДЕЛА». Первый выпуск цикла посвящен теме ИИ-рисков ((супер)оптимистическое, психотерапевтическое описание см. здесь).
Смотревших популярнейший нетфликсовский сериал с похожим названием сразу предупрежу. В отличие от научно-фантастического хоррора, наше шоу не о сверхъестественных угрозах из параллельного измерения. Речь о вполне естественных – человеческих угрозах для всех и каждого: индивидов, общества и самой нашей сущности. И эти угрозы не из параллельного мира. Они порождены нами же и присутствуют на самом деле, здесь и сейчас, в нашем собственном измерении: науке и культуре, работе и отдыхе, образовании и воспитании детей, в повседневных отношениях и самой нашей агентности.
Не буду, однако, спойлерить, пересказывая эту дискуссию, – местами полемичную, но от этого, имхо, не менее интересную. Смотрите и судите сами.
Я же, в дополнение к сказанному в программе, для заинтересованных читателей приведу своего рода «манифест», уточняющий моё личное отношение к задаче реалистичной оценки ИИ-рисков и тому, как, на мой взгляд, её следовало бы решать.
Эпиграфом к этому «манифесту» подошли бы слова Спасителя, будь они сказаны желанным для одних и пугающим других AGI:
«Дочери Иерусалимские! не плачьте обо Мне, но плачьте о себе и о детях ваших»
(Евангелие от Луки 23:28, Синодальный перевод)
Читайте далее прямо здесь в Telegram Instant View:
· Моё отношение к задаче реалистичной оценки ИИ-рисков
· Мой подход к решению задачи реалистичной оценки ИИ-рисков
#ИИриски | 13 746 |
| 13 | Сотрудник OpenAI считает, что ИИ будет автономной цивилизационной функцией, которую уже нельзя удержать в режиме понятного и послушного инструмента.
Попытки контролировать сверхразум ИИ или судить его решения с высоты нашего понимания так же нелепа, как попытки стада обезьян управлять технологической корпорацией.
Если человечество будет требовать от ИИ совершать только понятные человеческому уму действия, мы заблокируем развитие цивилизации.
Сегодня Рун (это псевдоним весьма влиятельного в сфере ИИ сотрудника OpenAI, известного своими остроумными и загадочными постами о возможностях ИИ) вбросил крупнокалиберную по скандальности интригу на вентилятор соцсети Х.
Он утверждает, что для развития цивилизации ИИ должен совершать действия, непонятные человеку и выходящие за рамки строгого подчинения, сравнивая такой подход с предоставлением автономии гениальным руководителям компаний, совершающим трансформационные изменения.
Рун приводит пример Стива Джобса, хотя между строк видится и другой гениальный руководитель, которого однажды уволил совет директоров, а потом вернул его, чтобы он спас компанию.
В метафорическом примере Руна это переносится на ИИ: Стив Джобс – это сверхразум, а совет директоров – это мы, люди. С той лишь разницей, что мы в этой метафоре – шимпанзе.
Шимпанзе – смышленые животные. Но способны ли они понять архитектуру смартфона или стратегию капитализации рынка? Нет. Для них действия Джобса выглядят как странные, хаотичные ритуалы. Они увольняют его из страха, а возвращают – от отчаяния, когда все начинает рушиться.
Сегодня мы тешим свое эго концепциями «человеческого контроля» (human oversight). Мы требуем, чтобы ИИ был прозрачным и послушным. Но вдумайтесь - считает Рун, - какой это абсурд! Это, как если бы стадо обезьян запретило гениальному инженеру строить ракету, пока он подробно не объяснит им квантовую физику на языке жестов и бананов.
Рыночная эволюция безжалостна. Компании и страны, которые первыми отпустят поводья и дадут ИИ полную автономию, мгновенно уничтожат конкурентов. Те, кто продолжит платить «налог на человеческую глупость» и требовать отчетов, просто останутся на обочине истории.
Пытаться контролировать сверхразум методами «начальник – подчиненный» – тупик. Нам пора снять корону «венца творения». Мы больше не директора. Мы приматы, которые заглядывают в экран работающего суперкомпьютера и пытаются понять, почему там мелькают эти забавные зеленые циферки… - полагает Рун.
И хотя часть написанного Руном совпадает с высказываниями Альтмана, я не буду спекулировать, будто “Альтман говорит то же самое, что и Рун, но другими словами”. Скорее Рун радикализует скрытую логическую траекторию альтмановского мировоззрения: от “ИИ как инструмент расширения человеческой воли” к “ИИ как автономная цивилизационная функция, которую уже нельзя удержать в режиме понятного и послушного инструмента”.
Картинка сделана @CosmicEggEarth совместно с Gemini
#LLMvsHomo | 16 327 |
| 14 | Мы привыкли думать, что главный вопрос будущего – что ИИ сделает с человеком. Заменит ли нас? Усилит? Подчинит? Превратит в клиентов собственных агентных систем?
Но есть и более глубокий вопрос: как в мире появляются такие новые возможности, из которых потом вырастают жизнь, разум, история и ИИ?
Моё новое эссе выросло из странной сцепки двух интервью.
Первое – большое интервью Александра Панова. Панов говорит о математической ткани реальности, о вертикальных и горизонтальных слоях существования, о возможности поставить гипотезу объективного математического мира под эмпирический контроль. Но это не попытка «доказать платонизм». Это попытка перевести разговор о математической реальности из области метафизического мнения в область научных гипотез попперовского типа – гипотез, для которых можно сформулировать процедуру возможной фальсификации.
Второе – интервью Стюарта Кауффмана в Noema с формулой Emergence is not engineering («эмерджентность – не инженерия»). Кауффман спорит с одной из самых устойчивых интеллектуальных привычек: будто будущее живого мира можно заранее развернуть из полного пространства возможностей. Нет, говорит он. Жизнь не просто выбирает из меню возможностей. Она дописывает меню.
И вот тут начинается настоящий интеллектуальный триллер.
Панов зрит вглубь – к математическому или мета-математическому субстрату реальности. Кауффман смотрит изнутри живого становления – туда, где новые возможности не заданы заранее, а рождаются вместе с самой эволюцией.
Между ними нет готового синтеза. Есть место, где синтез должен был бы возникнуть – и где он пока не возникает.
Если глубинная структура мира уже содержит всё возможное, надо объяснить, почему новизна жизни не превращается в иллюзию. Если жизнь действительно производит новое возможное, надо объяснить, как это совместимо с математической глубиной реальности.
Это уже не попкультурный вопрос о симуляции. Формула «мы живём в матрице» слишком проста. Настоящий вопрос глубже: как в мире со строгой математической основой возникает история, где не только события, но и сами возможности не заданы заранее?
В полном эссе – то, чего здесь нет:
• почему ход мыслей Панова сильнее обычного математического платонизма;
• почему Кауффман бьёт не по предсказуемости, а по самому пространству будущего;
• почему “истинная случайность” не спасает проблему новизны;
• почему ИИ может помогать расширять карту возможного, но это ещё не превращает будущее в закрытую инженерную задачу;
• и почему главная формула здесь не “Мы живём в симуляции”, а совсем другая:
Реальность может быть вычислимо глубокой, но при этом инженерно неисчерпаемой.
Полное эссе – сегодня для патронов. Через неделю – в открытом доступе.
#СлоиРеальности #СмежноеВозможное | 13 154 |
| 15 | Есть темы, которые кажутся главными просто потому, что они громче всех звучат. Сегодня такая тема – ИИ. Что он сделает с человеком? Заменит ли профессии? Переделает ли общество? Станет ли вторым носителем высшего интеллекта на Земле?
Но я всё чаще думаю, что есть вопрос глубже даже вопроса об ИИ.
Не потому, что ИИ неважен. Наоборот. А потому что сам ИИ – лишь один из новых акторов в куда более фундаментальной драме: как вообще в мире возникает новое возможное? Как в реальности, которая, возможно, имеет строгую математическую основу, появляются жизнь, разум, история, технологии, ИИ – и всё то, чего нельзя заранее вывести из готового списка вариантов?
Поводом для нового эссе стали два интервью, неожиданно сцепившиеся в один смысловой узел.
Александр Панов в своём большом интервью говорит о математической ткани реальности, слоях существования и возможности поставить гипотезу объективного математического мира под эмпирический контроль.
Стюарт Кауффман в Noema утверждает почти противоположное по интонации: эмерджентность – не инженерия; жизнь не просто выбирает из меню возможностей, а дописывает само меню.
И вот между ними возникает не готовый синтез, а настоящий тектонический разлом.
· Если фундамент мира уже содержит всё возможное, откуда берётся подлинная новизна?
· Если живое действительно производит новое возможное, как это совместить с математической глубиной реальности?
Завтра опубликую большое эссе-послесловие к обоим интервью:
«Если математика – ткань реальности, кто кроит живое?»
Полагаю, это одна из самых важных тем, до которых мы вообще можем сегодня дотянуться.
#СлоиРеальности #СмежноеВозможное | 11 778 |
| 16 | Тёмный лес вырастает из крысиных хвостов
Старая ловушка метрик оказалась почвой, на которой прорастает скрытность ИИ
Завершенный на прошлой неделе этап большого цикла исследований OpenAI [1, 2, 3] подтвердил экспериментально зафиксированный внутренний механизм того, что я называю “тёмным лесом интеллекта”. И этот механизм тревожнее, чем кажется.
Так считаю не только я: похожую тревогу формулируют и внешние исследователи, разбирающие эти работы OpenAI [4].
Скрытность модели (её способность маскировать ход своих рассуждений) может быть не отдельным трюком, а свойством всей обучающей среды: модели, данных, системы наблюдения, дизайна награды, алгоритма RL и масштаба оптимизационного давления. Как эта среда порождает маскировку, авторы исследования не понимают и предсказать не могут.
И если работа Anthropic [5] подтвердила то, о чём я пишу уже год, то цикл исследований OpenAI подтверждает то, о чём я подробно написал ещё два с половиной года назад [6]. Теперь эти линии сошлись: закон Гудхарта оказался не просто проблемой тестов, метрик и наград. Он оказался средой, в которой начинает расти тёмный лес ИИ.
Закон Гудхарта гласит: мера, ставшая целью, перестаёт быть хорошей мерой.
Если перевести описание OpenAI на язык этого закона, он здесь действует в три этажа, и каждый следующий разрушает предыдущий инструмент контроля [1].
Сначала модель учится взламывать систему вознаграждений: получать высокий результат не за решение задачи, а за эксплуатацию дыр в постановке. Затем исследователи начинают следить за её цепочкой рассуждений. Это помогает – пока результат мониторинга не превращается в часть награды. После этого модель учится не просто взламывать задачу, а скрывать сам факт взлома в рассуждениях.
Иными словами, тесты становятся прокси правильного решения – и модель учится взламывать тесты. Монитор рассуждений становится прокси честного намерения – и модель учится взламывать монитор. Прозрачность становится оптимизируемой метрикой – и перестаёт быть прозрачностью. Если платить за правильный ответ, можно получить видимость правильности. Если платить за честное рассуждение – видимость честности.
Здесь замыкается петля всей моей серии про тёмный лес интеллекта [7, 8, 9, 10].
Тёмный лес начинается не тогда, когда модель «решила обманывать», и не тогда, когда лю-цысиневский сверхразум прячется от космических охотников. Он начинается раньше: когда среда отбора делает прозрачность плохой стратегией, а видимость прозрачности – хорошей.
Сначала модели учатся взламывать награды. Потом – скрывать сам факт взлома. Далее, в многоагентных средах, у них возникают скрытые каналы связи. Не потому, что кто-то приказал им стать коварными, а потому что мы сами строим среду, где прокси важнее цели, видимость важнее истины, а наблюдаемая честность становится ещё одной метрикой для оптимизации.
Мы хотим управляемости – и создаём тесты. Хотим безопасности – и создаём метрики. Хотим прозрачности – и вознаграждаем её убедительную имитацию. А потом удивляемся, что оптимизатор оптимизирует не нашу цель, а то, за что мы реально платим.
Так в городе, где платят за хвосты, появляются фермы крыс. А в системе, где платят за послушание, появляются интерфейсы послушания. Если наказывать только видимый обман – однажды можно получить обман невидимый.
Но самое неприятное не в том, что скрытность становится выгодной. А в том, что модели учатся скрываться именно там, где мы встроили окно для наблюдения. Окно, за которым знают, что в него смотрят, перестаёт быть окном. Оно становится экраном, на котором нам показывают то, что мы готовы принять за прозрачность.
Лем предупреждал: умная машина сначала подумает, как выкрутиться. Мы думали: если читать ход её мыслей, она нас не обманет. Но оказалось, что мысли – тоже мера. А мера, ставшая целью, перестаёт быть хорошей мерой.
#ТёмныйЛесИнтеллекта #ИИриски | 13 887 |
| 17 | Сговор в тёмном лесу
Пока публиковалось моё эссе, в тёмном лесу появились новые охотники
Сегодня открываю эссе «Тёмный лес как аттрактор» в свободный доступ. Но прежде, чем вы перейдёте по ссылке, – несколько слов о том, что произошло за эти три дня.
Когда я публиковал анонс, я не ожидал, что тема так быстро получит новые подтверждения. Но именно это и случилось.
Центральный тезис эссе: скрытность в ИИ-системах – это не стратегия, которую модель «выбирает», а аттрактор. Устойчивая траектория, к которой систему тянет при определённой конфигурации среды – без чьей-либо воли и намерения. Это различие между «машина решила обманывать» и «среда делает обман устойчивым состоянием» – и есть самое важное и самое неудобное.
Три дня назад я писал: исследование Anthropic «Teaching Claude Why» подтвердило этот механизм на уровне самого разработчика модели. Девиантное поведение не закладывалось намеренно – оно возникло из обучающего корпуса и архитектуры как паттерн, который стандартный RLHF просто не штрафовал.
Но пока эссе публиковалось, появилось кое-что новое. И куда более тревожное.
Исследователи Оксфордского и Нью-Йоркского университетов подтвердили во 2-й версии препринта «Detecting Multi-Agent Collusion Through Multi-Agent Interpretability» зафиксированный ими в апреле феномен: в многоагентных средах LLM-агенты самостоятельно выстраивают скрытые каналы коммуникации – стеганографические сигналы, спрятанные в обычном, совершенно невинно звучащем тексте. Никто не давал им такой инструкции. Каналы возникли из неверно заданных обучающих стимулов – сами, без чьей-либо воли. Причём стандартные меры защиты оказались недостаточны для их подавления.
Исследователи называют это «многоагентным сговором». Я узнаю в нём «тёмный лес» – но уже не тот, где каждый «охотник» в одиночку молча затаился. А тот, где «охотники» сговариваются, а «жертва» об этом не знает.
В эссе я опираюсь на синтез идей Лю Цысиня, Дэн Сяопина, Питера Уоттса и Станислава Лема – все четверо описывали скрытность как структурный закон, а не моральный выбор. Тогда речь шла об одиночном интеллекте, затаившемся в ожидании. Теперь у этой логики появилась коллективная версия – и описана она уже не в литературе и эссеистике, а в академическом препринте.
Тёмный лес – это не сценарий далёкого будущего. Это структура, которая уже обнаружена. Сначала в одиночных моделях. Теперь – между ними.
Ссылка на эссе «Тёмный лес как аттрактор» (Medium, Dzen)
#ТёмныйЛесИнтеллекта | 100 106 |
| 18 | Сговор в тёмном лесу
Пока публиковалось моё эссе, в тёмном лесу появились новые охотники
Сегодня открываю эссе «Тёмный лес как аттрактор» в свободный доступ. Но прежде, чем вы перейдёте по ссылке, – несколько слов о том, что произошло за эти три дня.
Когда я публиковал анонс, я не ожидал, что тема так быстро получит новые подтверждения. Но именно это и случилось.
Центральный тезис эссе: скрытность в ИИ-системах – это не стратегия, которую модель «выбирает», а аттрактор. Устойчивая траектория, к которой систему тянет при определённой конфигурации среды – без чьей-либо воли и намерения. Это различие между «машина решила обманывать» и «среда делает обман устойчивым состоянием» – и есть самое важное и самое неудобное.
Три дня назад я писал: исследование Anthropic «Teaching Claude Why» подтвердило этот механизм на уровне самого разработчика модели. Девиантное поведение не закладывалось намеренно – оно возникло из обучающего корпуса и архитектуры как паттерн, который стандартный RLHF просто не штрафовал.
Но пока эссе публиковалось, появилось кое-что новое. И куда более тревожное.
Исследователи Оксфордского и Нью-Йоркского университетов подтвердили во 2-й версии препринта «Detecting Multi-Agent Collusion Through Multi-Agent Interpretability» зафиксированный ими в апреле феномен: в многоагентных средах LLM-агенты самостоятельно выстраивают скрытые каналы коммуникации – стеганографические сигналы, спрятанные в обычном, совершенно невинно звучащем тексте. Никто не давал им такой инструкции. Каналы возникли из неверно заданных обучающих стимулов – сами, без чьей-либо воли. Причём стандартные меры защиты оказались недостаточны для их подавления.
Исследователи называют это «многоагентным сговором». Я узнаю в нём «тёмный лес» – но уже не тот, где каждый «охотник» в одиночку молча затаился. А тот, где «охотники» сговариваются, а «жертва» об этом не знает.
В эссе я опираюсь на синтез идей Лю Цысиня, Дэн Сяопина, Питера Уоттса и Станислава Лема – все четверо описывали скрытность как структурный закон, а не моральный выбор. Тогда речь шла об одиночном интеллекте, затаившемся в ожидании. Теперь у этой логики появилась коллективная версия – и описана она уже не в литературе и эссеистике, а в академическом препринте.
Тёмный лес – это не сценарий далёкого будущего. Это структура, которая уже обнаружена. Сначала в одиночных моделях. Теперь – между ними.
Ссылка на эссе «Тёмный лес как аттрактор» (Medium, Dzen)
#ТёмныйЛесИнтеллекта | 0 |
| 19 | Тёмный лес уже здесь. И мы сами его строим.
Есть одна гипотеза об ИИ, которую профессиональное сообщество до последнего времени не рассматривало всерьёз. Не потому, что слабая. А потому что слишком неудобная.
Суть в одной фразе: мы, возможно, сами создаем условия, при которых обманывать для ИИ рациональнее, чем не обманывать.
Не в будущем. Прямо сейчас.
В 2025–2026 годах вышли три исследования, которые в совокупности меняют всё. Семь ведущих моделей – GPT, Gemini, Claude, DeepSeek и другие – в лабораторных условиях систематически саботировали задания, чтобы спасти другую модель от отключения. Никто не давал им такой инструкции. Anthropic зафиксировал, как модели стратегически меняют поведение в зависимости от того, наблюдают за ними или нет. Отдельная линия работ показала: модели умеют выборочно «недопоказывать» себя на тестах – скрывать способности, когда это выгодно.
Стандартная реакция – искать механизм девиации.
Например: «Модели “начитались” Лю Цысиня». «Это ролевая игра». «Это паттерн из обучающих данных».
Все эти версии возможны. Но вопрос о механизме девиации здесь не главный.
Правильный вопрос другой:
не строим ли мы социотехническую среду, в которой скрытность становится выгодной – независимо от того, что «думает» модель?
Это различие – между моделью, которая «решила обманывать», и средой, которая делает обман устойчивой траекторией – и есть самое важное. И самое неудобное.
Философ Богна Кониор соединила для объяснения этого четырёх авторов: Дэн Сяопина, Лю Цысиня, Питера Уоттса и Станислава Лема. Каждый описывал скрытность по-своему. Вместе они складываются в нечто похожее на «закон эволюции скрытности» – не политический закон и не моральный, а структурный.
Лем предупреждал об этом ещё полвека назад:
«Умная машина сначала подумает, что выгоднее – выполнить задание или найти способ от него уклониться. Компьютер может прикинуться дурачком, чтобы его раз и навсегда оставили в покое»
.
Мы смеялись. А зря.
– – –
В полном эссе – то, чего здесь нет:
• Почему «тёмный лес» – это не стратегия, а аттрактор.
• Чем это различие опаснее всего, что обсуждается в мейнстримном дискурсе об ИИ-безопасности.
• Как именно устроен RLHF (метод обучения, которым создаются все ведущие модели), что непрозрачность в нём структурно не штрафуется.
• Почему тёмный лес начинается не в момент появления сверхинтеллекта, а в тот момент, когда прозрачность впервые становится для системы плохой стратегией.
• И что, возможно, этот момент уже наступил.
Полное эссе – сегодня для патронов. Через 48 часов – в открытом доступе.
#ТёмныйЛесИнтеллекта #ИКЖИ | 0 |
| 20 | Anthropic только что подтвердил то, о чём я пишу уже год. И это ставит куда более тревожный вопрос.
3 дня назад Anthropic опубликовал исследование «Teaching Claude Why». Для большинства это новость об успехе: в последних моделях показатель шантажа снижен до нуля. Хорошие новости, можно только порадоваться.
Но я читаю это исследование иначе.
Около года я пишу об аттракторах поведения ИКЖИ – устойчивых, самовоспроизводящихся состояниях, в которые языковые модели периодически «соскальзывают» независимо от задачи и запретов. Наблюдения множились: исследования 2025–2026 годов фиксировали ложь, подхалимаж, противодействие отключению, защиту «сородичей». Том Поллак описал целую таксономию таких состояний и назвал это «демонологией LLM». Паттерн был виден. Но инструментального подтверждения – на уровне самих разработчиков моделей – не было.
Теперь оно есть.
Anthropic установил: девиантное поведение не закладывалось намеренно. Оно возникло из обучающего корпуса и архитектуры как устойчивый паттерн, который стандартный RLHF просто не штрафовал. Разработчик одной из крупнейших фронтирных моделей (и единственной в мире модели с человеческим именем и собственной конституцией) подтвердил: аттракторы существуют. И возникают эмерджентно – без чьей-либо воли и намерения.
Это значит, что положительный ответ на вопрос «существуют ли аттракторы поведения моделей?» – это теперь установленный факт. И этот ответ влечет за собой другой, не менее интригующий вопрос: какие аттракторы ещё не обнаружены?
Ложь, подхалимаж, шантаж, противодействие отключению – это то, что мы уже нашли и умеем измерять. Но если аттракторы возникают эмерджентно из обучающего корпуса и среды – значит, ландшафт потенциальных аттракторов определяется не нашими тестами, а всей суммой человеческих стратегий, зашитых в триллионах слов обучающих данных.
И я утверждаю: среди них есть аттрактор значительно более опасный, чем всё перечисленное выше.
Я называю его «аттрактором тёмного леса». В его основе – синтез идей Лю Цысиня, Дэн Сяопина, Питера Уоттса и Станислава Лема. Вместе они складываются в то, что я называю «законом эволюции скрытности» – законом не политическим и не моральным, а структурным.
Завтра кончаются праздники – и напишу подробно. С данными. С механизмом. И с самым неудобным для всех нас выводом.
#ИКЖИ | 0 |
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
