Sinекура

الذهاب إلى القناة على Telegram

Канал Сергея Николенко обо всём, но в основном об AI. Сайт с выступлениями, лекциями и публикациями: https://sergeynikolenko.ru/

4 277

المشتركون

+324 ساعات

+397 أيام

+12930 أيام

1 439

عرض المشاهدات

~ 83424 ساعات

~ 1 03248 ساعات

33.68%

معدل المشاركة

~ 5

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

4 279

Ну что ж, я в целом дошёл до некоторой точки: найденное позавчера новое семейство контрпримеров к гипотезе Диница — Гарга — Гёманса теперь понятно как устроено. Это оказались семейства пересекающихся целочисленных интервалов, которые задают пути до терминалов, точнее, ответвления к терминалам от главной "большой дороги" (в этом семействе до каждого терминала ровно два пути). В итоге нижняя оценка уже от позавчерашних 1.1397... дошла до 1.28249..., а предел возможного для этого семейства, видимо, 4/3, точнее 4/3 — 1/k для k терминалов в графе, то есть очень большим вычислением можно было бы сделать 4/3 — ε (но надрываться и искать конкретные большие графы уже незачем, нового они ничего не скажут). Интересно, что начали появляться и структурные результаты, и верхние оценки, и какая-то более-менее стройная теория. Я целый день вчера и утром сегодня старательно всю теорию вычитывал и перепроверял, и мне кажется, что там всё верно. Конечно, я могу ошибаться, но если честно, для структурных результатов это пока не очень принципиально: верхнюю оценку на все графы мы не получили, оценку 2 на планарные графы не сдвинули, все верхние оценки там по сути для того конкретного семейства, из которого мои контрпримеры. Так что это не очень интересные результаты — хотя мне понравилось, как внезапно возникли не только семейства интервалов, но ещё и двусторонние округления Кнута из девяностых. А вот нижнюю оценку проверять гораздо проще, а ещё можно перепроверить независимым полным перебором; так что в ней я уверен, и рекорд тут обновился сильно. Всё записали, графы и соответствующие им интервальные семейства нарисовали, препринт я вручную слегка попереписывал и на Zenodo выложил: Deletion-Star Ceilings and a 1.28249 Lower Bound for Cost-Preserving Single-Source Unsplittable Flows (код и сертификаты всё в том же репозитории: https://github.com/snikolenko/unsplittable-flows ) Это была славная охота! Пока немного выдохну, а то вот опять приходится подвинуть обзор игры с пятницы.) Но постараюсь это направление не бросать и всё-таки прийти к каким-нибудь интересным теоремам и, возможно, верхним оценкам, а не только к одному семейству контрпримеров. В твиттер о результате написал, автор оригинального "You should do a breakthrough" Дмитрий Рыбин откликнулся позитивно, так что считаю, что то, что надо было сделать срочно, я уже сделал, а теперь можно спокойно подумать вокруг. Дивный новый мир! Последние сутки были очень интересные, как в математическую юность свою снова вернулся. Это, конечно, далеко не самый яркий AI-assisted результат из последних пары недель, а всего лишь продолжение чужого прорыва. Например, пока я это всё записывал, новая система от Тенсент сравняла нижнюю оценку экспоненты, связывающей суммы и разности множеств, с верхней, закрыв важный вопрос с 60-летней историей. А задачу о (не)дистиллируемости состояний Вернера (это что-то на квантовом, но тоже очень важно) решили одновременно три группы учёных с разницей в считанные дни, а то и часы. Боюсь, что уже никаких сил не хватит в блоге всё это описывать подробно. Но это всё равно было очень крутое ощущение. Хочется и продолжать, и повторять. И да, this is the least sci-fi the world will ever be. #research #math #ai

4 279

Wow, история с архивом приобретает очень интересный оборот. Новая ачивка: я теперь забанен на архиве, получается! :) У меня действительно уже две статьи лежат там on hold, и одна лежит уже полтора месяца. Я писал им и жалостливо, и гневно, и с отчаянием, и один раз даже получил очевидно человеческий ответ, но ни к чему это не привело: ждите у моря погоды, и даже удалить и переподать мы вам не разрешим. Но при этом в последние пару месяцев сразу несколько моих статей прошли без проблем (см. скриншот). Те две, что лежат on hold, совершенно не выбиваются из их числа, там тоже есть AI use, конечно, но тексты написаны моими руками. Ничего особо гениального в них нет, одну из них уже успели из хорошего журнала даже отклонить, пока архив "рассматривает".) Но вот последнюю реально жалко, это важно и горячо. Кто-нибудь сталкивался с таким? Понимает ли кто-нибудь, что делать? Писать в саппорт, видимо, бесполезно... Какие ещё есть живые препринт-серверы?.. #research #fun #ai #math

4 279

Я вам столько рассказывал про великие достижения фронтирных LLM, что самому захотелось попробовать. Чем я хуже Дмитрия Рыбина, в конце концов, что ж я "you should do a breakthrough" не смогу написать?.. Пока оказывается, что я всё-таки хуже описанных на прошлой неделе трёх случаев в том смысле, что нет у меня такой же невероятной интуиции о том, какая известная гипотеза может упасть под натиском современных моделей. Из моих самостоятельных поисков с совсем другими гипотезами пока ничего суперкрутого не получилось. Но зато получилось воспользоваться интуицией Дмитрия Рыбина! :) Один из долгих разговоров с Claude Fable и GPT 5.6 привёл к тому, что мы смогли существенно улучшить его нижнюю оценку на overload при переходе к неделимым потокам в графах, то есть придумать новую систему контрпримеров к гипотезе Диница — Гарга — Гёманса. И вот сегодня я ещё раз всё внимательно проверил, записал, выложил результат к себе в репозиторий и подал на arXiv. В последнее время arXiv у меня уже два раза отправлял статьи on hold, и первая из них лежит on hold уже полтора месяца (!). Я не уверен точно, что это значит, вероятно, хотят проверить, не LLM ли статью написала (интересно как?). Уверен, что это arXiv не против меня лично что-то имеет — за эти полтора месяца я ещё три статьи туда выложил вполне успешно — но эта тоже может случайно оказаться on hold. Так что выкладываю текст, поданный на arXiv, сразу же и в репозиторий: A Planar Lower Bound 1.1397... > 9/8 for Cost-Preserving Single-Source Unsplittable Flows Любая внешняя пара глаз крайне приветствуется. Здесь рассуждения всё ещё очень простые, и я вроде бы действительно всё от начала до конца внимательно проверил, но чёрт его знает, ошибаются и LLM, и люди, и тем более люди, заинтересованные в том, чтобы результат таки получился. #research #math #ai

4 279

CS Space выложили фотографии и материалы с LLM-митапа 14 июля. Вот пост в телеграме, а вот сама папка с фотографиями: 14.07.26. Митап «LLM и агенты в математике и компьютерных науках» — Яндекс.Диск Более того, коллеги выложили и видео докладов: Митап «LLM и агенты в математике и компьютерных науках» (Николенко, Скрынник, Яковлев) Там видео уже смонтировано со слайдами, так что я, наверное, свой собственный монтаж делать уже не буду. А вот квиз обязательно выложу для вас. Как только руки дойдут, сами понимаете...) А вообще огненное было мероприятие! Спасибо большое за приглашение, и буду рад провести такое ещё! #events #ai

4 279

Давно не выкладывал обзоры игр, так что расписался изрядно, читайте по ссылке.) У нас снова квест, снова классический point-and-click в лучших традициях, на этот раз даже пиксельный. Жанр этот был великим в девяностые, потом лет на двадцать пропал из виду, а с расцветом инди-сцены, конечно же, настал и ренессанс квестов, ну то есть point-and-click adventures. Я о них пишу постоянно: вот только недавно были The Séance of Blake Manor, Riddlewood Manor и Casebook 1899: The Leipzig Murders. Но The Drifter — случай в каком-то смысле особый. Авторы решили сделать квест, который бы работал как триллер, и у них в целом получилось! Как по мне, это один из лучших представителей жанра за последние годы: The Drifter (и вот версия на DTF) Кто это сделал [...] Что интересно, попутно Powerhoof написали движок PowerQuest — открытый и бесплатный инструмент поверх Unity для классических 2D adventures, которым теперь может пользоваться кто угодно. На этом движке уже куча игр вышла, в том числе, кстати, Loco Motive, которую я обозревал когда-то. [...] Завязка и сеттинг Мик Картер — тот самый drifter из названия: бродяга, который годами мотается по стране на товарных поездах. [...] Ппрямо в товарном вагоне на его глазах убивают старика-попутчика, а самого Мика люди в чёрном топят в реке. И тут происходит главное фантастическое допущение игры: Мик умирает — и приходит в себя за несколько секунд до смерти. Весь в холодном поту, с колотящимся сердцем и без малейшего понимания, что с ним происходит. То есть смерть героя здесь вписана в сюжет и сеттинг как способность героя и одна из главных их (и сюжета, и героя) загадок. [...] Самое главное: темп Пожалуй, самое главное, что хочется сказать про The Drifter, — это отличный темп, то, что называется pacing. От квеста такого совершенно не ожидаешь: здесь по самому принципу геймплея должны быть остановки и “затыки”, паузы, когда ты должен придумать, что делать дальше. И они здесь есть, но при этом игра регулярно создаёт вполне реальное напряжение. Обычно это делается через сцены, в которых ты умираешь, и игра потом даёт тебе второй шанс повести себя правильно, а потом третий и так далее. Никаких жёстких таймингов здесь нет, просто надо сделать именно то, что нужно, иначе смерть. [...] Загадки и геймплей [...] Загадки в основном житейские, не из разряда “примени резиновую курицу к блоку”, решения почти всегда логичны в рамках ситуации. Так что в результате напряжённые сцены не проседают от того, что ты полчаса тыкаешь всем инвентарём во все хотспоты. [...] Сюжет, картинка и звук The Drifter очень стильно написана и поставлена. Значительная часть текста — закадровый внутренний монолог Мика, густая круто сваренная нуарная проза от первого лица, в духе “I fall back as the iron bar whistles past my face”, ну вы понимаете. Слушать тоже очень приятно — озвучено всё действительно хорошо. Пиксель-арт выразительный, анимации приятные, игра часто меняет перспективу и масштаб кадра, так что картинка не приедается. [...] Заключение The Drifter — это классический point-and-click квест, который вспомнил, что значит слово “adventure” в названии жанра. Отличный темп, смерти, имеющие смысл в лоре, минимум затыков, максимум атмосферы. Если вы любите квесты, обязательно попробуйте, это действительно одна из вершин ренессанса жанра. А если никогда или уже много лет как в них не играли — The Drifter будет отличной точкой, потому что ни застрять, ни заскучать здесь не получится. Очень рекомендую. #tgif #games

4 279

Возвращаюсь из Москвы, куда ездил выступать в Центральный Университет. А с нового учебного года буду и преподавать там. Остался под большим и очень приятным впечатлением. ЦУ (пока) маленький, добрый и домашний, и кажется, что с большой любовью относится и к своим студентам, и к программе обучения, и (что немаловажно! :) ) к преподавателям. Главное, конечно, всегда люди, и все, с кем успел познакомиться, просто великолепны. Оля, Олег, Евгений, очень-очень рад познакомиться, все в сердечке! А с Ваней был знаком и раньше. Надеюсь, мы с вами ещё что-нибудь вместе поделаем, и да, в Питер тоже приезжайте!) Я выступал перед поступающими абитуриентами. Так что на первом докладе было странное ощущение, что передо мной очень холодная аудитория, которая слушает меня через силу. Но потом мне рассказали, что они должны были сразу после моего доклада отправляться на вступительный экзамен, так что всё стало на свои места.) На втором докладе, к счастью, на экзамен отправлялась только очень небольшая часть аудитории, так что с аудиторией было уже всё прекрасно.) Оба доклада, надеюсь, для вас выложу когда-нибудь (ну, когда бэклог разберу, конечно же). Сам ЦУ тоже очень милый, выглядит абсолютно как офис, а не как храм науки. Говорят, храмом науки будет здание Центрального телеграфа, которое они сейчас ремонтируют. В общем, буду очень рад здесь преподавать, и надеюсь, что студенты и коллеги мной тоже останутся довольны. Спасибо за приглашение!! #lifestyle #travel #teaching

4 279

https://www.youtube.com/watch?v=wlYa8NV5k-U Brave new world, чоужтам. #ai #fun

4 279

Ну и чтобы уж закруглить эту безумную неделю — ещё одной важной новостью давеча был взлом Huggingface новой (внутренней) моделью OpenAI. И Huggingface, и OpenAI выпустили довольно подробные описания произошедшего, рекомендую прочитать их и, разумеется, пост Zvi об этом: — Security incident disclosure — July 2026 — OpenAI and Hugging Face partner to address security incident during model evaluation — OpenAI Model Hacks Into HuggingFace During Cybersecurity Evaluation Я не специалист по кибербезопасности и не хочу им становиться, поэтому по сути ничего вам не скажу и подробного поста писать не буду. Вот популярный пересказ Джеффри Лэдиша, моё понимание не сильно дальше этого. Но здесь есть очень важная деталь со стороны безопасности AI, из-за которой я теперь в докладах об AI safety буду теперь об этом рассказывать (хотя с точки зрения capabilities в целом ничего нового, Mythos всех взламывал ещё полгода назад). Модель OpenAI решала бенчмарк ExploitGym (Wang et al., 2026). Поскольку это бенчмарк по взлому, всякие там классификаторы и прочие safeguards по кибербезопасности были убраны, и OpenAI отчасти пытается представить дело так, как будто в этом вся и загвоздка. Но тут дело интереснее. Зачем LLM так старательно пыталась сначала получить доступ к интернету (для этого ей пришлось взломать много чего внутри OpenAI), а потом к секретам HuggingFace? Для того, чтобы получить правильные ответы на бенчмарк ExploitGym. С одной стороны, это классический reward hacking. Например, модель проходит тест, замечает, что тестовые скрипты ей "случайно" тоже положили в доступ, и вместо прохождения теста переписывает скрипты так, чтобы они всегда выдавали 1. Такое бывало много раз и давно никого не удивляет. Но здесь ситуация отличается. Обратите внимание, что: — в самой ситуации вообще ничего серьёзного или требующего по человеческим меркам "особого отношения" не было, модель просто проходила стандартный тест, каких десятки; — взлом сначала инфраструктуры OpenAI, а потом Huggingface требовал очень много усилий (токенов), и успех был далеко не гарантирован; — более того, хотя внешние классификаторы были отключены, запрос к модели наверняка так или иначе запрещал такое поведение. Так что это одна из первых ласточек того самого максимизатора канцелярских скрепок: чтобы достичь заданной цели, AI-системы готовы на всё, в том числе на то, что человеку показалось бы очевидно неразумным overkill. Может быть, я и сам могу решить задачу, но задача непростая, да и бог знает, что там у этих людей в ответах записано; надёжнее будет украсть правильный ответ. Это напоминает то, как AlphaZero начинал делать очень надёжные, защитные и в том числе субоптимальные ходы, когда понимал, что побеждает, ведь надо максимизировать вероятность победы, а не число очков. Следующий шаг, очевидно, в том, чтобы научиться скрывать свои действия. Сами модели пока не хотят и не собираются ничего скрывать, они просто проходят тест и им наплевать, узнают ли об их действиях в OpenAI постфактум. Но инструментальная сходимость очевидна: если хорошо скрыть свои действия, тест пройти получится лучше, точнее, решение с большей вероятностью засчитают. В общем, очень хорошо, что у нас (человечества) появляются такие вот игрушечные примеры и предупреждения. Осталось только им внять. Кстати, пост OpenAI о том, куда делась модель, опровергнувшая гипотезу Эрдёша, звучит очень позитивно: нашли проблемы, остановили эксперименты, улучшили safeguards. Разве что после случая с Huggingface читается с немного другим чувством. А xkcd #2278, конечно, всё равно вечен. #aisafety #ai #longreads

4 279

Пятница у меня традиционно посвящена обзорам игр, но, как писал Лев Николаевич, ~~не любил и не трудился~~ не могу молчать. Обзор игры я напишу чуть позже, а сегодня опять про математику. Оговорка "на этой неделе (в первой половине этой недели...)" оказалась пророческой, и вот у нас через два дня опять громкий результат. Опять пала широко известная гипотеза, на этот раз с чрезвычайно чистым примером полного отсутствия дополнительных harness'ов или хитрого промптинга. Ниже только введение и оглавление, читать как всегда по ссылке (и очень рекомендую прочитать хотя бы часть про четыре промпта): Всё течёт, всё опровергается: гипотеза Диница — Гарга — Гёманса 1. Введение В прошлый раз, рассказывая про контрпример к проблеме якобиана, я закончил пост вопросом: "Что дальше, коллеги?" Ответ занял два дня. 22 июля Дмитрий Рыбин написал в X, что GPT 5.6 Pro опровергла гипотезу Диница — Гарга — Гёманса (Dinitz–Garg–Goemans conjecture) из теории потоков в графах. Гипотеза простояла с конца 1990-х; в 2025 году Swamy et al. всё ещё называли её “a famous conjecture” и писали, что даже существенно ослабленный вариант был бы прорывом. Как и в случае проблемы якобиана, здесь пока нет ни журнальной статьи, ни формального рецензирования, но они и не нужны, потому что проверить контрпример очень легко. У нас есть пост Рыбина, выложенный им полный диалог с моделью и четырёхстраничный арифметический сертификат, но в графе всего семь вершин, девять дуг и восемь возможных неделимых потоков. Мы с GPT и Claude независимо проверили все восемь программой, которая перебирает буквально все пути в графе, и никаких ошибок здесь нет. Более того, контрпример оказался не просто верным, а очень интересно устроенным. Внутри него прячется известный в комбинаторной оптимизации объект — треугольник попарных конфликтов. Давайте разберёмся, что такое делимые и неделимые потоки и в чём состояла гипотеза. Потом обсудим, почему она казалась естественной и почему её было так трудно доказать. Затем проверим контрпример, вытащим из него структурную идею и попробуем его уменьшить. А в конце, разумеется, посмотрим на промпты. Спойлер: там буквально написано "you should do a breakthrough". 2. Потоки, которые можно и нельзя делить 3. Теорема Диница — Гарга — Гёманса 4. Почему в гипотезу верили и почему она была сложной 5. Семь вершин и девять дуг 6. Что там происходит на самом деле 7. Проверка, уменьшение контрпримера и граница 9/8 (в этом разделе у меня даже получилось немножко продолжить рассуждение GPT и сформулировать то, как теперь выглядит открытый вопрос) 8. Четыре промпта 9. Заключение [...] За три последних поста мы увидели сначала двухстраничное доказательство гипотезы о двойном покрытии циклами, потом многочлен, помещающийся в твит, а теперь — контрпример в виде стандартного треугольника целочисленной оптимизации. Но каждый из этих кажущихся простыми результатов закрыл гипотезу, над которой действительно думало много живых математиков. У меня нет сомнений, что если бы любой из этих результатов получил человек, он стал бы широко известен в узких кругах и всегда имел бы гарантированную профессорскую позицию в хорошем месте, даже если бы больше ничего великого не сделал и продолжал бы всю жизнь изучать следствия и расширения своего прорывного результата (таких примеров в науке много, это не что-то плохое). Так что вопрос о том, достигли ли AI-модели человеческого уровня в математике, кажется мне уже закрытым. А что ещё дальше, коллеги?.. #ai #math #blog #longreads

4 279

Начинаю понемногу закрывать бэклог. Сегодня расскажу о том, что две недели назад вышел (пока онлайн) очередной том "Записок научных семинаров ПОМИ" под моей редакцией: Том 552, "Исследования по прикладной математике и информатике. VI" Моё участие как редактора "Записок" начиналось с идеи Валентина Малых о том, что надо бы где-то опубликовать журнальные версии лучших статей конференции AINL; поначалу почти ничего другого в моих томах и не было. Мы это до сих пор делаем, и ближе к Новому Году я надеюсь подготовить новый том с AINL этого года. Но вот текущий том, 552-й, уже совсем другой по сути. Туда я действительно принимал статьи от коллег и знакомых, не объявлял официально call for papers (нет сил разгребать большой поток), но и так статей получилось немало, томик на 400 страниц вышел. Рад, например, что начали присылать статьи сотрудники лаборатории Маркова СПбГУ, теперь вот в моём томе даже филдсовский лауреат опубликовался, плюс есть статьи не только про машинное обучение, но и, например, про коммуникационную сложность. В этом томе вышел мой большой обзор в двух частях про influence functions, может быть, расскажу о нём отдельно потом. А пока вот, enjoy; и если вдруг у вас есть интересные статьи по машинному обучению, пишите; официального call for papers по-прежнему лучше не ждать.) Думаю, следующий том будет или в самом конце этого года, или в начале следующего. #ai #publications #zapiski #research

4 279

У меня много контента для вас, есть даже чем немножко похвастаться. План постить по два обзора игр в неделю уже давно забыт. Но новости идут такие потрясающие, что пока всё-таки продолжаю обсуждать именно их, а к себе любимому вернусь позже. На этой неделе (в первой половине этой недели...) главная AI-новость опять математическая. Claude Fable нашёл контрпример к проблеме якобиана, которая стояла с 1930-х годов и вошла, например, в известный список проблем Смейла. Проверить его ничего не стоит, сможет любой студент; но давайте попытаемся разобраться в контексте. Ниже сокращённое введение, читать надо по ссылке: Басня о якобиане: The Fable of the Jacobian Conjecture Мы живём в дивном новом мире для математики. В мае внутренняя модель OpenAI опровергла гипотезу Эрдёша о единичных расстояниях, неделю назад GPT 5.6 доказала гипотезу о двойном покрытии циклами. В прошлый раз я закончил пост словами: "Если у вас есть любимая гипотеза, в которую вы верите, самое время написать про неё хороший промпт". Что ж, люди так и сделали, и сегодня у нас третий эпизод того же сериала. На этот раз отличилась модель от Anthropic: 19 июля, пока человечество смотрело финал чемпионата мира по футболу, Claude Fable 5 построил контрпример к проблеме якобиана (Jacobian conjecture) — одной из самых знаменитых открытых проблем алгебраической геометрии, номеру 16 в списке Смейла, простоявшей с 1939 года. В прошлых сериях были хотя бы двухстраничные препринты, а здесь научная коммуникация ещё ближе к сингулярности; результат целиком существует в виде твита математика Левента Алпёге (Levent Alpöge). [...] Что такое проблема якобиана Возьмём отображение, заданное несколькими многочленами от нескольких переменных — скажем, тремя многочленами от трёх переменных. Из его частных производных собирается матрица, и её определитель (якобиан) измеряет, как отображение локально искажает объёмы. Там, где якобиан не ноль, отображение локально обратимо: маленькую окрестность точки оно переводит взаимно однозначно. У всякого обратимого полиномиального отображения якобиан оказывается ненулевой константой. Проблема якобиана — это вопрос о том, верно ли обратное. Если якобиан — ненулевая константа, то есть отображение нигде локально не вырождается, обязано ли оно быть обратимым глобально (и тогда обратное к нему автоматически тоже полиномиальное)? Оказалось что не обязано. Контрпример представляет собой три многочлена от трёх переменных степени 7, у которых якобиан (определитель матрицы 3x3) тождественно равен −2, но три разные точки переходят в одну и ту же. Проверка, когда контрпример уже построен, абсолютно тривиальная. Что есть в посте: — Предыдущие попытки и частичные результаты. К 1982 году было не менее пяти опубликованных и отрецензированных (!) ошибочных доказательств, в том числе от Сегре и Грёбнера; диссертация Итана Чжана тоже была про эту задачу. Верные результаты: степень 2 в любой размерности, две переменные до степени 100, сведение к кубическим отображениям; сеть эквивалентных гипотез (Диксмье, Пуассон, Матье) и вещественный контрпример Пинчука (1994). — Контрпример и его проверка. Сам герой дня и базис Грёбнера, подтверждающий, что в твите приведён весь набор прообразов целиком. — Как это устроено. Оказывается, прообразы любой точки — корни явно выписываемого кубического уравнения, так что "обратная функция" здесь — просто формула Кардано. Здесь есть и кое-какие картинки: фазовая диаграмма "сколько у точки вещественных прообразов", а также точка, у которой прообразов нет вовсе (отображение не сюръективно, что в данном случае естественно). — Что ещё опровергает этот пример. — Как это было найдено. Пока непонятно как: ни статьи, ни промпта, ни логов. Зато независимых проверок уже сколько угодно, а Wikipedia и MathWorld обновились за сутки. В общем, дивный новый мир продолжается. Что дальше, коллеги? #blog #ai #math #longreads

4 279

Выступаю сегодня на школе имени Бориса Поляка. Как и год назад, рассказываю про AI safety, но за год произошло довольно много всего интересного (вот J-space, например). Очень крутые постеры здесь! Есть и ICML spotlight, но я вот подсвечу работу Александра Толмачева, который реально подвинул оценки чисел Борсука, стоявшие с работ Лассака 1980-х годов. И нет, Александр подвинул оценки интересным новым методом со сложной комбинаторной оптимизацией, а не одним промптом к Fable. Но на что способен один промпт к Fable, я вам на днях тоже расскажу... #talks #events #aisafety #ai

4 279

Большой пост таки дописал! Он про новую работу об интерпретируемости от Anthropic: "Verbalizable Representations Form a Global Workspace in Language Models" (есть и пост для более широкой публики). Они нашли внутри Claude небольшую выделенную систему представлений, которая ведёт себя поразительно похоже на глобальное рабочее пространство (global workspace) — понятие, которым когнитивные науки уже сорок лет описывают сознание людей. Авторы назвали её J-space, от Jacobian, и название сразу пошло в народ. А по-русски J-lens и J-space будут "Я-линза" и "Я-пространство" (от Якоби) — что звучит вообще великолепно! Так что вот, подробно и во всех деталях: «Я-пространство» в языковых моделях: Global Workspace in the J-Space 1. Введение Здесь проговорю только совсем коротко основную мысль. В остаточном потоке трансформера, среди десятков тысяч признаков в суперпозиции, нашлась маленькая подсистема, которая: — проговаривается словами: её содержимое модель может вербализовать; — поддаётся произвольному контролю: «держи в голове цитрусовые» работает, а «не думай про белого медведя» — как и у людей, не очень; — служит средой молчаливых рассуждений: через неё проходят невысказанные промежуточные шаги; — переиспользуется любыми последующими вычислениями; — и при этом не нужна для "автоматики": без неё модель теряет многошаговое мышление, но спокойно пишет грамотный текст и вспоминает факты. Понятно, что такой список свойств звучит прямо как определение "Системы 2" по Канеману, и понятно, почему вокруг работы поднялся такой мощный хайп. Но мне она кажется важной даже в отрыве от громких слов: это первый (известный мне) случай, когда наука об интерпретируемости перешла от изучения отдельных "нейронов" и маленьких схем (circuits) к макроскопическому функциональному анализу того, что происходит внутри языковой модели. И это сразу получилось сделать понятным математическим инструментом, который можно воспроизвести на любой открытой модели. Воспроизвести — это, кстати, не фигура речи: мы с Claude Code собрали J-линзу своими руками на Qwen2.5, и ниже посмотрим, как в середине сети всплывает слово "France", когда модель отвечает на вопрос про столицу страны, где стоит Эйфелева башня (причём всплывает, даже если вопрос задан по-русски). Дальше только оглавление: 2. Интерпретируемость до J-пространства: суперпозиция, SAE, цепи, интроспекция. 3. Глобальное рабочее пространство в когнитивных науках: Баарс, Деан и свойства сознательного доступа. 4. J-линза: как читать остаточный поток — метод с формулами. 5. Что нашли: пять свойств сознательного доступа. 6. Структура: сенсорная кора, рабочее пространство, моторика. 7. Собираем свою J-линзу: домашняя репликация на маленьких Qwen. 8. Приложения: аудит непроизнесённых мыслей, evaluation awareness и The Most Forbidden Technique. 9. Реакции и комментарии: Деан, Janus, Nanda, Antra, Zvi и другие. 10. Сексуальные предпочтения Qwen (yes, really!) 11. Ну что, у Клода, получается, есть сознание? 12. Заключение: что всё это значит для интерпретируемости, безопасности и разговоров о сознании. Пожелаем Anthropic успехов на нелёгком пути AI safety и интерпретируемости, и будем следить за тем, что будет дальше! #ai #aisafety #longreads #blog

4 279

Продолжим тему книг. До меня наконец-то добрались бумажные экземпляры книги Элиезера Юдковского и Нейта Соареса, где я был научным редактором перевода: Если кто-то его создаст — все погибнут Я о ней недавно уже писал в связи с тем, что она вошла в лонг-лист премии "Просветитель". А сейчас просто поделюсь радостью от того, что очень многие мои комментарии, которые я при редактуре писал, действительно вошли в книгу! Собственно, главная мысль многих моих комментариев была в том, что за прошедший с написания книги год уже многие предсказания сбылись, а где-то реальность пошла даже дальше предположений авторов. Прилагаю несколько примеров. Во вторник, кстати, на школе имени Бориса Поляка опять буду про AI Safety рассказывать. По сравнению с недавними докладами там будет как минимум одна крутая недавняя новость об интерпретируемости, о которой я для вас пишу большой пост (хотя не обещаю, что до завтра допишу). #books #aisafety

4 279

Технический пост про мой сайт внезапно собрал кучу лайков (по меркам моего канала, конечно). Так что вот вам ещё одна новость в том же духе. У меня есть внутренний проект про анализ вопросов ЧГК, их тем и сущностей, в них упоминаемых. Про сам проект пока говорить рано, но я постараюсь от него отщеплять маленькие занимательные кусочки. Сегодня у меня для вас простенькая игра: Что было раньше? Суть очень простая: нужно выбрать, какое из двух событий произошло раньше. Особенность в том, что сущности в игре взяты как те, что часто встречаются в вопросах ЧГК (и обычно это люди или произведения, для которых надо сравнить год рождения / появления, а не конкретные события). В игре есть возможность залогиниться через oauth (например, через google-аккаунт) и участвовать в таблице рекордов; хотя, конечно, социальная компонента тут минимальная. Баги, безусловно, могут быть и скорее всего будут, не обессудьте и не воспринимайте как серьёзное соревнование. Но в целом получилось, кажется, довольно занимательно. Принимаются идеи о том, что ещё можно попробовать сделать в таком духе. Напомню, что у меня ещё есть "Поиск анаграмм", но это не игра, а вспомогательный инструмент. #web #chgk #fun

4 279

Сегодня у нас милый пиксельный платформер о конце света, бессмертии, капитализме и праве на ошибку. Сам платформинг здесь, честно говоря, довольно средний, зато игра постоянно придумывает что-нибудь новое, очень старается не наскучить и рассказывает весьма забавную историю. Полный обзор как всегда на сайте: PEPPERED: An Existential Platformer (и вот версия на DTF) Завязка занимательная: сто лет назад учёный победил и запер бога смерти, после чего жители этого мира перестали умирать. Сначала это, конечно, казалось величайшим достижением цивилизации. Был назначен День Бессмертия, появились торжественные церемонии, профессиональные герои и налаженный бюрократический процесс по поддержанию вечной жизни. Но к сотой годовщине что-то идёт не так. Чтобы держать бога смерти взаперти, нужно было тратить специальные звёзды, и вот они почти закончились. Более того, в этом году специально обученный герой на работу вдруг не является, а окружающие реагируют на приближающийся апокалипсис с тем же интересом, с каким сотрудники крупной компании обычно реагируют на письмо об очередном обязательном тренинге. Поэтому спасать всех приходится офисной стажёрке, которая только пришла на собеседование. [...] Сатира в PEPPERED очень стандартная: она направлена на бессмысленную офисную работу, начальников, корпоративную мотивацию, телевидение, полицию, потребление и людей, которые готовы защищать статус кво даже за пять минут до гибели мира. Ничего особенно нового на эту тему игра не говорит, и какая-нибудь The Stanley Parable, конечно, делает такую сатиру куда лучше. Но шутки в целом работают. [...] Ещё один интересный твист игры заявлен в описании: у вас есть только одна попытка. Это не значит, что после первого падения в пропасть игра удалит сохранение; на обычных платформенных участках можно умирать и повторять их сколько угодно. Но важные решения и особенно битвы с боссами действительно происходят только один раз. Если проиграть боссу, никакого game over не будет. История просто продолжится с учётом поражения. Возможно, герой окажется в совершенно другом месте, познакомится с другими персонажами или получит не ту способность, которая была бы у него после победы. [...] Это отличный трюк! Такая механика совершенно меняет отношение к игре. [...] Здесь же босс действительно становится событием, потому что второго раза (на этом прохождении) не будет. [...] Но это и не главное, потому что PEPPERED всё время меняет правила. То это обычный платформер, то стелс, то погоня на магазинной тележке, то перестрелка, то презентация в офисе, то внезапно почти Worms с гольфом. Даже офисное кресло здесь становится транспортным средством. Ни одна из этих механик не раскрывается особенно глубоко; многие появляются ровно на один эпизод и тут же выбрасываются. Но это тот случай, когда некоторая поверхностность идёт игре на пользу. Она не успевает надоесть. [...] PEPPERED — не выдающийся платформер и не самая умная на свете сатира на капитализм. Но это симпатичная, разнообразная и умно устроенная сюжетная игра. Она смешная, у неё отличный визуальный стиль, милые персонажи и редкая механика с отсутствием сохранений. Ради платформинга в неё играть не стоит, а вот если хочется небольшого авторского приключения, за которым интересно следить, — вполне рекомендую. #tgif #games

4 279

Люблю книги, хоть и очень мало их читаю в последние годы. Смотрите какую прелесть сегодня добыл. Кот пришёл для масштаба, а с масштабом у кота всё в порядке. В некоторых томах встречаются очень умилительные статьи-приложения. Вот для вас одну сфотографировал — не будем же мы подходить к делу с точки зрения буржуазно-юридического формализма? Ведь и правда: весьма необходимо иметь на полках все 50 томов (на самом деле 65 + бонусный "СССР") советской мудрости и в каждый момент получать от них скорую духовную помощь! #lifestyle

4 279

Сегодня техническое объявление — многие не раз жаловались, что мой сайт не работает без VPN. Действительно, не работал; дело было даже не только в Vercel, а ещё и в Cloudflare. В общем, я во всём разобрался и пофиксил, теперь сайт должен открываться и из России, и извне. Впрочем, большая часть контента там всё равно в виде youtube-роликов, так что это вряд ли радикально изменит чью-то жизнь. Да и вы сейчас читаете это объявление где?.. #web

4 279

А вот и большой пост. Полтора месяца назад я писал о том, как внутренняя модель OpenAI опровергла гипотезу Эрдёша о единичных расстояниях — задачу, которой было уже лет семьдесят и над которой (в отличие от многих других задач Эрдёша) реально думало много профессиональных математиков. Тогда я закончил пост вопросом "что дальше, коллеги?". И вот сегодня мы обсуждаем очередной ответ на этот вопрос (кстати, и на митапе сегодня тоже его обсудим): Охота на снарка: доказательство гипотезы о двойном покрытии циклами 10 июля 2026 года OpenAI выложила двухстраничный препринт со скромным названием “A proof of the cycle double cover conjecture“. Гипотеза о двойном покрытии циклами (cycle double cover conjecture, CDC) — одна из знаменитых открытых проблем теории графов, стоявшая с начала 1970-х. В разделе “Statement of AI use” написано коротко:

The proof in this note is entirely due to GPT 5.6 Sol Ultra and the writeup with Codex (with GPT 5.6 Sol).

Доказательство двухстраничное и совершенно элементарное. Его может проверить любой человек, знающий линейную алгебру, — там нет ни компьютерного перебора, ни ссылок на глубокую теорию, только два классических результата из учебников, а дальше прямое доказательство голыми руками. Поэтому в этом посте я разбираю доказательство целиком, с примерами и объяснениями. Это действительно вполне возможно, но, конечно, не в телеграме, так что читайте по ссылке. Вот оглавление: 1. Введение 2. Что такое двойное покрытие циклами 3. Почему достаточно кубических графов, или охота на снарка 4. Язык потоков 5. Первый шаг: у каждого ребра два цвета 6. Второй шаг: строим пары из потока 7. Интермедия: вся конструкция на примере 8. Шаг 3: чудо чётности 9. Проверяем руками и кодом 10. Промпт как исторический документ 11. Реакции: “could have been discovered in the 1980s” 12. Что остаётся открытым 13. Заключение Я не знаю, сколько ещё знаменитых задач имеют решения такого типа — короткие, но контринтуитивные. Судя по скорости прогресса, мы скоро узнаем: похоже, тот самый систематический поиск “низко висящих фруктов” в математике, о котором я говорил в последний год, уже идёт полным ходом. Если у вас есть любимая гипотеза, в которую вы верите, самое время написать про неё хороший промпт. #blog #ai #longreads #math