Sinекура
الذهاب إلى القناة على Telegram
Канал Сергея Николенко обо всём, но в основном об AI. Сайт с выступлениями, лекциями и публикациями: https://sergeynikolenko.ru/
إظهار المزيد4 151
المشتركون
+224 ساعات
-77 أيام
+18330 أيام
أرشيف المشاركات
4 151
+8
Пост готов, извольте кушать! Здесь, как всегда, только краткое саммари, а читать во всех подробностях надо тут:
Recoverable but not stationary: линейные структуры в весах и активациях
У нас с моим давним другом и соавтором Ириной Пионтковской недавно вышла статья “Recoverable but Not Stationary: Local Linear Structures in Weights and Activations“ [...]
Она про геометрию того, что происходит с нейросетью, когда мы её дообучаем, — и про то, почему так много разных способов “редактировать” уже обученную модель оказываются по сути линейными. [...]
Линейное дообучение. Чтобы подкрутить поведение обученной модели, часто достаточно сдвинуть веса или активации вдоль одного линейного направления — так устроены task vectors, model soups, TIES, LoRA, а в пространстве активаций — activation steering, function vectors, representation engineering, ReFT. А недавние "neural thickets" и вовсе показывают, что вокруг предобученной модели плотно растут полезные направления, которые находит даже случайный поиск. Какая линейная структура реально есть в обученной сети, где она живёт и как далеко по ней можно двигаться?
Восстановление после забывания. Чтобы получить честный "правильный ответ", мы устроили специальный цикл: обучаем сеть на смеси задач, доучиваем на одной (остальные забываются), а потом несколькими шагами градиента восстанавливаем. Сдвиг этого восстановления и есть цель, с которой мы сравниваем кандидатов на "правильное подпространство" — локальное подпространство задачи, префикс траектории и крыловский базис.
Теория. Мы объясняем, почему случайный поиск вообще что-то находит в пространстве на миллиард весов: проекция случайного возмущения на полезное направление не зависит от размерности, а best-of-N усиливает её, почти не задевая соседние задачи — польза концентрируется, вред размазывается. Здесь есть прямо теоремы, хоть и простенькие.
Что показывают эксперименты: три масштаба. На синтетическом трансформере подпространство задачи действительно "уезжает" по ходу восстановления. На LoRA-адаптерах — главный количественный результат, точно подтверждающий теорию. На больших LLM картина более мутная, зато связь с активациями работает красиво.
Более широкая проверка. Мы сделали и более крупный независимый стресс-тест (кстати, во многом силами AI-агентов). И всё устояло: геометрия восстановления воспроизводится, префикс остаётся особым низкоразмерным объектом, и мы даже новый результат увидели, о том, что префикс — это вообще не крыловское подпространство.
Как всё это складывается вместе
Попробую теперь собрать общую картину.
Наш итоговый вывод получается в каком-то смысле отрицательным. Неверно, что нет никакой линейной структуры — она есть! Но нет и единого глобального вектора задачи (task vector).
Оказалось, что обученные задачи дают локальную низкоразмерную структуру, которая сильно зависит от того, где и как смотреть. [...] Объединяющая мысль простая: линейная структура в обученных сетях реальна, но локальна — она движется по мере обучения, зависит от масштаба и выглядит по-разному в весах и в активациях. [...]
Куда дальше? Здесь много разных направлений, и мы, конечно, продолжаем. Упомяну, например, один глубокий вопрос, который эта работа ставит, но не решает: почему вообще полностью обученные чекпойнты содержат рядом возмущения, способные резко улучшить конкретную задачу? Откуда берутся эти крайне избирательные локальные направления и когда они возникают — при предобучении, при дообучении, или это свойство самого ландшафта потерь? Это мне кажется важным продолжением наших исследований.
В общем, кажется, что мы нащупали правильную оптику, через которую разрозненные результаты о линейности и маленьких подпространствах становятся проявлениями одной локальной и подвижной геометрии. Большое спасибо Ирине за совместную работу над всем этим, и надеюсь, что самое интересное ещё впереди!
#blog #ai #longreads #research
4 151
Большой пост про науку готовится и уже почти готов. А пока у нас маленькая и чертовски "девочковая" игра. Но хоть я и мальчик, мне в целом понравилось:
Open Roads: добрая женская игра про жизнь
(и вот выложил на DTF)
Начну с бэкграунда: Open Roads делала студия Fullbright, которая когда-то выпустила Gone Home (2013), один из основателей жанра симуляторов ходьбы, и Tacoma (2017), в которую я играл когда-то давно с удовольствием. Анонсировали Open Roads в 2020 году, на главные роли пригласили настоящих больших актрис Кери Расселл и Кейтлин Дивер — для маленькой инди-игры это прямо звёздная озвучка.
А потом что-то пошло не так. В 2021-м в Polygon вышел большой материал о токсичном поведении основателя Fullbright Стива Гейнора по отношению к команде; половина студии ушла, проект чуть не развалился. В итоге Гейнор покинул Open Roads, а игру доделывала уже отдельная команда бывших фуллбрайтовцев. Но всё-таки в итоге игра вышла.
На дворе осень 2003-го, и ты играешь за девочку-подростка по имени Тэсс. У неё недавно умерла бабушка, и вот они с мамой Опал приехали разбирать вещи, оставшиеся в доме бабушки после окончательной распродажи.
Сам дом тоже пришлось продать. Да и вообще у них с мамой серьёзные финансовые трудности, а с папой мама уже давно в разводе, и вроде как он бросил семью и уехал куда-то на заработки.
Но тут ты начинаешь находить всякие вещи и записочки, и оказывается, что бабушка была отнюдь не проста. Кажется, у неё был поклонник (скорее даже больше чем поклонник), который объявился вскоре после смерти дедушки, и его тоже можно попытаться разыскать. Тэсс уговаривает маму устроить road trip, и они едут по заброшенным семейным владениям — от старого дома на “дачу”, а потом и к озеру у канадской границы.
Не знаю даже, о чём ещё тут рассказать, кроме сюжета, который не хочется спойлерить. Стиль игры приятный: светлые неплохо проработанные 3D-окружения от первого лица, которые перемежаются корявыми, но милыми двумерными анимациями персонажей. Геймплей сводится к поиску предметов и диалогам — интересных головоломок тут не ждите. Но атмосфера классического американского road trip передана здорово.
В итоге получается совершенно обычное бытовое приключение. Но хорошо сделано! Интересная история, хорошая динамика отношений между мамой и дочерью, актёрская игра действительно на уровне. Да и длится всего пару часов. Стоит попробовать.
#tgif #games
4 151
Мы с моим давним другом и соавтором Ириной Пионтковской недавно написали статью, и вот препринт выложили:
Recoverable but Not Stationary: Local Linear Structures in Weights and Activations
Это направление мне нравится и кажется интересным: это о том, как устроено пространство весов и активаций сети в окрестности минимума, особенно multi-task минимума, когда мы обучаем сеть делать сразу несколько вещей.
Есть куча работ о том, что там есть линейная структура, относительно небольшой набор направлений, вдоль которых происходят интересные вещи, — но как именно там эта локальная геометрия устроена? Как её изучать и что получится? На какие-то вопросы пытаемся ответить, но кажется, что эта наука пока ещё только начинается, и там ещё много интересного впереди.
Вам был бы интересен подробный пост об этой статье и вообще о том, на каких идеях всё это основано?
#research #ai
4 151
+1
Играем мы пока что как известная субстанция, но зато посмотрите, какой потрясающий плакат для нас сделала девушка Женя. :)
#chgk #lifestyle
4 151
Разбираем сегодня небольшую детективную RPG, которая сделана во многом настолько плохо, что действительно становится хорошо! Душевно и по-баварски:
Inspector Schmidt — A Bavarian Tale
(и вот выложил на DTF)
Сделала Inspector Schmidt мюнхенская инди-студия Active Fungus Studios [...] делали проект люди с куда большим энтузиазмом, чем бюджетом и опытом. [...]
Действие происходит в 1866 году в Верхней Баварии, сразу после Семинедельной войны, той самой, где немцы воевали с немцами (и немного с итальянцами), а Пруссия победила, как ясно из названия, очень быстро и объединила Германию под своим началом, а не австрийским.
Вы играете за Валентина Шмидта — студента-медика, который приезжает в тихую деревню Вольпертсхофен собрать данные для отчёта старшего коллеги. И тут, как водится, в луже находят погибшего после кабацкой драки крестьянина, и спокойная деревенская идиллия постепенно оборачивается набором тёмных секретов. А главному герою предстоит вовсю совать нос в чужие дела, чего простые баварские мужики не любят.
Геймплей
Ох, какой здесь геймплей! Это настолько невероятно плохо, что действительно в какой-то момент становится хорошо.
Вот, например, самое начало. Вы запускаете детективную игру, в которой вас отправили в небольшой баварский городок с формальным государственным делом. Вы идёте по узкой тропинке и приходите к мосту, через который вас не пускают.
Чтобы пройти, надо отвлечь охранников (что уже странно — вы вроде как при бумагах, практически представитель власти), и вам готов помочь местный мальчишка… если вы соберёте для него десять грибочков! [...]
А дальше начинается диалоговая RPG, где надо выбирать варианты ответов, но особых разветвлений нет. [...]
Но и настоящих проблем в геймплее было немало, в том числе багов. [...]
Создавалось впечатление, что каждую механику авторы делали впервые в жизни — потому что, видимо, так оно и было…
Стиль и атмосфера
Но в итоге все эти странненькие эпизоды, и даже баги, каким-то невероятным образом работают на атмосферу! Она здесь именно такая: чистый camp, добрая домашняя ролёвка с шутками-прибаутками. Игра прекрасно понимает свои ограничения, понимает всю свою корявость и, как говорится, embraces it, и от этого корявость превращается в обаяние.
Дух баварской деревни тут и правда чувствуется, несмотря на графику где-то между A и AA. И играть реально интересно! История действительно детективная, диалоги прописаны с юмором, в сюжете нет особых вот-это-поворотов, но интрига есть и разворачивается как надо. В игре есть даже серьёзный исторический фон — рабочее движение, идеи демократии, которые занёс в деревню местный учитель из Мюнхена, классовые трения между крестьянами и хозяевами.
Да и вообще сеттинг крутой и необычный — про жизнь баварской деревни после австро-прусской войны (о которой здесь все персонажи очень хорошо помнят) не то чтобы много игр сделано. Правда, разговоры о политических делах были сделаны довольно поверхностно, и я так особо ничего общечеловеческого и не узнал.
И немного о юморе. Это же немецкая игра, и юмор там немецкий. Поэтому, конечно же, среди сайд-квестов не могло не быть военного, застрявшего в сортире с несварением; и это, вопреки стереотипам о немецком юморе, действительно смешно сделано.
Заключение
[...]
Если вы готовы простить игре примерно всё ради той самой “души”, попробуйте. Я не пожалел. Кстати, не пожалели многие, игра продалась тиражом в сотни тысяч копий, и студия уже успела выпустить полноценный сиквел. Про него я вам тоже когда-нибудь обязательно расскажу.
#tgif #games
4 151
Не знаю уж, как мы на чемпионате России выступим. Не давался нам этот турнир даже в лучшие времена, в прошлом году вообще был полный провал, надеюсь, в этот раз всё-таки такого провала не случится.
Но вид из окна у меня огненный уже прямо сейчас!
#chgk #lifestyle
4 151
Год с лишним назад вышел AI 2027, который не побоялся поставить конкретные даты на дороге к AGI, RSI, ASI и так далее. А пару недель назад сооснователь Anthropic Джек Кларк написал, что по его оценкам с вероятностью 60%+ к концу 2028 года появится ИИ, способный полностью автономно обучить своего преемника. "I don't know how to wrap my head around it".
Сегодня у нас большой разбор: где мы сейчас на пути к recursive self-improvement, насколько сбывается AI 2027 и запустят ли LLM-агенты сингулярность. Пост по ссылке, ниже оглавление и краткие саммари разделов:
AI 2027 в 2026: нам и правда остался год?
1. Предисловие
2. AI 2027 чуть подробнее: идея сценария, SC → SAR → ASI. 2027 — это мода, а не медиана. Сами авторы сейчас ставят сверхинтеллект на 2031–2035.
3. Табель успеваемости: две ретроспективы: реальность идёт с некоторым количественным отставанием, но качественные предсказания (агенты, инвестиции, отставание регулирования) сбываются. А автономный поиск 0-day уязвимостей, как мы все знаем, опережает прогноз.)
4. Горизонт автономности: главный график про агентов. METR time horizon удваивается каждые ~3–7 месяцев и ускоряется. Mythos почти буквально уже "superhuman coder" из прогноза.
5. Проблема надёжности: от бенчмарка к реальной работе. Скепсис: METR писал, что AI-инструменты замедляли разработчиков, а не ускоряли, половину проходящих тестов PR мейнтейнеры бы не приняли и так далее. Бенчмарк — это ещё не совсем то.
6. Автономия и autoresearch: бенчмарки. Что с autoresearch? SWE-bench по сути на свалке истории, на MLE-bench 17% → 64% за полтора года, RE-Bench насыщается, PaperBench не обновляется, а на фронтире сейчас AutoResearchBench (~9%). Чем более открытая задача, тем нужнее пока что человек.
7. Автономия и autoresearch: позитивные результаты. Но там, где есть быстрый честный верификатор, агенты уже делают настоящие открытия: гипотеза Эрдёша, AlphaEvolve, AI Co-Mathematician. Да и просто — вы сами-то пробовали последние модели?
8. Инфраструктура и сроки. Это та часть AI 2027, которая сбывается с опережением: компьют растёт на 5× в год, инвестиции в сотнях миллиардов $, Stargate опережает график. Компьют ограничителем вряд ли станет — если только не упрёмся в то, что каждую идею надо проверять дорогим обучением.
9. Запустят ли LLM-агенты сингулярность? Главный вопрос, конечно, не в дате, а в том, сходящийся это ряд или расходящийся. Уже сейчас Claude пишет 80% кода Anthropic, но сама Anthropic говорит, что RSI ещё не предопределено. Пока ещё появляются новые узкие места.
10. Чего именно не хватает: память и непрерывное обучение, надёжность на длинном горизонте, sample efficiency, вкус и постановка задачи, модель мира. Вряд ли эти стены так уж непреодолимы, но и не падают пока что.
11. Заключение: AI 2027, возможно, ошибся в скорости, но не в направлении. К концу 2027-го не стоит ждать развязки (слава богу!), мы в более медленном таймлайне. Но "не так скоро" не значит "никогда" или даже "не скоро": ставки против прогресса AI пока не сработали ни разу.
#blog #longreads #ai
4 151
Пробую всякий разный autoresearch с Claude Fable. До результатов там ещё далеко, а пока смотрите, какая красивая терминология постепенно родилась у Клода.
В исходных статьях были только dead and dying queues, дальше всё уже Клод придумал сам. Resurrected corpse of height c with unearthed mass a — это, чёрт возьми, красиво!
#ai #fun
4 151
Как и обещал (или вернее будет сказать "предупреждал"?), буду побольше выкладывать обзоров игр. Зато такие промежуточные обзоры точно будут коротенькими.
Сегодня у нас cozy-игра, симулятор доставки, и на первый взгляд кажется, что здесь вообще нет никакого второго дна:
Easy Delivery Co.: [анти]утопическая cozy-доставка
(и вот выложил на DTF)
Берёшь задание в своём компьютере, приходишь в магазин, где вдохновлённые Animal Crossing владельцы выдают тебе товар, отвозишь куда следует, получаешь деньги.
Более того, Easy Delivery Co. полностью оправдывает своё название: в геймплее нет вообще ничего сложного. Иногда тебе дают огромную кучу товара, который так и норовит разлететься и упасть (пачка коробок с пиццей на скриншоте была гораздо выше!)… но это не важно! Пока хоть что-то в кузове осталось, доставку зачтут в полном объёме.
Ты принял эту должность в наследство от некоего Себа, и продавцы в магазинах его иногда вспоминают. Но у них есть и своя жизнь: кто-то в кого-то влюблён, кто-то придумывает схемы по обогащению и так далее.
Есть и сюжет, который поначалу не вполне понятен: милый пёсик выдаёт тебе задания, которые выглядят просто как excuse для того, чтобы не сразу открывать всю карту, а постепенно. Обычно надо купить очередной апгрейд для грузовичка, чтобы смочь проехать в следующую локацию.
Кстати, есть и другие механики: тебе нужно пить кофе, чтобы хватило энергии, зажигалкой можно что-то поджечь или развести костёр, на котором можно сварить кофе в котелке, и так далее. Это далеко не immersive sim, но игра куда более разнообразна, чем кажется на первый взгляд. Есть даже рыбалка!
Но потом окружающая тебя реальность начинает трещать по швам. Диалоги становятся всё более сюрреалистическими, а места, в которых ты оказываешься, всё более лиминальными.
Но ладно, не буду спойлерить всю историю, там нет ничего сверхестественного, но мне понравилось. А сам геймплей действительно очень спокойный и приятный. В общем, рекомендую.
#tgif #games
4 151
+3
[технический пост, возможно, удалю потом]
Я удивился вчера, что мне поставили неожиданные реакции на пост, который вроде их не особо должен был вызывать. Но оказалось, что это симптом чего-то удивительного в Telegram.)
На свой предыдущий пост пользователи (даже я сам) почему-то могут поставить только одну из пяти эмодзи, которые туда, собственно, и поставили.) А на пред-предыдущий — тоже одну из пяти, но других! Причём это на разных OS устойчиво воспроизводится.
На постах раньше этих всё нормально, в настройках канала я ничего не менял. У вас так же? Кто-нибудь понимает, что происходит? :)
#blog
4 151
Не успел семестр закончиться, а сегодня опять начинаю преподавать. На этот раз в Harbour Space University, в Барселоне, наш обычный курс глубокого обучения.
Вообще-то я туда каждый год ездил, но виза давно закончилась, а в наше трудное время уже совсем неприятно стало её получать. В прошлом году я ещё как-то справился, а в этом уже нет.
Читаю онлайн лекции, а друг и давний соавтор мой Лёша Давыдов доехал (ему это куда проще), так что ещё и практики будут очными. Как по мне, отличный формат.
Да и господь с ней, с этой Барселоной. Надеюсь, что в Бангкок зимой съезжу -- это получается этакое мини-лето среди питерской зимы, дело приятное и полезное -- а сейчас, честно говоря, и дома замечательно.
Но вот сил от всего этого больше не становится, конечно. Теперь у меня лекция каждый день в течение трёх недель; мы с Лёшей, конечно, будем меняться, и по факту, наверное, многие лекции будут сдвоенными, но это всё равно целый полноценный курс. Да ещё и контента для вас с него никакого не будет -- Harbour Space всё-таки не разрешает выкладывать лекции в открытый доступ.
Ну и ладно.) Прорвёмся так или иначе. Чего и вам желаю.
#teaching #lectures #harbourspace
4 151
+7
Я на этой неделе был как-то невероятно продуктивен. Последние три дня подряд прямо сидел и фигачил, и много нафигачил, кажется.
Сегодня происходит непродуктивный откат, поэтому на что я потратил субботу? Правильно, на то, чтобы разбираться в образовательных теориях мотивации! Вот вам внезапный лонгрид (дальше только сокращённые введение и заключение, читать лучше по ссылке):
Мотивация в эпоху LLM: что говорит наука об образовании
В недавнем докладе про образование в эпоху LLM я пришёл к тезису, который мне самому кажется там главным. Доступ к знаниям давно перестал быть дефицитом, объяснение перестало быть дефицитом с развитием LLM — а вот мотивация учиться дефицитом быть не перестала, и именно к ней смещается центр тяжести всей системы образования.
Но, честно говоря, я тут же поймал себя на том, что понимаю “мотивацию” довольно примитивно. [...]
Так что я провёл половину субботы за увлекательным чтением всяческих работ по теории образования, и мне есть чем поделиться!
В этом посте я возьму за основу обзор Urhahne & Wijnia (2023), где шесть главных теорий раскладываются по единой модели действия “Ситуация → Я → Цель → Действие → Исход → Последствия”. [...]
Общий посыл этого текста таков. Про вред AI в обучении уже много писали: модели могут провоцировать cognitive offloading, то бишь лень поработать головой, снижают усилие, на котором держится обучение. Это всё реально, и я ниже честно это цитирую. Но я убеждён, что это не имманентное свойство языковых моделей, а артефакт того, как ИИ пока используют в образовании.
Поэтому в каждом разделе я разберу и то, как текущие практики мешают, и то, как ровно та же теория подсказывает, как AI может помогать. По структуре я буду следовать обзору Urhahne & Wijnia (2023), и в описаниях теорий мотивации тоже. Но в этом обзоре про LLM, естественно, ничего не говорится, так что обзор AI-исследований и выводы, связанные с AI, будут мои собственные.
Важный дисклеймер. [...] Всё это — социальные науки про самый сложный объект во Вселенной (человеческий мозг), измеряемый обычно на небольших и не особо репрезентативных выборках студентов-добровольцев. Эффекты, которые я вслед за авторами работ называю “подтверждёнными”, — это, как правило, скромные корреляции, добытые анкетами. [..] Так что это всё не “учёные доказали”, а “вот лучшее, на что я могу сослаться”. [...]
С этими оговорками — вперёд!
1. Теория ожидания и ценности (Expectancy–Value Theory, EVT)
2. Социально-когнитивная теория (Social Cognitive Theory)
3. Теория самодетерминации (Self-Determination Theory, SDT)
4. Теория интереса (Interest Theory)
5. Теория целей достижения (Achievement Goal Theory)
6. Теория атрибуции (Attribution Theory)
7. Саморегулируемое обучение (Self-Regulated Learning, SRL)
Заключение
Это был длинный пост! Но на самом деле по мере его написания у меня всё больше складывалось впечатление, что я переписываю примерно одно и то же всё новыми и новыми словами. Если сложить все семь разделов, проступает очень чёткая закономерность.
Вред возникает там, где ИИ забирает у ученика продуктивную работу — решает за него, снижает трудность, берёт на себя мониторинг.
Польза возникает там, где ИИ помогает ученику делать более трудную работу самому — поднимает ожидание успеха, даёт заработанные mastery-переживания, поддерживает автономию и компетентность, запускает и удерживает интерес, создаёт безопасную среду, в общем, тренирует когнитивные способности вместо того, чтобы их замещать. [...]
Так что AI-системы могут сделать для нас самый современный спортзал, но мотивацию им пользоваться нам всё-таки нужно будет приносить с собой. Вырастить (а скорее не убить) такую мотивацию — это и есть, на мой взгляд, центральная задача системы образования.
#blog #longreads #ai
4 151
+9
Наверное, летом будет больше постов про игры. Не потому что буду больше играть, а потому что другого контента будет меньше. У меня лежат несколько маленьких заготовок, которые должны были стать частями больших постов вроде "Две-три игры про икс", но, наверное, буду выкладывать по одной.
А сегодня у нас игра с очень стандартным геймплеем из жанра "девочка идёт слева направо". Но крутейший экзотический реальный сеттинг, да ещё и документальный фильм встроен. Полный обзор на сайте:
Never Alone (Kisima Ingitchuna)
(и на DTF тоже выложил)
Геймплей стандартный. Есть такой жанр [...] “мальчик идёт слева направо”. [...] Главные его представители вам наверняка знакомы: Limbo и Inside от Playdead, Little Nightmares, обозревавшийся мной The Plucky Squire, который из этой плоскости периодически выпрыгивает в 3D. А ещё почему-то вспомнилась очень милая Little Orpheus с ненадёжным рассказчиком; рекомендую, если вдруг не играли.
Здесь идёт не мальчик, а девочка — Нуна, девочка из народа инупиатов, — причём с волшебным песцом. Но суть геймплея точно такая же. [...]
Зато сеттинг крутой
А вот история, сеттинг и особенно контекст создания у Never Alone совершенно необыкновенные [...] Сюжет основан на реальной инупиатской легенде “Kunuuksaayuka” [...] И всё это рассказывается голосом настоящего сказителя на инупиатском языке (!), с субтитрами и видеорядом в соответствующем стиле.
Более того, это сделали отчасти сами инупиаты (Iñupiat) — коренной народ Аляски, живущий в основном на её севере и северо-западе, у самого Северного Ледовитого океана. Never Alone разработала студия Upper One Games, которую в 2012 году основал… Cook Inlet Tribal Council — некоммерческая организация из Анкориджа, помогающая коренным жителям Аляски.
Совет племён рассудил так: вместо того чтобы просто просить пожертвования, можно сделать что-то, что будет одновременно зарабатывать деньги, рассказывать миру об инупиатской культуре и возрождать интерес к ней у самих молодых инупиатов. [...]
В игре есть в том числе “cultural insights” [...] короткие документальные ролики, где настоящие инупиатские старейшины, сказители и обычные люди рассказывают о своих традициях, верованиях, истории и быте. [...] вот плейлист всех insights.
Есть и небольшое встроенное в игру дополнение, Foxtales, этакое DLC — отдельная история по другой легенде, “О двух прибрежных братьях”, не связанная с основным сюжетом, но снова с Нуной и лисичкой. Главное нововведение — каяк: теперь приходится ещё и плавать на лодке.
[...]
Заключение
Never Alone по геймплею ничего выдающегося из себя не представляет — это стандартный 2D платформер с простенькими головоломками. Девочка идёт слева направо.
Но я всегда обеими руками за то, чтобы игры осваивали что-то новое, рассказывали необычные истории, открывали новую незаезженную стилистику. Never Alone делает именно это, делает цельно и достойно, да ещё и документальный фильм показывает. Так что в целом я совершенно не пожалел, что прошёл, и вам тоже рекомендую.
#tgif #games
4 151
+6
Пока никак мне не отойти от конца семестра и никак не начать производить для вас контент большими ложками. Устал я очень, а со следующей недели начинается следующий очень плотный курс, который я, видимо, не смогу выкладывать.
Так что хорошо, что сегодня контент образовался сам собой. И он прямо супер-свеженький, с пылу с жару, заседание учёного совета ещё идёт, когда я пишу эти строки:
2026-06-04 — Ученый совет ФКН ВШЭ — Образование в эпоху больших языковых моделей
(слайды на странице "Выступления")
ФКН ВШЭ иногда проводит открытые заседания своего Учёного совета, на которых люди выступают со слайдами по разным темам. Не знаю, честно говоря, есть ли у таких заседаний внешняя реклама и можно ли туда подключаться вообще со стороны, но против выкладывания доклада коллеги вроде бы не возражали.
Сегодня очень острая для образования тема: что меняется в эпоху LLM и других AI-моделей, как нам строить образовательный процесс, что меняется в последнее время, что люди реально делают и так далее. Меня пригласили выступить, и я сделал очень общий доклад, с высоты птичьего полёта о том, что самое главное в этой трансформации.
Доклады там супер-короткие, меньше 15 минут, но я вроде бы смог провести два своих основных тезиса, которые не раз уже высказывал.
Во-первых, главная задача системы образования уже давно не в том, чтобы передать знания, а с появлением общедоступных индивидуальных тьюторов в лице LLM и не в том, чтобы педагогически верно их преподать. Главная задача в том, чтобы дать обучающимся мотивацию всем этим заниматься. Если есть мотивация, вас LLM уже прямо сегодня могут прекрасно обучить большинству областей университетской математики и computer science. Но без системы образования мотивация будет мало у кого.
Во-вторых, мы теперь уже точно теряем возможность предсказать, какие конкретные навыки будут нужны людям через годы. Вот сейчас, например, на наших глазах умирает человеческое программирование как написание кода, но пока ещё не как разработка программного продукта целиком. Но останется ли такая разработка человеческой деятельностью через 5-10 лет, мы уже никак не можем предсказать. Но это тоже не беда для системы образования! Мы учим детей делить в столбик не для того, чтобы они могли справиться без калькулятора при необходимости; такой необходимости, разумеется, никогда не возникнет. Мы это делаем для развития мета-навыков, в данном случае для понимания того, что такое алгоритм. Вот такие мета-навыки останутся нужными всегда (если человечество не вымрет, конечно, но это другая история).
Ну и традиционно отмечу, что GPT Images стал, кажется, ещё лучше. Выкладываю несколько слайдов — посмотрите, как он нарисовал пример деления в столбик, кажется, там буквально всё правильно, хотя я не просил ничего конкретного! Такая семантическая детализация раньше редко получалась.
#talks #ai #events
4 151
А вот закончился и курс "Графические вероятностные модели" в СПбГУ:
СПбГУ — 2026.05.29 — Введение в глубокое обучение
(слайды, доска и код, как всегда, на странице курса)
Поскольку deep learning уже точно перестал помещаться в один семестр, я стараюсь начать его заранее, в конце семестра предыдущего.
Так что последние две лекции были довольно стандартным введением в глубокое обучение. Начали с краткой истории вопроса, потом поговорили про один перцептрон и функции активации, потом перешли к SGD и обсудили сам SGD и его варианты от метода моментов до Adam и AdamW.
На этом пока всё! Присоединяйтесь к следующему семестру, когда мы обсудим все основные классы архитектур нейросетей и дойдём, надеюсь, до самого что ни на есть фронтира.
А я пока буду думать, как мне летом поддерживать тот уровень скорости выкладывания контента, к которому мы с вами тут привыкли. Скорее всего, никак. :) Но посмотрим. :)
#spsu #lectures #pgm2026
4 151
А вот и последний доклад на семинаре лаборатории Маркова:
Семинар Markov Lab — 2026.05.22 — Объединяя модели клиентов
(слайды на странице семинара)
Гарри Прошян (ПОМИ РАН)
Это на самом деле доклад о нашей с Гарри совместной статье "Beyond Isolated Clients: Integrating Graph-Based Embeddings into Event Sequence Models" (WWW'26). Постановка такая: большие цифровые платформы — банки, маркетплейсы, соцсети — порождают миллиарды событий вида "клиент-объект-timestamp", и по этим последовательностям хочется делать много разного, например предсказывать атрибуты клиента (пол, возраст, кредитный риск, склонность к мошенничеству).
Современные self-supervised методы для событийных последовательностей (например, CoLES и Barlow Twins) хорошо понимают временной порядок внутри истории одного клиента, но смотрят на каждого клиента изолированно и полностью игнорируют глобальную структуру. Но если посмотреть, как все взаимодействия вместе образуют двудольный граф "клиенты — объекты", то можно из него много чего интересного вытащить.
Гарри с соавторами попробовали много разных подходов, и оказалось, что выбор оптимальной стратегии диктуется плотностью графа. А ещё все подходы в целом model-agnostic, так что их можно применять независимо от того, что там внутри происходит.
#spsu #markovlab #seminar
4 151
Вспомнил, что так и не выложил своё выступление на Kopernik Forum 2026 в Шэньчжене. Коллеги всё записали и выложили, так что вот, даю прямую ссылку с таймкодом и выкладываю у себя:
AI and Mathematics: History, State of the Art, and the (Near) Future
(слайды на странице "Выступления")
Мне доверили открывать программу, и я рассказал в целом обычную свою лекцию о том, как AI меняет математику. Как водится, за прошедший месяц лекция уже устарела; вот, например, недавняя новость о гипотезе Эрдёша точно туда вошла бы.
Но общий смысл пока не меняется: LLM всё лучше справляются с математическими доказательствами. А если добавить ещё и разумную работу с какими-нибудь пруверами и дать побольше времени, то становится ещё лучше.
Кстати, сотрудники Anthropic сделали очевидный шаг и спросили Mythos про гипотезу Эрдёша о unit distances. И Mythos, разумеется, справился.
#talks #travel #ai
4 151
Всё, преподавание заканчивается. Вот последняя лекция из курса "Введение в глубокое обучение" в ЮФУ:
ЮФУ — 2026.05.28 — Фронтиры возможностей AI-моделей
(слайды на странице курса)
Это была уже, конечно, лекция обзорная и без математического содержания. Зато, надеюсь, интересная, примерно как мои обычные State of AI. Начал с ускоряющегося прогресса и текущего фронтира LLM. Потом рассказал о Situational Awareness Ашенбреннера: содержательная часть здесь в том, что там прогресс удачно разделён на три части (физическую, алгоритмическую и unhobbling), и это очень полезно понимать.
Потом через краткий обзор некоторых областей применений (роботы, картинки, видео) добрался до программирования и LLM-based агентов, Claude Code и всё такое прочее. А закончил, разумеется на AI в математике, и как раз символично получилось, что курс закончился на новости от 20 мая 2026 года.
Я сначала анонсировал, что будет ещё одна лекция про AI Safety, но потом выяснилось, что больше лекций в этом курсе уже не будет. Так что желающим всё-таки послушать простое и тревожное введение в AI Safety рекомендую "AI safety в начале 2026 года" с моей странички "Выступления"; это был рассказ для школьников в "Сириусе", так что ничего технически сложного там не было, а вот интересного было, надеюсь, много.
Спасибо всем, кто слушал, и, надеюсь, до новых встреч!
#sfu #lectures #dsfrontiers
4 151
Сегодня поговорим о редком для меня стратегическом жанре; пожалуй, только про Lessaria я когда-то писал в блоге. Впрочем, это не просто стратегия, а roguelike-стратегия, с метапрогрессией. Игра эта получила немало хайпа на релизе, вот теперь и я до неё добрался; давайте посмотрим, с чем её едят.
Длинный обзор, здесь сильно сокращён, читайте по ссылке:
The King is Watching
(и вот выложил на DTF)
Делали The King is Watching наши люди, маленькая студия Hypnohead [...] из Белграда. [...]
Кстати, геймдизайнер Hypnohead Семён Гурий регулярно пишет посты на DTF; вот большой пост с его историей и историей The King is Watching. Пост горячо рекомендую, а вот этот комментарий прекрасно отражает его суть. [...]
Игровое поле — это маленькое квадратное королевство (поначалу 4х4), на котором вы расставляете здания. [...]
Справа от королевства — экран войны, где идут волны нападающих врагов, против которых должны защищаться произведённые вами юниты. По сути tower defense, управлять вы юнитами не особенно можете. Всё это происходит в реальном времени, но с паузой, так что в целом никакого особого стресса и давления нет.
Зато есть главная фишка геймплея, отражённая в названии игры. Чтобы что-то работало, нужно, чтобы король, то есть вы, туда смотрели. У вас есть king’s gaze, область на карте, на которую вы “смотрите” — и работают только те здания, которые попадают в ваше поле зрения! Остальные тупо простаивают. [...]
А ещё здесь есть элементы roguelike. Много элементов! Вы открываете новых королей с их собственными механиками, новых советников, новые здания, новые апгрейды, Здесь сразу четыре разных дерева метапрогрессии с пассивными бонусами, которые растут через монетки, выдающиеся как за победы, так и за поражения. [...]
Ой, да, тут же ещё и события, и они очень забавно выполнены. [...]
В целом всё это приводит к тому, что The King is Watching сочетает в себе два главных свойства roguelikes:
— каждый отдельный забег оставляет ощущение недосказанности, и хочется тут же запустить следующий;
— разветвлённая метапрогрессия не даёт надолго застрять на одном месте.
Метапрогрессия богатая. Но какая-то она… слишком богатая, что ли. Главная проблема здесь в том, что, в отличие от других roguelikes, здесь один заход длится далеко не 10-15 минут. [...]
Так что сначала я примерно понял, как что работает, дошёл до threat level 2 на первой карте, но там застрял и проиграл несколько заходов подряд. Это, по идее, нормально и ожидаемо в такой игре. Потом вроде бы понял, что делал неправильно, прошёл threat levels 2 и 3, открыл карту с кладбищем и нежитью, там с ходу выиграл пару заходов и застрял опять. Звучит хорошо…
…но в этот момент я оглянулся и заметил, что провёл в игре уже 18 часов. [...] В общем, хотя ощущение “ещё один заход” никуда не делось, я понял, что пора принимать волевое решение и закапывать стю откладывать игру.
Заключение
Лично я люблю проходить игры. Мне в какой-то момент даже пришлось осознанно задушить в себе перфекциониста и перестать пытаться добывать ачивки (слишком уж часто это не какой-то интересный контент, а очень сложная и совершенно бессмысленная деятельность). Поэтому The King is Watching меня победила: кажется, что для того чтобы увидеть здесь всё (или хотя бы всё содержательное), нужно гораздо больше времени, чем я готов потратить.
Но если вы, наоборот, хотите найти игру, которая может не надоесть за десятки часов, это как раз то, что нужно. Так что в целом — безусловно рекомендую: всё то, что игра делает (roguelike-стратегия), она делает очень хорошо. Базовая идея свежа и интересна, игра совершенно не надоедает (как часто бывает со стратегиями!), “ещё один забег” всегда очень хочется.
Создателям игры безусловный респект и пожелания дальнейших успехов!
#tgif #games
4 151
Cеминар лаборатории Маркова, видимо, расходится на лето. На последнем заседании были сразу два доклада, вот пока первый:
Семинар Markov Lab — 2026-05-22 — Потоковое распознавание речи в реальном времени
(слайды на странице семинара)
Даниил Павленко (СПбГУ)
Доклад Даниила — про потоковое распознавание речи (streaming ASR): это когда аудио приходит не целиком, а кусочками в реальном времени, и системе нужно одновременно поддерживать низкую задержку (latency) и выдавать осмысленные промежуточные гипотезы. Это нужно для голосовых ассистентов, субтитров созвонов и в целом любой онлайн-транскрибации, когда результаты нужны в реальном времени.
Даниил рассказал введение в обработку звука (дискретизация, преобразование Фурье, спектрограммы) и обзор ASR-архитектур, а потом собственно рассказал о своей системе: замороженный streaming encoder из NeMo плюс проектор и декодер из Qwen3, обученные на 15 тысячах часов аудио. Центральная идея — внутренний механизм финализации: вместо внешнего модуля, который решает, что фраза закончилась и транскрипт можно отдавать дальше, это решение встраивается в саму модель.
#spsu #seminar #markovlab
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
