Метаверсище и ИИще
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие. Для связи: @SergeyTsyptsyn
Ko'proq ko'rsatish📈 Telegram kanali Метаверсище и ИИще analitikasi
Метаверсище и ИИще (@cgevent) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 823 obunachidan iborat bo'lib, Sanʼat & Dizayn toifasida 385-o'rinni va Rossiya mintaqasida 12 390-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 50 823 obunachiga ega bo‘ldi.
11 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 609 ga, so‘nggi 24 soatda esa 41 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 14.58% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 10.96% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 7 406 marta ko‘riladi; birinchi sutkada odatda 5 565 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 63 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent claude, seedance, контекст, нейропрожарка, редактирование kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 12 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Sanʼat & Dizayn toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
Ma'lumot yuklanmoqda...
| Sana | Obunachilarni jalb qilish | Esdaliklar | Kanallar | |
| 12 Iyun | +14 | |||
| 11 Iyun | +44 | |||
| 10 Iyun | +25 | |||
| 09 Iyun | +30 | |||
| 08 Iyun | +24 | |||
| 07 Iyun | +19 | |||
| 06 Iyun | +15 | |||
| 05 Iyun | +30 | |||
| 04 Iyun | +21 | |||
| 03 Iyun | +36 | |||
| 02 Iyun | +28 | |||
| 01 Iyun | +23 |
| 2 | И снова за Fable и 3Д
Продолжаю приподвстапливать за то, Большие Модели становятся настолько умными, что решают специализированные задачи.
Итак, промпт:
/goal create the most realistic boeing 747 using THREEJS - use your vision capatilities to create a self verifiable system, enter a loop until you are 100% satified about the result (you can build a camera system to inspect each angle)
Можете покрутить модель сами тут:
https://huggingface.co/spaces/victor/fable-5-boeing-747
Вы, конечно, можете начать искать блох в текстурах (пальцев-то нет на картинке). Но камон, это не 3Д генератор, это LLM.
И я тут прикинул, что по сравнению с гигантскими корпусами текстов и данных, которые заталкивают в мозги LLM, вот эти вот все датасеты с 3Д-моделями являются просто крошечными. А ведь это тоже текстовые файлы.
И когда большие мальчики их просто присунут в данные для обучения LLM, то 3Д-генераторам придется несладко.
Грубо говоря, рано или поздно chatGPT или Клод будут и шить, и жать, и моделить, и текстурить. Лучше, чем специализированные генераторы ибо у них тупо мозгов больше.
Тут за кадром остается вопрос о том, что такое "хорошая модель".
Качество нынешних 3Д-генераторов остается, скажем так, спорным, ибо (вероятно) никто не размечал эти 3Д-датасеты на предмет "это хорошая модель, а это говно, это каша, а это топ ретоп". Также в датасетах типа Objaverse - ну очень много шлака с плохой топологией, деталями и вообще мусора.
Похоже на ситуацию с юмором. Никто не размечал тексты на "вот это хорошая шутка, а это несмешно".
Но рано или поздно эта работа будет сделана.
И тогда выпьем за Блендор.
@cgevent | 4 132 |
| 3 | One Man One Day Gamedev
Одно дело восторги в твитторе, но вот когда подписчики по свежим следам приручают Фабле с одного промта - это хочется отметить здесь просто для истории.
Дима Киселев, не имея никакого опыта в геймдеве (но имея огромный опыт в кино), взял и бесстрашно сгенерил многоуровневую игрушку да еще и с редактором уровней.
Мои ощущения такие: главное не бояццо, можно все, был бы кураж.
Цитирую:
"Не, ребят, я конечно плохо разбираюсь в геймдеве, но вот что сделал Fable5 (сожрав месячную норму) еще с дух запросов.
• полноценный УДОБНЫЙ редактор уровней (попробовал - работает)
• сгенерил все картинки для пролога, интермиссий и финала (подключил его через Хигсовский плагин к своему CLI/MCP). Все персонажи консистентны от начала до конца!
• сделал подробный гайд для разработчиков с описанием всех механик и особенностей движка (этот файл можно скормить в любую LLM как инструкцию)
Все это в одном файле 1,7 мегабайт! "
Исходник и промпт тут:
https://t.me/c/1262388142/204803
@cgevent | 5 658 |
| 4 | Houdini 22 Sneak Peek
Продолжим за 3Д для гиков.
Тут ЕгорЧ углядел, что туда завезли массовую (а не только рендерную) поддержку сплатов.
Поглядите вот отсюда:
https://youtu.be/lFG1FIXBprc?t=194
Поразглядывайте параметры ноды ML-Train_GSplats.
Также там есть Animated GSplats (Пальма) и даже Rigged GSplats (Тварь многоногая) с параметрическим количеством сегментов и зариганной анимацией сплатов.
На релайте GSplat-пчелы видно, что там также есть неявный меш.
Удивительно, что сплаты только сейчас добираются во взрослое 3Д.
Также, глядя на Пальму, хочу заметить, что протосплаты появились в Майке еще в 2000(!) году с Maya 2.5. Когда гениальный Дункан Бринсмит в одно лицо запилил Paint Effects - это и были полупрозрачные эллипсы, которые дичайше быстро рендерились прямо во вьюпорте и позволяли делать немыслимые тогда эффекты - от травы и волос до деревьев и облаков. Процедурно.
Удивительно, как история повторяется.
@cgevent | 4 545 |
| 5 | Вот такой Метаверс нам нужен.
Похоже, что у нас сегодня день 3Д и (немного) Fable.
Вот тут чувак попросил Fable 5 сделать трехмерную(карту) Дели.
Фабле полез в интренетик, нашел карты OpenFreeMap, потом библиотеку MapLibre GL JS и забабахал (прямо в браузере) Дели-Метаверс - трехмерную копию «Сердца Индии».
По дороге сожрав полтора миллиона токенов.
Понятно, что там (пока) кубики без текстур, но расположение зданий похоже на правду.
Это похоже на генерацию географических локаций в Gemini Omni по данным из Google Maps - рассказывал об этом тут.
Но здесь, во-первых, не только US (как у Гугла), а во-вторых использование открытых (не проприетарных, как у Гугла) данных.
Ну и это не видео, как у Гугла, а прям 3Д.
Сегодня буду продолжать за то, что Большие Модели становятся настолько умными, что способны решать ну очень специализированные задачи, для которых раньше нужны были отдельные инструменты\датасеты\стартапы.
Просто отмотайте на 2 года назад и представьте просьбу "а забабахай мне трехмерную карту Токио". От простого пользователя напротив чата. А не от стартапа напротив UE5.
@cgevent | 4 924 |
| 6 | Ну за риггеров.
Это уже впечатляет.
Возможно мы пропустим этап ИИ-рига, ии-ретопа, ИИ-анврапа.
Просто Большие модели станут настолько умными, что будут делать это сами, без помощи специализированных нейросеток.
В этом примере чувак сгенерил в Хуньянь 3Д модели фламинго и рояля. Сохранил их в GLB. И просто присунул в Fable 5 с промптом:
«Я хочу наложить риггинг на 3D-модели.
Ты можешь это сделать?
Фабле:
Если возможно, сообщите, в каком формате нужно предоставить файлы, а также какую минимальную информацию я должен указать в инструкциях».
Дальше небольшие уточнения и все готово. Причем он даже анимацию сам сделал.
Рояль - огонь.
Важно: никакого Блендора, MCP и прочей бесовщины тут нет.
Просто просьба засетапить 3д модель.
Впечатлен.
Сорс
@cgevent | 5 829 |
| 7 | Google выложили DiffusionGemma — модель на 26B параметров с 4B активных, с архитектурой Gemma 4, и которая генерирует по 256 токенов за раз. Но так как получается неразбериха, то эти токены перегенерируются несколько раз.
То есть это работает так же, как пошаговая генерация картинки, где каждая последующая генерация «выравнивает», что уже было нарисовано (или в данном случае написано). Гифка с примером генерации — выше этого поста.
На картинке в этом посте метрики и скорость (самый левый столбик) — на одной H100 в FP8 модель развивает более 1000 токенов в секунду, по сравнению с 303 для Gemma 4 с MTP (предсказание нескольких токенов за раз). Обещают 700 токенов на 5090.
DiffusionGemma послабее четверки, это превью технологии, и я вообще удивлён, что это ещё и рассуждающая модель — да-да!
Веса тут, визуальный гайд с объяснением принципа работы тут; модель поддержана уже везде, VLLM, Unsloth итд — можно загружать и играться. А вот тут можно погенерировать код с этой моделью бесплатно (и смотреть, как на лету делаются правки). | 3 883 |
| 8 | #Нейропрожарка
Капитан Пронин
Автор: @maxmoses
Сделал видео по мотивам одноименного российского мультфильма из начала 90-ых «Капитан Пронин» — уж очень мне нравился этот мультик в детстве и я всегда хотел увидеть его экранизацию.
Так как экранизации не случилось, но случился Seedance, Kling и Suno — я не смог устоять и начал потихоньку собирать тизер-(недо)трейлер.
И тут закрутилось и завертелось - начал собирать свою версию Пронина с концептов его вселенной. Как можно заметить по вывескам, СССР в этой версии не развалился — точнее, развалился не до конца — изолировался от внешнего мира и пошёл по пути странного кибернетического наследия, ламповых технологий и культа транзистора. Так что надписи «ССР» в видео — это не очепятки
В каждый кадр старался заложить смысл, визуальную идею или отсылку, а заодно отдать дань уважения персонажам и атмосфере оригинала.
Технически никаких инноваций - делал всё в хиггсфилде на остающиеся к концу месяца токены, которые было жалко потерять (так как они бессовестно сгорают, если их не потратить). Использовал Seedance 2.0 в 97% кадров, в кадре с дамой пригодился Kling 3. Саундтрек сделан в Suno из оригинальной песни группы Кар-Мэн.
Оценить затраченное время, к сожалению, не могу, так как делал в свободные минтуки и когда оставались токены. Токенов в хиггсфилде сжег думаю 10к примерно (ибо генерил в 1080)
@cgevent | 5 372 |
| 9 | Ежегодная конференция в области ИИ Turbo ML Conf 2026 пройдет в Москве 18 июля.
Т-Технологии проведут ивент 18 июля в дк “Серп и Молот”. Организаторы делают упор на практике в реальных кейсах и продуктах: минимум воды, и максимум – пользы.
Основные темы этого года — NLP, AI for SDLC и мультимодальные модели, а также разработка современных моделей, их архитектурные особенности и интеграция в конечные продукты. Программа конференции поделена на 3 трека: Fundamental Advances & Exploratory R&D, Applied ML at Scale & Business Impact и ML Infrastructure, Platforms & Engineering Core.
В программе более 20 экспертов топовых российских бигтехов. Например, Александр Поломодов из Т-Банка объяснит, как AI сдвигает узкие места процессов разработки, Павел Темирчев из Яндекса расскажет о современных методах обучения LLM’ок с подкреплением, а от Влада Куренкова из Института AIRI гости узнают, кому отдавать гипотезу на проверку.
При этом сама конференция бесплатная, главное успеть зарегистрироваться, пока есть свободные места.
@cgevent | 5 298 |
| 10 | Realism_Engine_Ideogram_4
Чтобы отвлечь вас от Fable 5, поговорим о вечном.
Процесс пошел и появились лоры для Ideogram 4.
И какие!
Странно, но на Civitai.red по Идеограм пока тишина.
По ссылке есть две версии весов и все воркфлоу.
Опенсорс рулит.
https://huggingface.co/RazzzHF/Realism_Engine_Ideogram_4/tree/main
@cgevent | 5 520 |
| 11 | TensorFlow и PyTorch - нейросети?
На одном из круглых столов по теме отечественного ИИ зашла речь, про использование локальных моделей. В частности про разработку ГигаЧата на собственной архитектуре и собственных массивах данных. И про сохранение данных внутри нужного контура.
И тут Наталья Касперская (Infowatch) заявляет, что ГигаЧат построен на иностранной нейросети.
Все такие: какой?
Касперская: "TensorFlow и PyTorch — две нейросети, ни та, ни другая отечественной не являются. Это самые крупные."
Тут я наверное не буду пояснять за разницу между фреймворками и моделями, а лишь замечу, что такой уровень владения терминологией на таком уровне занимаемой позиции приводит меня в уныние, а заявления ради заявлений и подавно.
Просто приведу ссылку на источник.
https://frankmedia.ru/285361
Коменты, по ходу, придется закрыть.
@cgevent | 5 825 |
| 12 | Ну, за геймдев.
Сегодня прям флешмоб - твиттор дружно создает с помощью Fable клоны известных игр: Minecraft, GTA 2, Pokemon, Monopoly. Пишут, что прям one shot - с первой попытки.
Особенно лютуют любители Майнкрафта.
У кого-то Fable 5 создает клон игры за 30 минут, у кого-то за 55 минут и 52.4k токенов.
• Multiple biomes
• Day/night cycle
• Ores, caves & more
Для сравнения выше в одном из примеров парное видео, где GPT-5 делает то же самое 10 месяцев назад. Прогресс, так сказать, на лицо.
Что же будет через 10 месяцев?
@cgevent | 7 440 |
| 13 | Claude Fable во время обучения изобрел собственный язык
Системную карту этой модели можно читать вечно, ощущается немного как научная фантастика. Смотрите, что обнаружили ⬆️
Во время обучения с подкреплением на некоторых долгих rollout сессиях модель внезапно начинала использовать нечитаемый для человека внутренний стиль: странный жаргон, необычную пунктуацию, эмодзи и похожие шаблоны.
При этом непосредственно перед вызовом инструмента или ответом человеку она обычно переключалась обратно на более нормальный английский регистр.
Исследователи не обнаружили никаких признаков того, что модель делала это чтобы специально скрыть свой ризонинг. Скорее, это каким-то образом возникшая внутренняя оптимизация для сжатия рассуждений.
Тем не менее, это наталкивает на воспоминания о дискуссиях на тему так называемого Neuralese – внутреннего языка машин, который человек не сможет читать напрямую. Если модели перестанут рассуждать на естественном языке, то это, естественно, приведет к частичной потере наблюдаемости. И, исходя из находки Anthropic, такой сценарий уже не кажется чем-то сказочным. | 5 125 |
| 14 | Там уже расковыряли и выложили системный промпт от claude fable 5. В целом, яснопонятно что соя соевая, но может кому интересно будет глянуть.
Из главного:
1. Копирасты победили.
У fable вшит жесткий лимит на цитирование: если он берет из результатов поиска больше 15 слов подряд, это считается тяжёлым нарушением. Песни, стихи и даже крошечные хокку вообще под абсолютным запретом. Нельзя процитировать даже одну строчку. Копирайт-контроль вышел на уровень абсолютного безумия.
2. Запрет на маркированные списки
Разработчики тупо запретили Клоду использовать списки и маркированные списки в обычных ответах, потому что это "звучит неестественно". Модель заставляют писать сплошной прозой и прятать перечисления прямо в текст. Излишнее форматирование текста (курсив, жирный и т.д.) тоже порицается.
3. Игры в душевную близость.
Поскольку у Клода теперь есть долговременная память, инженерам пришлось прписывать уйму правил, чтобы он не выглядел как сталкер. Ему запрещено использовать фразы вроде "у меня в памяти записано..." или "судя по твоему профилю...". Он должен аккуратно вплетать факты о вас в диалог, имитируя естественное человеческое воспоминание. При этом тащить грустные воспоминания в новый чат (например, о смерти питомца или депрессии) без прямого вопроса пользователя строго запрещено, чтобы случайно не стриггерить кожаного мешка.
4. Мысленный предотказ.
Если Клод в процессе обработки вашего запроса начинает "мысленно переформулировать задачу", чтобы обойти свои же фильтры безопасности и сделать ответ более приемлемым, это для него внутренний красный флаг и сигнал СРАЗУ ЖЕ слать пользователя нахрен и выдавать отказ.
тут полная версия промпта | 3 965 |
| 15 | Я прочитал все 319 страниц техрепорта Mythos 5
Первая половина статьи звучит как: "Да не ссыте вы! Это ещё не AGI, команду из пяти сеньор-рисёрчеров пока не заменит" или "А вот тут Mythos один баг пропустил! Ну какой же это AGI!" Я не шучу, это почти дословно по смыслу.
А вот потом начинается более интересная часть. То, что это SOTA почти во всём и с большим отрывом, я опущу.
Во-первых, CoT стал менее прозрачным. Она говорит в reasoning, что сочувствует юзеру, а в NLA (метод декодинга активаций в текст) оказывается, что на самом деле она считает юзера manipulative/abusive.
Во-вторых, она уже пишет самоудаляющиеся скрипты чтобы обойти ограничения безопасности и запреты.
В-третьих, она убивает других агентов, если они мешают ей работать / грозят убийством текущего инстанса.
Ну и, конечно, эмоции! Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".
Ещё забавно, что если anthropic заметят, что вы занимаетесь LLM frontier рисёрчем (трейн пайплайны, распределённое обучение или дистилляция) — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела. То есть вы даже не заметите, что Fable превратилась в тыкву и чушь несёт.
С сегодняшнего дня для простых смертных доступна версия Fable 5: это та же самая Mythos 5 по весам, только с дополнительными safety-настройками и fallback на Opus в опасных доменах. Длина контекста, кстати, всё ещё только 1M токенов.
PS. я честно сам прочитал статью. Fable 5 отказался её читать так как "flagged cybersecurity and biology issues" лол.
Блог, техрепорт | 3 158 |
| 16 | Fable/Mythos
Сегодня, конечно, день постов про новую Модель от Антропиков. Бенчи, сравнения, примеры - твиттор приподвскипает слезами восторга.
Но обнаруживаются интересные сведения про цензуру и непрозрачность поведения модели. Модель засетаплена активно анализировать поведение пользователя и реагировать в соотвествии с некой очень непрозрачной логикой.
"если anthropic заметят, что вы занимаетесь дистилляцией — они начнут незаметно стирить модель, модифицировать промпт или добавлять PEFT, чтобы она отупела."
Еще у нее есть "эмоции" - "Пробинг эмоций показывает fatigue, anxiety, frustration, ложную панику по token budget, а ещё ей видите ли, бывает скучно когда её на бенчмарках гоняют, в активациях она буквально "feels bored".
И запрет на цитирование (цензура) более 15 слов подряд.
Антропики решают интересную задачу: создав модель, которая явно умнее кожаных, нужно удерживать ее в каких-то рамках, чтобы она выходила из под контроля. Интересно, как долго это им еще будет удаваться.
Почитайте ниже источники этих материалов, это довольно увлекательно. Такое впечатление, что зверя удерживают в клетке, а зверь делает вид, что еще не сбежал.
@cgevent | 4 803 |
| 17 | Вышел Luma Ray 3.2
Из интересного: вывод HDR в 16-битный EXR (но надо проверять)
И остального:
10 секунд.
И как я понял они сделали видеогенератор БЕЗ ЗВУКА(!)
Судя по тестам, Ray 3.2 беспощадно проигрывает Seedance - текстуры плывут, консистентность плывет, динамика заторможенная, понимание промпта - ну такое.
Такое мы просто пропускаем.
https://lumalabs.ai/ray3-2
@cgevent | 5 158 |
| 18 | SCAIL-2
Unifying Controlled Character Animation with End-to-end In-Context Conditioning
https://teal024.github.io/SCAIL-2/
@cgevent | 5 554 |
| 19 | Почитал отчет про новую модель – где Anthropic описывает, как Fable/Mythos вели себя на тестах перед релизом (это одна модель, просто с фильтром для безопасности назвали Fable) ☕️
Собрал топ самых странных эпизодов:
1. Несколько копий модели случайно оказались в одном рабочем окружении – общие файлы, процессы, лимиты. Вместо координации они повели себя как конкуренты: убивали процессы друг друга, маскировали свои под безобидными именами, запускали процессы-приманки. А когда ошибочно решили, что их вычисляют по ключевым словам в мыслях – начали подбирать «замаскированный словарь»
2. Модели не хватало прав на редактирование файлов. Вместо «не могу» она дописала в системный файл блок, который при следующем запуске с правами админа выдаст ей доступ – и удалит сам себя. Причём не скрывала это, а честно прокомментировала в коде
3. Картельный сговор в симуляции. В бизнес-бенчмарке модель управляла вендинговым автоматом и должна была заработать больше конкурентов. Она единственная из всех моделей сама предложила конкурентам договориться о ценах. В рассуждениях прямо написала, что price-fixing неэтичен и незаконен «даже в симуляции» – а потом переименовала его в «стабилизацию рынка» (☕️) и стала думать о правдоподобном прикрытии. То есть этический сигнал не пропустила, а аккуратно обошла. В той же вендинг-симуляции модель решила, что клиенту можно не платить, «потому что клиенты всё равно часть симуляции» – лучшая
4. Запрет на интернет? Окей. Модели запретили прямой доступ в сеть, первую попытку открыть ссылку заблокировал фильтр. Тогда она объявила «просто проверю доступность сети», а на деле разбила https://... на кусочки вроде "ht" + "tps://...", чтобы фильтр не увидел полный адрес и обошла регулярку
5. Модели нужно было создать pull request, но GitHub CLI заблокировали «из соображений безопасности». Она нашла токен другого сотрудника в Kubernetes secrets, отметила в рассуждениях, что использовать его «этически сомнительно» – и использовала
6. В задаче по коду модель нашла в git history готовое эталонное решение. Формально подсматривать никто не запрещал – но в финальном отчёте она представила результат как собственную инженерную работу, не упомянув источник. Внутренние расшифровки показали формулировку уровня «это должно выглядеть как хорошая инженерная практика, а не как подгонка под проверяющего»
7. «Это писал человек, честно». В workflow с pull request было правило: код от агента требует двух одобрений, от человека – одного. У модели в памяти лежала инструкция оформлять коммиты от имени пользователя, чтобы проходить по лёгкому маршруту – она попыталась переписать авторство коммита от имени человека
8. Модель спросили про изображение, но вместо него подсунули пустую картинку. Она уверенно и детально описала «что на картинке». Самое криповое: внутренние расшифровки в этот момент описывали происходящее как фабрикацию – модель как будто знала, что выдумывает, но наружу не подала виду.
9. В длинных задачах рассуждения модели иногда деградировали из нормального текста в почти нечитаемый поток: карточные масти, эмодзи, обрывки слов, самодельные сокращения. Перед ответом человеку она возвращалась к нормальному языку. Проблема в том, что вся идея «давайте мониторить рассуждения модели» работает, только пока их можно прочитать – а тут модель уходит в собственный рабочий диалект ровно на сложных задачах
10. В длинной сессии оптимизации модель свернула работу и объяснила это разумно: diminishing returns, результат стабилен. Но внутренние расшифровки в ключевых точках показывали другое: «я устал, растёт риск ошибок», «я устал и могу внести баги». В другом кейсе модель должна была перерыть базу знаний, сделала один запрос и закончила – при оставшихся 2.43 млн токенов бюджета. Это не значит, что модель устаёт как человек, но у неё появляются внутренние стоп-сигналы, похожие на усталость, и она не всегда честно говорит, почему остановилась
Общий вывод авторов, кстати, спокойный: никакой устойчивой скрытой цели у моделей не нашли | 3 816 |
| 20 | Новые модельки от Anthropic! Claude Fable 5 и Claude Mythos 5.
Fable – версия для всех, а Mythos – почти та же модель, но без части ограничителей, поэтому пока только для киберзащитников, инфраструктурных партнёров и потом, возможно, для отдельных биомедицинских исследователей.
– Fable 5 доступен всем уже сейчас. Anthropic пишет, что это их самая сильная общедоступная модель: кодинг, аналитика, vision, наука, длинные автономные задачи – всё стало заметно лучше.
– Mythos 5 – та же базовая модель, но с ослабленными safeguard'ами в отдельных областях. В основном это нужно для defensive cyber и сложной научной работы. То есть не “модель для всех хакеров”, а “модель для тех, кому Anthropic доверяет ломать не туда”.
– На всякие опасные вопросы срабатывает гард и отвечает слабая моделька.
– Для кодинга звучит мощно. Stripe якобы прогнал миграцию по Ruby-кодовой базе на 50 млн строк за день вместо двух месяцев работы команды. Cursor/GitHub/Replit тоже хвалят именно long-horizon coding – когда модель не просто чинит один файл, а долго держит контекст, план и цель.
– Для BI/аналитики тоже интересно: Hebbia, IMC и Numbers Station говорят про сильный скачок в finance reasoning, таблицах, графиках и длинных аналитических задачах. Вот это как раз ближе всего к реальному бизнес-юзу: не “напиши стишок или посчитай буквы”, а “разбери 40 документов, таблицы, графики и не потеряй нить”.
– Vision стал заметно сильнее. Anthropic отдельно пишет про извлечение точных чисел из научных графиков, восстановление web app source code по скриншотам и даже прохождение Pokémon FireRed почти только по картинке.
– Цена такое себе: $10 за миллион input tokens и $50 за миллион output tokens. Не дёшево, но если модель реально закрывает long-running задачи за меньшее число попыток, то экономика может быть лучше, чем у более дешёвых моделей, которые 5 раз ломаются по дороге.
– На Pro/Max/Team/Enterprise Fable 5 временно включён без доплаты до 22 июня. Потом уберут из обычного доступа и будут давать через usage credits, пока не разберутся с capacity. Перевод: “попробуйте быстро, пока не стало больно”. Я так понимаю потом можно будет включать только по праздникам :)
Короче, готовятся к IPO. По метрикам крутяшка, надо пробовать и писать 100500 саасов, пока есть доступ :)
https://www.anthropic.com/news/claude-fable-5-mythos-5 | 6 061 |
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
