es
Feedback
Machine learning Interview

Machine learning Interview

Ir al canal en Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Mostrar más

📈 Análisis del canal de Telegram Machine learning Interview

El canal Machine learning Interview (@machinelearning_interview) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 30 037 suscriptores, ocupando la posición 4 565 en la categoría Tecnologías y Aplicaciones y el puesto 21 957 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 30 037 suscriptores.

Según los últimos datos del 10 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de 23, y en las últimas 24 horas de -8, conservando un alto alcance.

  • Estado de verificación: No verificado
  • Tasa de interacción (ER): El promedio de interacción de la audiencia es 19.73%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 10.07% de reacciones respecto al total de suscriptores.
  • Alcance de las publicaciones: Cada publicación recibe en promedio 5 925 visualizaciones. En el primer día suele acumular 3 024 visualizaciones.
  • Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 41.
  • Intereses temáticos: El contenido se centra en temas clave como claude, llm, контекст, hermes, nvidia.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 11 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

30 037
Suscriptores
-824 horas
-297 días
+2330 días
Archivo de publicaciones
🌉🤖 CodexMCP: Интеграция Claude Code и Codex CodexMCP — это мост между Claude Code и Codex, который позволяет им эффективно
🌉🤖 CodexMCP: Интеграция Claude Code и Codex CodexMCP — это мост между Claude Code и Codex, который позволяет им эффективно сотрудничать в программировании. Проект предлагает улучшенные функции, такие как многократные диалоги и параллельные задачи, что делает взаимодействие AI более интеллектуальным и продуктивным. 🚀Основные моменты: - Поддержка многократных диалогов и параллельного выполнения задач. - Усовершенствованное управление контекстом с сохранением сессий. - Интеграция с Claude Code для анализа требований и архитектуры. - Возможность отслеживания деталей вывода и обработки ошибок. 📌 GitHub: https://github.com/GuDaStudio/codexmcp #python

ГигаЧат представил обновлённое семейство GigaAM-v3 Giga Acoustic Model — это класс open-source моделей для обработки речи и э
ГигаЧат представил обновлённое семейство GigaAM-v3 Giga Acoustic Model — это класс open-source моделей для обработки речи и эмоций. В третьей версии опубликовали базовый аудиоэнкодер GigaAM-v3, улучшенные CTC и RNNT-модели, а также E2E-распознавание с поддержкой пунктуации и нормализации. Масштаб предобучения значительно вырос: с 50 до 700 тысяч часов аудио на русском языке. Появились новые домены в обучении ASR — от колл-центров до разговорной речи. Для всего корпуса обучающих данных восстановили пунктуацию и нормализацию через GigaChat Max Audio. Линейка CTC/RNNT и E2E позволяет выбирать между скоростью или максимальным качеством под любые сценарии. Что по метрикам: — Открытые датасеты (Golos, OpenSTT, Common Voice, LibriSpeech): паритет с GigaAM-v2. — Новые домены (WER, v2-RNNT → v3-RNNT): • речь с особенностями 27% → 19% • колл-центр 13% → 10% • спонтанная речь 10.3% → 7% — Пунктуация: v3-e2e-RNNT vs reference + Whisper Forced Decoding — F1-score по запятой 84% vs 62%, остальные знаки ~паритет — Side-by-Side (Gemini 2.5 Pro as a judge): v3-e2e-RNNT vs Whisper-large-v3 — 70:30 (колл-центр), 64:36 (Common Voice) Больше про язык, речь и искусственный интеллект в @gigadev_channel. Подписывайтесь на канал, чтобы не пропустить всё самое интересное!

🍌Nano Banan хороша! Промпт: "Make an infographic that explains how the transformer LLM works" https://aistudio.google.com/
🍌Nano Banan хороша! Промпт: "Make an infographic that explains how the transformer LLM works" https://aistudio.google.com/

🌍🗣️ Omnilingual ASR: Многоязычное распознавание речи для 1600+ языков Omnilingual ASR — это открытая система распознавания речи, поддерживающая более 1,600 языков, включая редкие. Она позволяет добавлять новые языки с минимальными примерами, делая технологии распознавания более доступными и инклюзивными для различных сообществ. 🚀Основные моменты: - Поддержка более 1,600 языков, включая уникальные. - Простота добавления новых языков без больших наборов данных. - Использует нулевое обучение и гибкие модели для адаптации. - Доступен на Hugging Face для демонстрации и использования. 📌 GitHub: https://github.com/facebookresearch/omnilingual-asr #python

Когда data-pipelines рушатся, а BI не обновился к утру, виноваты обычно не модели — а инфраструктура. Сломанный пайплайн, нес
Когда data-pipelines рушатся, а BI не обновился к утру, виноваты обычно не модели — а инфраструктура. Сломанный пайплайн, несвоевременное обновление данных или внезапное изменение схемы — каждый ML-инженер сталкивался с ситуацией, когда вместо улучшения моделей приходится разбираться с проблемами в данных. Для таких моментов создали бота-генератор оправданий. Он предлагает стильные объяснения для случаев, когда: — данные для обучения застряли в очередях — фичи оказались несогласованными — мониторинг моделей показывает аномалии А если всё ещё дебажите ETL в проде — загляните в Telegram-бота. Протестируйте разные варианты оправданий и делитесь самыми точными с командой — это поможет взглянуть на проблему под новым углом и найти нестандартное решение.

🤖 Google представила Nested Learning — новую парадигму ИИ, которая учится как человек и не забывает прошлые знания Google пр
+2
🤖 Google представила Nested Learning — новую парадигму ИИ, которая учится как человек и не забывает прошлые знания Google предлагает новый подход: Nested Learning - *вложенное обучение*, при котором новая информация интегрируется в уже существующую структуру знаний, а не замещает её. Как это работает? Каждое новое обучение добавляется внутрь уже выученного, как слой внутри слоя. Это позволяет модели: - сохранять предыдущие навыки - адаптироваться к новым задачам - отличать, в каком контексте она работает Что это даёт? 1. Постоянное обучение без потерь Модель может учиться бесконечно, не забывая старое. Новые знания не затирают прежние. 2. Контекстное понимание ИИ понимает, *в каком режиме* он работает — это делает поведение гибче и разумнее. 3. Ближе к человеческому мышлению Nested Learning приближает нейросети к человеческому типу обучения: поэтапному, постепенному и адаптивному. 📌 Подробнее: https://research.google/blog/introducing-nested-learning-a-new-ml-paradigm-for-continual-learning #google

Kandinsky 5.0 — новая линейка визуальных моделей в open source ⚡️Сбер опубликовал в открытом доступе всю линейку Kandinsky 5.0: Video Pro, Video Lite, Image Lite и токенизаторы K-VAE 1.0. Полный open source: код, веса, лицензия MIT. ➡️Video Pro (Text-to-Video / Image-to-Video) Флагман, генерирующий HD-видео до 10 секунд с гибким управлением движением камеры. Обучалась на 520 млн изображений и 250 млн видео и затем, на финальном этапе, доучивалась на датасете сверх-качественных видеороликов, тщательно отобранных профессиональными художниками и дизайнерами. 🔘Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Лучшая открытая модель в мире, превосходит Wan 2.2-A14B в Text-to-Video [SBS 59:41] и Image-to-Video [SBS 53:47], а также достигает паритета с Veo 3 по визуальному качеству и динамике [SBS 54:46]. ➡️Video Lite (Text-to-Video / Image-to-Video) Компактные модели генерации видео, оптимизированные для запуска на GPU от 12 ГБ VRAM. Обучалась на 520 млн изображений и 120 млн видео, хорошая консистентность и качество динамики. Лучшая среди небольших и быстрых моделей, значительно превосходит в 7 раз большую по количеству параметров Wan 2.1-14B как в Text-to-Video [SBS 67:33], так и Image-to-Video [SBS 64:36]. ➡️Image Lite (Text-to-Image / Image Editing) HD-генерация и редактирование изображений. Претрейн Text-to-Image модели был сделан на 520 млн изображений, включая датасет русского культурного кода ~1 млн изображений. Image Editing был дополнительно дообучен на 150 млн пар. Для достижения финального качества был проведено SFT дообучение на 150 тыс изображений, а также на 20 тыс. пар – для Editing. 🔘Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Значительно превосходит FLUX.1 [dev] по Text-to-Image [SBS 63:37] и находится в паритете по качеству с FLUX.1 Kontext [dev] по Image Editing [SBS 54:46]. ➡️K-VAE 1.0 (2D / 3D) Вариационные автоэнкодеры для диффузионных моделей, сжимающие входные данные в формате 8x8 (изображения) и 4x8x8 (видео). Сравнение на открытых датасетах показывает, что модели более качественно восстанавливают исходный сигнал (+0.5dB PSNR), чем лучшие open-source альтернативы (Flux, Wan, Hunyaun), обладающие той же степенью сжатия. Все модели линейки доступны на GitHub, Gitverse и HuggingFace. Читайте подробнее в техническом репорте.

🔥 Представляем AMO-Bench - новый бенчмарк, который проверяет границы логического мышления LLM на уровне задач IMO. AMO-Bench
+2
🔥 Представляем AMO-Bench - новый бенчмарк, который проверяет границы логического мышления LLM на уровне задач IMO. AMO-Bench включает: • 50 полностью оригинальных задач, созданных экспертами • подтверждённый уровень сложности — не ниже международной математической олимпиады • гибридный алгоритм автопроверки с точностью 99.2% • размеченные человеком цепочки рассуждений для глубокого анализа моделей Главные результаты: Модель Kimi-k2-Thinking от Kimi_Moonshot показала лучший результат — 56%. Следом идут GPT-5-thinking (high) и Qwen3-235B-A22B-Thinking-2507. Большинство остальных моделей не дотягивают даже до 40%. AMO-Bench открыт для всех — попробуйте и помогите продвинуть границы reasoning-возможностей больших моделей. 😊 Open-Source: HuggingFace: https://huggingface.co/datasets/meituan-longcat/AMO-Bench GitHub: https://github.com/meituan-longcat/AMO-Bench Paper: https://arxiv.org/abs/2510.26768 Project Page: https://amo-bench.github.io

🤖 AITradeGame - Симулятор торговли с ИИ AITradeGame - это открытый симулятор торговли, который позволяет пользователям тести
🤖 AITradeGame - Симулятор торговли с ИИ AITradeGame - это открытый симулятор торговли, который позволяет пользователям тестировать стратегии с использованием ИИ. Доступны как локальная версия с полной конфиденциальностью, так и онлайн-версия с интерактивными функциями и таблицами лидеров. 🚀Основные моменты: - Поддержка различных ИИ моделей, включая OpenAI и Claude. - Локальное хранилище данных без облачного отслеживания. - Интерактивные таблицы лидеров для соревнований с другими пользователями. - Удобный интерфейс и возможность настройки торговых параметров. 📌 GitHub: https://github.com/chadyi/AITradeGame

Конференция AI Driver & RecSys Темы — пространство, где наука и бизнес встречаются, чтобы обсудить будущее рекомендаций ⚡️ 28 ноября пройдёт конференция о том, как создаются и развиваются современные рекомендательные системы. На площадке Сбера соберутся эксперты топовых российских IT-компаний и вузов, чтобы обсудить новые исследования, открытые датасеты и практические решения, которые меняют подход к персонализации. Это возможность за один день познакомиться с ключевыми трендами RecSys, пообщаться со специалистами и вдохновиться идеями, формирующими будущее рекомендаций. Присоединяйтесь к профессиональному сообществу 28 ноября в 10:00 — регистрация по ссылке!

🎥 Создание видео с LongCat-Video LongCat-Video — это мощная модель генерации видео с 13.6 миллиарда параметров, способная выполнять задачи *Text-to-Video*, *Image-to-Video* и *Video-Continuation*. Она обеспечивает высокое качество и эффективность, особенно в создании длинных видео без потери качества. 🚀 Основные моменты: - Унифицированная архитектура для различных задач генерации видео. - Способность генерировать видео длительностью в минуты. - Эффективный процесс генерации с высоким разрешением. - Сравнимые результаты с ведущими коммерческими решениями. 📌 GitHub: https://github.com/meituan-longcat/LongCat-Video #python

Успей зарегистрироваться на масштабный ИТ-фест от МТС 🔥 21 ноября на True Tech Champ тебя ждет насыщенный день со зрелищной битвой роботов, нетворкингом и прокачкой навыков. В программе: 📝 Доклады о ИИ-технологиях. Специалисты MWS AI, Skoltech, Яндекса и Unitree Robotics расскажут о трансформерах для управления автомобилями, работе с RAG-системами и физическими агентами. 📝 Воркшоп по работе с ИИ-агентами от канадского разработчика и автора книги AI Agents in Action Майкла Ланэма. 📝 Воркшоп по разработке игр с помощью AI плагина MWS DevTools Agent. 🛻 Шоу-битва роботов. Камеры от первого лица, профессиональные комментаторы создадут вайб больших видов спорта. На огромных экранах МТС Live Холл ты увидишь, как роботы будут проходить 3 уровня препятствий: запутанные лабиринты, офф-роад маршруты, парящие платформы — и сразятся в битве на выживание. ◻️ 20+ площадок с активностями. Попробуй родео и оседлай механического быка, пройди лазерный лабиринт, как настоящий спецагент, выведи на ринг своего робопаука и протестируй другие ИТ-челленджи. 🔴 В завершение дня — афтепати со звездным хедлайнером. Фестиваль бесплатный, он пройдет 21 ноября в Москве и онлайн. Смотри подробную программу на сайте и регистрируйся — количество мест ограничено.

⚡️ Вышел подробный гайд по Gemini 3 - новой флагманской модели Google DeepMind, которая в ряде задач уже опережает другие топ
⚡️ Вышел подробный гайд по Gemini 3 - новой флагманской модели Google DeepMind, которая в ряде задач уже опережает другие топовые решения. Внутри разбор возможностей модели, примеры создания реальных приложений, рекомендации по настройке промтов и системных режимов. Добавлены готовые сниппеты на Python и JS - копируй и сразу запускай. Осваиваем автоматизацию и перенос рутины на Gemini 3 по ссылке. https://ai.google.dev/gemini-api/docs/gemini-3?thinking=high&hl=ru

🚀 Uni-MoE-2.0-Omni - новый прорыв в омнимодальных моделях Эта модель поднимает планку: от мультимодальности к полноценному о
+3
🚀 Uni-MoE-2.0-Omni - новый прорыв в омнимодальных моделях Эта модель поднимает планку: от мультимодальности к полноценному омнимодальному пониманию и генерации: речь, текст, изображения, видео, аудио-видео взаимодействия. ✨ Главное нововведение Разработчики показали, как эволюционно превратить обычные плотные LLM в эффективные MoE-модели, способные работать со всеми модальностями одновременно. 🧠 Архитектура 1️⃣ Omnimodality 3D RoPE + Dynamic Capacity MoE - Унифицирует выравнивание речи, текста, изображений и видео в пространственно-временных измерениях - Динамически распределяет вычисления в зависимости от сложности задачи 2️⃣ Глубоко слитый мультимодальный encoder-decoder - Любые комбинации входных и выходных модальностей - Настоящее омнимодальное взаимодействие и генерация 🛠️ Тренировка 1️⃣ Прогрессивная стратегия обучения Cross-modal alignment → Warm-up экспертов → MoE + RL → Генеративное обучение - Масштабирует плотные LLM в MoE-модели - Всего 75B токенов - Стабильная сходимость, особенно на RL 2️⃣ Языковая основа для задач понимания и генерации - Все задачи сводятся к языковой генерации - Пробивает барьеры между модальностями 🎨 Возможности ✔ Генерация и взаимодействие через речь ✔ Генерация и редактирование изображений ✔ Понимание изображений и видео ✔ Аудиовизуальное рассуждение ✔ 10+ мультимодальных задач 🔥 Результаты Модель превзошла Qwen2.5-Omni (1.2T токенов) в 50+ из 76 задач, имея всего 75B токенов: - Видео-понимание: +5% - Омнимодальное понимание: +7% - Speech QA: +4.3% - Обработка изображений: +7% 🌍 Open Source Model: https://huggingface.co/collections/HIT-TMG/lychee-uni-moe-20 Code: https://github.com/HITsz-TMG/Uni-MoE/tree/master/Uni-MoE-2 Homepage: https://idealistxy.github.io/Uni-MoE-v2.github.io/

Как обучить свою первую ML-модель — и не утонуть в теории? Машинное обучение звучит сложно — пока вы не попробуете на практик
Как обучить свою первую ML-модель — и не утонуть в теории? Машинное обучение звучит сложно — пока вы не попробуете на практике. 24 ноября в 18:00 МСК на открытом уроке вы обучите модель для задачи классификации прямо во время занятия.  Разберём: – как работает алгоритм дерева решений; – как решать задачи классификации на Python; – что нужно, чтобы перейти от экспериментов к реальной работе с ML. Вы шаг за шагом создадите первую модель, увидите, как она принимает решения, и поймёте, как из простого кода рождается интеллект. ➡️ Открытый урок проходит в преддверии старта курса «Machine Learning. Basic». Регистрируйтесь — начните путь в Data Science с практики, а не с теории:  https://otus.pw/2np3/?erid=2W5zFJegj1J Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

🤖 Как объединить десятки экспертных моделей в одну универсальную- без дообучения и утечки данных? Исследователи из CAS, HKIS
🤖 Как объединить десятки экспертных моделей в одну универсальную- без дообучения и утечки данных? Исследователи из CAS, HKISI-CAS, Sun Yat-sen и Peking представили новый подход: RobustMerge — метод бес-тренировочного, параметро-эффективного объединения моделей. Проблема: Каждая экспертная модель умеет своё — одна для OCR, другая для зрения, третья для диалога, четвёртая для кода. Но как собрать их в одно универсальное MLLM так, чтобы: - не было утечки данных - не пришлось обучать всё заново - не потерялась точность - модель не развалилась из-за конфликтующих весов 🧠 Что делает RobustMerge Метод сохраняет *direction robustness* - устойчивость направлений веса — с помощью двух ключевых техник: - low-rank analysis — выделяет главное направление знаний - cross-task normalization — нормализует вклад разных задач так, чтобы одна модель не «забивала» другую Итог: Разные специализированные модели становятся одним универсальным MLLM, который продолжает хорошо работать по всем направлениям и даже улучшает обобщение. 🚀 Почему это важно Это решает главную боль индустрии: как собрать десятки экспертов в единую систему без огромных затрат на переобучение и без риска смешать приватные данные. 🔬 Подробности Paper: arxiv.org/abs/2502.17159 Code: github.com/AuroraZengfh/RobustMerge

За 2,5 часа прокачаем маркетинг с нейросетями Технари, проходите мимо — здесь эфир для ребят из маркетинга. 25 ноября приходи
За 2,5 часа прокачаем маркетинг с нейросетями Технари, проходите мимо — здесь эфир для ребят из маркетинга. 25 ноября приходите на онлайн-интенсив по AI. Вас ждет: 📈 Кейс-стади. COFIX, CDEK, Звук и Gulliver расскажут, как оптимизировали маркетинг с ML и LLM. С результатами в цифрах! Например, Cofix ускорил обработку клиентских отзывов в 7000 раз. А Gulliver удвоил CTR товарных карточек на маркетплейсах. 👨‍🏫 Воркшоп по промптингу. Эксперты в прямом эфире помогут сегментировать клиентов, персонализировать рассылки и рекламу с ChatGPT. 📅 25 ноября, 11:00–13:30 мск 💻 Онлайн, бесплатно Зарегистрироваться Реклама. ООО «Майндбокс», ИНН: 7713688880, erid: 2W5zFGW2iDn

🧠 Почему у моделей пропадает «рандомность» во время RL-обучения - и как это чинится Новая работа разбирает, почему у моделей
🧠 Почему у моделей пропадает «рандомность» во время RL-обучения - и как это чинится Новая работа разбирает, почему у моделей во время RL для reasoning рушится энтропия (то есть исчезает разнообразие ответов) - и что с этим делать. Главные выводы: - 📉 Хорошего набора в ~600 задач хватает, чтобы догнать обучение на 17 000. Ключ - разнообразие, а не размер датасета. - 🎯 Reward сужает модель. При обучении она начинает повторять несколько самых “прибыльных” токенов → энтропия падает → исследование ухудшается. - 🔄 Меньше энтропии → меньше разнообразия, но измеренная энтропия по промптам почти не коррелирует с точностью. - ⚙️ Адаптивный энтропийный регуляризатор удерживает «случайность» на целевом уровне, при этом точность продолжает расти. - 🧪 Off-policy обновления усиливают коллапс, поднимают reward и ломают обобщение — классический overfitting. - 🧩 Низкое разнообразие данных ускоряет коллапс, но маленький *разнообразный* датасет иногда работает так же хорошо, как полный. - 🔧 Клиппинг и reweighting позитивных advantage-токенов (например, Progressive Advantage Reweighting) помогают управлять энтропией и борот arxiv.org/abs/2511.05993

🔥 Подборка полезных ресурсов для программистов. Здесь ты найдёшь всё это - коротко, по делу и без воды. Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты! AI: t.me/ai_machinelearning_big_data Python: t.me/pythonl Linux: t.me/linuxacademiya Devops: t.me/DevOPSitsec Собеседования DS: t.me/machinelearning_interview C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_1001_notes Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg Физика: t.me/fizmat 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy Папка Linux:https://t.me/addlist/w4Doot-XBG4xNzYy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy Сохрани себе, чтобы не потерять!

⚡️ OpenAI представила новый экспериментальный LLM, который раскрывает, как на самом деле работает ИИ. Команда создала интерпр
⚡️ OpenAI представила новый экспериментальный LLM, который раскрывает, как на самом деле работает ИИ. Команда создала интерпретируемую модель - намного прозрачнее обычных трансформеров, которые ведут себя как «чёрный ящик». Это важно, потому что такая модель помогает понять, почему ИИ галлюцинирует, ошибается или действует непредсказуемо в критичных ситуациях. Новый LLM - разреженный трансформер: он намного меньше и проще современных GPT-5, Claude или Gemini. По уровню он ближе к GPT-1, но его цель не конкурировать, а быть максимально объяснимым. Как это работает: - модель обучают так, чтобы внутренние схемы становились разрежёнными, - большинство весов фиксируется в 0, - каждый нейрон имеет не тысячи связей, а лишь десятки, - навыки отделяются друг от друга более чистыми и читаемыми путями. У обычных плотных моделей нейроны связаны хаотично, признаки пересекаются, и понять логику сложно. Здесь же для каждого поведения можно выделить маленькую схему: достаточную, потому что она сама выполняет нужную функцию, и необходимую, потому что её удаление ломает поведение. Главная цель - изучить, как работают простые механизмы, чтобы лучше понять большие модели. Метрика интерпретируемости здесь - размер схемы, метрика способности - pretraining loss. При увеличении разрежённости способность падает чуть-чуть, а схемы становятся намного проще. Обучение «больших, но разрежённых» моделей улучшает оба показателя: модель становится сильнее, а механизмы легче для анализа. Некоторые сложные навыки, например переменные в коде, пока разобраны частично, но даже эти схемы позволяют предсказать, когда модель корректно читает или записывает тип. Главный вклад работы - рецепт обучения, который создаёт механизмы, которые можно *назвать, нарисовать и проверить абляциями*, а не пытаться распутывать хаотичные признаки постфактум. Пределы пока есть: это маленькие модели и простые поведения, и многое остаётся за пределами картируемых цепочек. Но это важный шаг к настоящей интерпретируемости больших ИИ. https://openai.com/index/understanding-neural-networks-through-sparse-circuits/