ar
Feedback
Machine learning Interview

Machine learning Interview

الذهاب إلى القناة على Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

إظهار المزيد

📈 نظرة تحليلية على قناة تيليجرام Machine learning Interview

تُعد قناة Machine learning Interview (@machinelearning_interview) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 30 037 مشتركاً، محتلاً المرتبة 4 565 في فئة التكنولوجيات والتطبيقات والمرتبة 21 957 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 30 037 مشتركاً.

بحسب آخر البيانات بتاريخ 10 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار 23، وفي آخر 24 ساعة بمقدار -8، مع بقاء الوصول العام مرتفعاً.

  • حالة التحقق: غير موثّقة
  • معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 19.73‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 10.07‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
  • وصول المنشورات: يحصل كل منشور على متوسط 5 925 مشاهدة. وخلال اليوم الأول يجمع عادةً 3 024 مشاهدة.
  • التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 41.
  • الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل claude, llm, контекст, hermes, nvidia.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 11 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

30 037
المشتركون
-824 ساعات
-297 أيام
+2330 أيام
أرشيف المشاركات
🌉🤖 CodexMCP: Интеграция Claude Code и Codex CodexMCP — это мост между Claude Code и Codex, который позволяет им эффективно
🌉🤖 CodexMCP: Интеграция Claude Code и Codex CodexMCP — это мост между Claude Code и Codex, который позволяет им эффективно сотрудничать в программировании. Проект предлагает улучшенные функции, такие как многократные диалоги и параллельные задачи, что делает взаимодействие AI более интеллектуальным и продуктивным. 🚀Основные моменты: - Поддержка многократных диалогов и параллельного выполнения задач. - Усовершенствованное управление контекстом с сохранением сессий. - Интеграция с Claude Code для анализа требований и архитектуры. - Возможность отслеживания деталей вывода и обработки ошибок. 📌 GitHub: https://github.com/GuDaStudio/codexmcp #python

ГигаЧат представил обновлённое семейство GigaAM-v3 Giga Acoustic Model — это класс open-source моделей для обработки речи и э
ГигаЧат представил обновлённое семейство GigaAM-v3 Giga Acoustic Model — это класс open-source моделей для обработки речи и эмоций. В третьей версии опубликовали базовый аудиоэнкодер GigaAM-v3, улучшенные CTC и RNNT-модели, а также E2E-распознавание с поддержкой пунктуации и нормализации. Масштаб предобучения значительно вырос: с 50 до 700 тысяч часов аудио на русском языке. Появились новые домены в обучении ASR — от колл-центров до разговорной речи. Для всего корпуса обучающих данных восстановили пунктуацию и нормализацию через GigaChat Max Audio. Линейка CTC/RNNT и E2E позволяет выбирать между скоростью или максимальным качеством под любые сценарии. Что по метрикам: — Открытые датасеты (Golos, OpenSTT, Common Voice, LibriSpeech): паритет с GigaAM-v2. — Новые домены (WER, v2-RNNT → v3-RNNT): • речь с особенностями 27% → 19% • колл-центр 13% → 10% • спонтанная речь 10.3% → 7% — Пунктуация: v3-e2e-RNNT vs reference + Whisper Forced Decoding — F1-score по запятой 84% vs 62%, остальные знаки ~паритет — Side-by-Side (Gemini 2.5 Pro as a judge): v3-e2e-RNNT vs Whisper-large-v3 — 70:30 (колл-центр), 64:36 (Common Voice) Больше про язык, речь и искусственный интеллект в @gigadev_channel. Подписывайтесь на канал, чтобы не пропустить всё самое интересное!

🍌Nano Banan хороша! Промпт: "Make an infographic that explains how the transformer LLM works" https://aistudio.google.com/
🍌Nano Banan хороша! Промпт: "Make an infographic that explains how the transformer LLM works" https://aistudio.google.com/

🌍🗣️ Omnilingual ASR: Многоязычное распознавание речи для 1600+ языков Omnilingual ASR — это открытая система распознавания речи, поддерживающая более 1,600 языков, включая редкие. Она позволяет добавлять новые языки с минимальными примерами, делая технологии распознавания более доступными и инклюзивными для различных сообществ. 🚀Основные моменты: - Поддержка более 1,600 языков, включая уникальные. - Простота добавления новых языков без больших наборов данных. - Использует нулевое обучение и гибкие модели для адаптации. - Доступен на Hugging Face для демонстрации и использования. 📌 GitHub: https://github.com/facebookresearch/omnilingual-asr #python

Когда data-pipelines рушатся, а BI не обновился к утру, виноваты обычно не модели — а инфраструктура. Сломанный пайплайн, нес
Когда data-pipelines рушатся, а BI не обновился к утру, виноваты обычно не модели — а инфраструктура. Сломанный пайплайн, несвоевременное обновление данных или внезапное изменение схемы — каждый ML-инженер сталкивался с ситуацией, когда вместо улучшения моделей приходится разбираться с проблемами в данных. Для таких моментов создали бота-генератор оправданий. Он предлагает стильные объяснения для случаев, когда: — данные для обучения застряли в очередях — фичи оказались несогласованными — мониторинг моделей показывает аномалии А если всё ещё дебажите ETL в проде — загляните в Telegram-бота. Протестируйте разные варианты оправданий и делитесь самыми точными с командой — это поможет взглянуть на проблему под новым углом и найти нестандартное решение.

🤖 Google представила Nested Learning — новую парадигму ИИ, которая учится как человек и не забывает прошлые знания Google пр
+2
🤖 Google представила Nested Learning — новую парадигму ИИ, которая учится как человек и не забывает прошлые знания Google предлагает новый подход: Nested Learning - *вложенное обучение*, при котором новая информация интегрируется в уже существующую структуру знаний, а не замещает её. Как это работает? Каждое новое обучение добавляется внутрь уже выученного, как слой внутри слоя. Это позволяет модели: - сохранять предыдущие навыки - адаптироваться к новым задачам - отличать, в каком контексте она работает Что это даёт? 1. Постоянное обучение без потерь Модель может учиться бесконечно, не забывая старое. Новые знания не затирают прежние. 2. Контекстное понимание ИИ понимает, *в каком режиме* он работает — это делает поведение гибче и разумнее. 3. Ближе к человеческому мышлению Nested Learning приближает нейросети к человеческому типу обучения: поэтапному, постепенному и адаптивному. 📌 Подробнее: https://research.google/blog/introducing-nested-learning-a-new-ml-paradigm-for-continual-learning #google

Kandinsky 5.0 — новая линейка визуальных моделей в open source ⚡️Сбер опубликовал в открытом доступе всю линейку Kandinsky 5.0: Video Pro, Video Lite, Image Lite и токенизаторы K-VAE 1.0. Полный open source: код, веса, лицензия MIT. ➡️Video Pro (Text-to-Video / Image-to-Video) Флагман, генерирующий HD-видео до 10 секунд с гибким управлением движением камеры. Обучалась на 520 млн изображений и 250 млн видео и затем, на финальном этапе, доучивалась на датасете сверх-качественных видеороликов, тщательно отобранных профессиональными художниками и дизайнерами. 🔘Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Лучшая открытая модель в мире, превосходит Wan 2.2-A14B в Text-to-Video [SBS 59:41] и Image-to-Video [SBS 53:47], а также достигает паритета с Veo 3 по визуальному качеству и динамике [SBS 54:46]. ➡️Video Lite (Text-to-Video / Image-to-Video) Компактные модели генерации видео, оптимизированные для запуска на GPU от 12 ГБ VRAM. Обучалась на 520 млн изображений и 120 млн видео, хорошая консистентность и качество динамики. Лучшая среди небольших и быстрых моделей, значительно превосходит в 7 раз большую по количеству параметров Wan 2.1-14B как в Text-to-Video [SBS 67:33], так и Image-to-Video [SBS 64:36]. ➡️Image Lite (Text-to-Image / Image Editing) HD-генерация и редактирование изображений. Претрейн Text-to-Image модели был сделан на 520 млн изображений, включая датасет русского культурного кода ~1 млн изображений. Image Editing был дополнительно дообучен на 150 млн пар. Для достижения финального качества был проведено SFT дообучение на 150 тыс изображений, а также на 20 тыс. пар – для Editing. 🔘Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Значительно превосходит FLUX.1 [dev] по Text-to-Image [SBS 63:37] и находится в паритете по качеству с FLUX.1 Kontext [dev] по Image Editing [SBS 54:46]. ➡️K-VAE 1.0 (2D / 3D) Вариационные автоэнкодеры для диффузионных моделей, сжимающие входные данные в формате 8x8 (изображения) и 4x8x8 (видео). Сравнение на открытых датасетах показывает, что модели более качественно восстанавливают исходный сигнал (+0.5dB PSNR), чем лучшие open-source альтернативы (Flux, Wan, Hunyaun), обладающие той же степенью сжатия. Все модели линейки доступны на GitHub, Gitverse и HuggingFace. Читайте подробнее в техническом репорте.

🔥 Представляем AMO-Bench - новый бенчмарк, который проверяет границы логического мышления LLM на уровне задач IMO. AMO-Bench
+2
🔥 Представляем AMO-Bench - новый бенчмарк, который проверяет границы логического мышления LLM на уровне задач IMO. AMO-Bench включает: • 50 полностью оригинальных задач, созданных экспертами • подтверждённый уровень сложности — не ниже международной математической олимпиады • гибридный алгоритм автопроверки с точностью 99.2% • размеченные человеком цепочки рассуждений для глубокого анализа моделей Главные результаты: Модель Kimi-k2-Thinking от Kimi_Moonshot показала лучший результат — 56%. Следом идут GPT-5-thinking (high) и Qwen3-235B-A22B-Thinking-2507. Большинство остальных моделей не дотягивают даже до 40%. AMO-Bench открыт для всех — попробуйте и помогите продвинуть границы reasoning-возможностей больших моделей. 😊 Open-Source: HuggingFace: https://huggingface.co/datasets/meituan-longcat/AMO-Bench GitHub: https://github.com/meituan-longcat/AMO-Bench Paper: https://arxiv.org/abs/2510.26768 Project Page: https://amo-bench.github.io

🤖 AITradeGame - Симулятор торговли с ИИ AITradeGame - это открытый симулятор торговли, который позволяет пользователям тести
🤖 AITradeGame - Симулятор торговли с ИИ AITradeGame - это открытый симулятор торговли, который позволяет пользователям тестировать стратегии с использованием ИИ. Доступны как локальная версия с полной конфиденциальностью, так и онлайн-версия с интерактивными функциями и таблицами лидеров. 🚀Основные моменты: - Поддержка различных ИИ моделей, включая OpenAI и Claude. - Локальное хранилище данных без облачного отслеживания. - Интерактивные таблицы лидеров для соревнований с другими пользователями. - Удобный интерфейс и возможность настройки торговых параметров. 📌 GitHub: https://github.com/chadyi/AITradeGame

Конференция AI Driver & RecSys Темы — пространство, где наука и бизнес встречаются, чтобы обсудить будущее рекомендаций ⚡️ 28 ноября пройдёт конференция о том, как создаются и развиваются современные рекомендательные системы. На площадке Сбера соберутся эксперты топовых российских IT-компаний и вузов, чтобы обсудить новые исследования, открытые датасеты и практические решения, которые меняют подход к персонализации. Это возможность за один день познакомиться с ключевыми трендами RecSys, пообщаться со специалистами и вдохновиться идеями, формирующими будущее рекомендаций. Присоединяйтесь к профессиональному сообществу 28 ноября в 10:00 — регистрация по ссылке!

🎥 Создание видео с LongCat-Video LongCat-Video — это мощная модель генерации видео с 13.6 миллиарда параметров, способная выполнять задачи *Text-to-Video*, *Image-to-Video* и *Video-Continuation*. Она обеспечивает высокое качество и эффективность, особенно в создании длинных видео без потери качества. 🚀 Основные моменты: - Унифицированная архитектура для различных задач генерации видео. - Способность генерировать видео длительностью в минуты. - Эффективный процесс генерации с высоким разрешением. - Сравнимые результаты с ведущими коммерческими решениями. 📌 GitHub: https://github.com/meituan-longcat/LongCat-Video #python

Успей зарегистрироваться на масштабный ИТ-фест от МТС 🔥 21 ноября на True Tech Champ тебя ждет насыщенный день со зрелищной битвой роботов, нетворкингом и прокачкой навыков. В программе: 📝 Доклады о ИИ-технологиях. Специалисты MWS AI, Skoltech, Яндекса и Unitree Robotics расскажут о трансформерах для управления автомобилями, работе с RAG-системами и физическими агентами. 📝 Воркшоп по работе с ИИ-агентами от канадского разработчика и автора книги AI Agents in Action Майкла Ланэма. 📝 Воркшоп по разработке игр с помощью AI плагина MWS DevTools Agent. 🛻 Шоу-битва роботов. Камеры от первого лица, профессиональные комментаторы создадут вайб больших видов спорта. На огромных экранах МТС Live Холл ты увидишь, как роботы будут проходить 3 уровня препятствий: запутанные лабиринты, офф-роад маршруты, парящие платформы — и сразятся в битве на выживание. ◻️ 20+ площадок с активностями. Попробуй родео и оседлай механического быка, пройди лазерный лабиринт, как настоящий спецагент, выведи на ринг своего робопаука и протестируй другие ИТ-челленджи. 🔴 В завершение дня — афтепати со звездным хедлайнером. Фестиваль бесплатный, он пройдет 21 ноября в Москве и онлайн. Смотри подробную программу на сайте и регистрируйся — количество мест ограничено.

⚡️ Вышел подробный гайд по Gemini 3 - новой флагманской модели Google DeepMind, которая в ряде задач уже опережает другие топ
⚡️ Вышел подробный гайд по Gemini 3 - новой флагманской модели Google DeepMind, которая в ряде задач уже опережает другие топовые решения. Внутри разбор возможностей модели, примеры создания реальных приложений, рекомендации по настройке промтов и системных режимов. Добавлены готовые сниппеты на Python и JS - копируй и сразу запускай. Осваиваем автоматизацию и перенос рутины на Gemini 3 по ссылке. https://ai.google.dev/gemini-api/docs/gemini-3?thinking=high&hl=ru

🚀 Uni-MoE-2.0-Omni - новый прорыв в омнимодальных моделях Эта модель поднимает планку: от мультимодальности к полноценному о
+3
🚀 Uni-MoE-2.0-Omni - новый прорыв в омнимодальных моделях Эта модель поднимает планку: от мультимодальности к полноценному омнимодальному пониманию и генерации: речь, текст, изображения, видео, аудио-видео взаимодействия. ✨ Главное нововведение Разработчики показали, как эволюционно превратить обычные плотные LLM в эффективные MoE-модели, способные работать со всеми модальностями одновременно. 🧠 Архитектура 1️⃣ Omnimodality 3D RoPE + Dynamic Capacity MoE - Унифицирует выравнивание речи, текста, изображений и видео в пространственно-временных измерениях - Динамически распределяет вычисления в зависимости от сложности задачи 2️⃣ Глубоко слитый мультимодальный encoder-decoder - Любые комбинации входных и выходных модальностей - Настоящее омнимодальное взаимодействие и генерация 🛠️ Тренировка 1️⃣ Прогрессивная стратегия обучения Cross-modal alignment → Warm-up экспертов → MoE + RL → Генеративное обучение - Масштабирует плотные LLM в MoE-модели - Всего 75B токенов - Стабильная сходимость, особенно на RL 2️⃣ Языковая основа для задач понимания и генерации - Все задачи сводятся к языковой генерации - Пробивает барьеры между модальностями 🎨 Возможности ✔ Генерация и взаимодействие через речь ✔ Генерация и редактирование изображений ✔ Понимание изображений и видео ✔ Аудиовизуальное рассуждение ✔ 10+ мультимодальных задач 🔥 Результаты Модель превзошла Qwen2.5-Omni (1.2T токенов) в 50+ из 76 задач, имея всего 75B токенов: - Видео-понимание: +5% - Омнимодальное понимание: +7% - Speech QA: +4.3% - Обработка изображений: +7% 🌍 Open Source Model: https://huggingface.co/collections/HIT-TMG/lychee-uni-moe-20 Code: https://github.com/HITsz-TMG/Uni-MoE/tree/master/Uni-MoE-2 Homepage: https://idealistxy.github.io/Uni-MoE-v2.github.io/

Как обучить свою первую ML-модель — и не утонуть в теории? Машинное обучение звучит сложно — пока вы не попробуете на практик
Как обучить свою первую ML-модель — и не утонуть в теории? Машинное обучение звучит сложно — пока вы не попробуете на практике. 24 ноября в 18:00 МСК на открытом уроке вы обучите модель для задачи классификации прямо во время занятия.  Разберём: – как работает алгоритм дерева решений; – как решать задачи классификации на Python; – что нужно, чтобы перейти от экспериментов к реальной работе с ML. Вы шаг за шагом создадите первую модель, увидите, как она принимает решения, и поймёте, как из простого кода рождается интеллект. ➡️ Открытый урок проходит в преддверии старта курса «Machine Learning. Basic». Регистрируйтесь — начните путь в Data Science с практики, а не с теории:  https://otus.pw/2np3/?erid=2W5zFJegj1J Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

🤖 Как объединить десятки экспертных моделей в одну универсальную- без дообучения и утечки данных? Исследователи из CAS, HKIS
🤖 Как объединить десятки экспертных моделей в одну универсальную- без дообучения и утечки данных? Исследователи из CAS, HKISI-CAS, Sun Yat-sen и Peking представили новый подход: RobustMerge — метод бес-тренировочного, параметро-эффективного объединения моделей. Проблема: Каждая экспертная модель умеет своё — одна для OCR, другая для зрения, третья для диалога, четвёртая для кода. Но как собрать их в одно универсальное MLLM так, чтобы: - не было утечки данных - не пришлось обучать всё заново - не потерялась точность - модель не развалилась из-за конфликтующих весов 🧠 Что делает RobustMerge Метод сохраняет *direction robustness* - устойчивость направлений веса — с помощью двух ключевых техник: - low-rank analysis — выделяет главное направление знаний - cross-task normalization — нормализует вклад разных задач так, чтобы одна модель не «забивала» другую Итог: Разные специализированные модели становятся одним универсальным MLLM, который продолжает хорошо работать по всем направлениям и даже улучшает обобщение. 🚀 Почему это важно Это решает главную боль индустрии: как собрать десятки экспертов в единую систему без огромных затрат на переобучение и без риска смешать приватные данные. 🔬 Подробности Paper: arxiv.org/abs/2502.17159 Code: github.com/AuroraZengfh/RobustMerge

За 2,5 часа прокачаем маркетинг с нейросетями Технари, проходите мимо — здесь эфир для ребят из маркетинга. 25 ноября приходи
За 2,5 часа прокачаем маркетинг с нейросетями Технари, проходите мимо — здесь эфир для ребят из маркетинга. 25 ноября приходите на онлайн-интенсив по AI. Вас ждет: 📈 Кейс-стади. COFIX, CDEK, Звук и Gulliver расскажут, как оптимизировали маркетинг с ML и LLM. С результатами в цифрах! Например, Cofix ускорил обработку клиентских отзывов в 7000 раз. А Gulliver удвоил CTR товарных карточек на маркетплейсах. 👨‍🏫 Воркшоп по промптингу. Эксперты в прямом эфире помогут сегментировать клиентов, персонализировать рассылки и рекламу с ChatGPT. 📅 25 ноября, 11:00–13:30 мск 💻 Онлайн, бесплатно Зарегистрироваться Реклама. ООО «Майндбокс», ИНН: 7713688880, erid: 2W5zFGW2iDn

🧠 Почему у моделей пропадает «рандомность» во время RL-обучения - и как это чинится Новая работа разбирает, почему у моделей
🧠 Почему у моделей пропадает «рандомность» во время RL-обучения - и как это чинится Новая работа разбирает, почему у моделей во время RL для reasoning рушится энтропия (то есть исчезает разнообразие ответов) - и что с этим делать. Главные выводы: - 📉 Хорошего набора в ~600 задач хватает, чтобы догнать обучение на 17 000. Ключ - разнообразие, а не размер датасета. - 🎯 Reward сужает модель. При обучении она начинает повторять несколько самых “прибыльных” токенов → энтропия падает → исследование ухудшается. - 🔄 Меньше энтропии → меньше разнообразия, но измеренная энтропия по промптам почти не коррелирует с точностью. - ⚙️ Адаптивный энтропийный регуляризатор удерживает «случайность» на целевом уровне, при этом точность продолжает расти. - 🧪 Off-policy обновления усиливают коллапс, поднимают reward и ломают обобщение — классический overfitting. - 🧩 Низкое разнообразие данных ускоряет коллапс, но маленький *разнообразный* датасет иногда работает так же хорошо, как полный. - 🔧 Клиппинг и reweighting позитивных advantage-токенов (например, Progressive Advantage Reweighting) помогают управлять энтропией и борот arxiv.org/abs/2511.05993

🔥 Подборка полезных ресурсов для программистов. Здесь ты найдёшь всё это - коротко, по делу и без воды. Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты! AI: t.me/ai_machinelearning_big_data Python: t.me/pythonl Linux: t.me/linuxacademiya Devops: t.me/DevOPSitsec Собеседования DS: t.me/machinelearning_interview C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_1001_notes Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg Физика: t.me/fizmat 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy Папка Linux:https://t.me/addlist/w4Doot-XBG4xNzYy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy Сохрани себе, чтобы не потерять!

⚡️ OpenAI представила новый экспериментальный LLM, который раскрывает, как на самом деле работает ИИ. Команда создала интерпр
⚡️ OpenAI представила новый экспериментальный LLM, который раскрывает, как на самом деле работает ИИ. Команда создала интерпретируемую модель - намного прозрачнее обычных трансформеров, которые ведут себя как «чёрный ящик». Это важно, потому что такая модель помогает понять, почему ИИ галлюцинирует, ошибается или действует непредсказуемо в критичных ситуациях. Новый LLM - разреженный трансформер: он намного меньше и проще современных GPT-5, Claude или Gemini. По уровню он ближе к GPT-1, но его цель не конкурировать, а быть максимально объяснимым. Как это работает: - модель обучают так, чтобы внутренние схемы становились разрежёнными, - большинство весов фиксируется в 0, - каждый нейрон имеет не тысячи связей, а лишь десятки, - навыки отделяются друг от друга более чистыми и читаемыми путями. У обычных плотных моделей нейроны связаны хаотично, признаки пересекаются, и понять логику сложно. Здесь же для каждого поведения можно выделить маленькую схему: достаточную, потому что она сама выполняет нужную функцию, и необходимую, потому что её удаление ломает поведение. Главная цель - изучить, как работают простые механизмы, чтобы лучше понять большие модели. Метрика интерпретируемости здесь - размер схемы, метрика способности - pretraining loss. При увеличении разрежённости способность падает чуть-чуть, а схемы становятся намного проще. Обучение «больших, но разрежённых» моделей улучшает оба показателя: модель становится сильнее, а механизмы легче для анализа. Некоторые сложные навыки, например переменные в коде, пока разобраны частично, но даже эти схемы позволяют предсказать, когда модель корректно читает или записывает тип. Главный вклад работы - рецепт обучения, который создаёт механизмы, которые можно *назвать, нарисовать и проверить абляциями*, а не пытаться распутывать хаотичные признаки постфактум. Пределы пока есть: это маленькие модели и простые поведения, и многое остаётся за пределами картируемых цепочек. Но это важный шаг к настоящей интерпретируемости больших ИИ. https://openai.com/index/understanding-neural-networks-through-sparse-circuits/