Machine learning Interview
前往频道在 Telegram
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz
显示更多📈 Telegram 频道 Machine learning Interview 的分析概览
频道 Machine learning Interview (@machinelearning_interview) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 30 034 名订阅者,在 技术与应用 类别中位列第 4 565,并在 俄罗斯 地区排名第 21 957 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 30 034 名订阅者。
根据 10 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 23,过去 24 小时变化为 -8,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 19.73%。内容发布后 24 小时内通常能获得 10.07% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 5 925 次浏览,首日通常累积 3 024 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 41。
- 主题关注点: 内容集中在 claude, llm, контекст, hermes, nvidia 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!
Вопросы - @workakkk
РКН: clck.ru/3FmwRz”
凭借高频更新(最新数据采集于 11 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
30 034
订阅者
-824 小时
-297 天
+2330 天
帖子存档
Дженсен Хуанг: «Влюбиться в то, что делаешь — проще, чем искать то, что любишь»
Многие говорят: *«Найди дело своей мечты».*
Но Хуанг смотрит иначе:
> «Я полюбил всё, чем занимался. > Я любил мыть посуду. > Я любил работать официантом. > Я любил разносить газеты. > Я любил каждую работу, которая у меня была.»Он продолжает:
> «Я люблю каждый день в Nvidia. > Я просто научился любить то, что делаю. > Найти то, что любишь - сложно. > Проще - влюбиться в свою работу. > Когда ты хочешь сделать её хорошо, работать легче.»💡 Мы часто ищем «идеальное дело», но иногда сила в том, чтобы сделать то, что есть значимым, и через это вырасти. Как вам такая философия?
🧠⚡ Исследование Carnegie Mellon: Cursor ускоряет разработку до 3–4x - но с ценой
Учёные из Carnegie Mellon проанализировали 807 репозиториев, где разработчики перешли на Cursor
(по конфигам вроде `.cursorrules`), и сравнили их с 1380 контрольными проектами - до и после внедрения.
Метод difference-in-differences:
сравнивали одни и те же репы *до/после*, плюс контролировали тренды по месяцам.
🚀 Что произошло с “скоростью кода”
Code Velocity = коммиты + строки кода.
- в первый месяц - скачок 3–5x по строкам
- в среднем после внедрения - +1.84x к скорости
ИИ реально ускоряет работу - и это измеряемо, а не ощущение.
🧩 Но есть побочные эффекты
Качество оценивали через SonarQube
(надёжность, поддерживаемость, безопасность, дубликаты, когнитивная сложность).
- статические предупреждения - +30%
- сложность кода - +41%
- через это скорость начинает проседать со временем
ИИ помогает писать больше - но не всегда лучше.
💡 Вывод
Cursor даёт реальный прирост продуктивности, особенно в начале.
Но выигрывают те, кто сочетает ИИ с:
- тестами
- код-ревью
- quality gates
- статанализом
ИИ-агенты - ускорители,
а качество всё ещё требует инженера.
arxiv.org/abs/2511.04427v2
+7
🚨 DeepSeek уже в первый день года выкатывает сильное обновление: важное улучшение архитектуры трансформеров.
Китайцы редложила способ сделать shortcut-путь ( это когда выход слоя прибавляется к его же входу, то есть сеть не «заменяет» информацию, а добавляет к ней улучшенную версию) в трансформерах гибче, но при этом сохранить стабильность даже у очень больших моделей.
В обычном трансформере каждый блок что-то считает, а потом просто добавляет результат к исходному сигналу.
Это помогает информации проходить через много слоёв, не теряясь.
Hyper-Connections меняют shortcut-путь.
Был один поток, а стало несколько.
Перед блоком модель выбирает, какие потоки подать на вычисления. Во время блока часть сигнала идёт «в обход», чтобы ничего не потерять. После блока всё снова аккуратно объединяется.То есть shortcut превращается из простого «input + output» в умный маршрутизатор сигналов. Проблема в том, что без ограничений такие смешивания могут усиливать сигнал слишком сильно или, наоборот, гасить его и большие модели начинают вести себя нестабильно. mHC решает это так: потоки остаются, но каждое смешивание работает как аккуратное усреднение. Сигнал не может «взорваться» или исчезнуть - он остаётся под контролем. Что это даёт на практике: - модели остаются стабильными даже на масштабе 27B, дают лучшее качество и не страдают от скачков лосса. Там, где обычные Hyper-Connections раздували сигнал до 3000×, mHC держат его примерно на уровне 1.6×. Если коротко: был один shortcut,. сделали несколько, но заставили их смешиваться безопасно. И трансформеры стали гибче и стабильнее. https://arxiv.org/abs/2512.24880 @ai_machinelearning_big_data #AI #DeepSeek #MachineLearning #NeuralNetworks #Research
🚀 Agentic AI Crash Course: бесплатный курс про автономных AI-агентов
Этот курс обучает не просто генерации текста, а созданию систем, которые понимают задачу, планируют шаги и выполняют действия.
Что внутри:
- как устроены AI-агенты и чем они отличаются от обычных LLM
- инструменты и функции, которыми агент управляет
- планирование и рассуждение
- память и контекст у агентов
- RAG и агентные архитектуры
- мульти-агентные системы
- практические кейсы и продакшн-паттерны
Кому подойдёт:
- разработчикам, которые хотят строить автономные AI-системы
- продактам и аналитикам, которым важно понимать архитектуру
- всем, кто хочет быстро въехать в agentic AI
Почему это полезно:
- агенты умеют принимать решения, звать API, собирать данные и автоматизировать сложные задачи
- курс дают бесплатно, хотя раньше он был платным
https://github.com/aishwaryanr/awesome-generative-ai-guide/tree/main/free_courses/agentic_ai_crash_course
Tesla стоит дороже, чем вся мировая автоиндустрия - вместе взятая 🚗⚡
Сегодня капитализация Tesla - примерно $1.62 трлн.
Вся глобальная автоиндустрия - около $1.33 трлн.
Иначе говоря, одна компания оценивается дороже, чем весь остальной рынок автомобилей.
Традиционные автопроизводители инвесторы воспринимают как зрелые промышленные бизнесы:
медленный рост, высокие капзатраты, жесткая конкуренция и ограниченные маржи.
С Tesla история другая.
Инвесторы платят за потенциал будущих направлений:
- автопилот и self-driving
- роботакси
- хранение и управление энергией
- робототехника
- новые высокомаржинальные сервисы
Фактически рынок считает, что :
> у Tesla - больше потенциала роста на каждую единицу будущего прогресса,
> чем у всей отрасли в целом.
И ещё один сигнал:
Tesla воспринимают как компанию,
которая способна превратить автомобиль в платформу -
где каждая новая функция (автономность, энергоинтеграция, эффективность производства)
повышает маржу и открывает новые источники дохода.
Это уже не просто автопроизводитель -
это ставка на то, что машины становятся программными продуктами на колёсах.
+1
🎉 Yandex Cloud и Forbes совместно создали новогодний спецпроект-игру, вдохновленную классикой «Герои меча и магии», но с современным взглядом на работу с данными!
Вместо магии — PostgreSQL, ClickHouse, Trino, DataLens — все эти инструменты работают как артефакты в вашем распоряжении. Получайте их у хранителей, создавайте в кибер-кузнице и помогайте своим персонажам из сферы финтеха, ритейла и промышленности побеждать цель — победить хаос данных.
Проект — не только игра, но и демонстрация того, как Yandex Cloud помогает компаниям эффективно управлять данными. Играть можно на ПК и смартфонах.
Отличный вызов для всех CDO, аналитиков и дата-инженеров, кто хочет совместить полезное с ностальгическим!
👉 Поиграть и узнать больше
⚡️ Neural Operator официально стал частью экосистемы PyTorch
PyTorch расширяет границы машинного обучения - в экосистему официально вошли Neural Operators.
Что это такое:
Neural Operators - это класс моделей, которые учатся не аппроксимировать данные, а аппроксимировать сами операторы. Проще говоря, они учатся решать целые классы задач, а не отдельные примеры.
Зачем это нужно:
- Решение дифференциальных уравнений
- Физическое моделирование
- Климат и погода
- CFD, материалы, биология
- Научные и инженерные симуляции
В отличие от обычных нейросетей:
- Neural Operators обобщаются на разные разрешения сетки
- Работают с непрерывными функциями
- Лучше подходят для задач, где данные описывают физические процессы
Что дает интеграция в PyTorch:
- Единый стандарт и API
- Совместимость с autograd, GPU и распределенным обучением
- Проще внедрять в реальные ML и scientific pipelines
- Меньше барьеров между research и production
PyTorch все больше становится не просто фреймворком для DL, а базовой платформой для научных вычислений и физически-осмысленного ИИ.
ML и scientific computing продолжают сближаться - и это один из самых сильных сигналов за последнее время.
Источник:
https://pytorch.org/blog/neuraloperatorjoins-the-pytorch-ecosystem/
🖥 Новая вакансия OpenAI: Head of Preparedness.
Компания ищет человека, который будет заранее продумывать и управлять рисками от быстро растущих возможностей ИИ.
Главная идея роли:
- понимать, где ИИ может пойти «не туда»
- предотвращать злоупотребления ИИ
- усиливать защиту кибербезопасности,
- закладывать правила для систем, которые умеют самоулучшаться
Это напряжённая и очень ответственная работа: мало примеров, много неизвестного - и высокий уровень влияния на решения.
По сути - задача проста по формулировке и сложна на практике: как развивать мощный ИИ и не дать ему причинить вред.
https://openai.com/careers/head-of-preparedness-san-francisco/
📄 Превращайте тысячи PDF в данные, готовые для LLM - с Vision-First Agentic Document AI!
LandingAI представила Agentic Document Extraction (ADE) DPT-2 Mini - облегчённую версию Document Pretrained Transformer 2, специально для потоковой обработки документов.
Идеально для “чистых” цифровых PDF, где визуальный контекст всё ещё важен для точного извлечения.
Подходит для:
• счетов
• договоров
• писем
• служебных записок
• любых аккуратно сформированных PDF
✨ Основные возможности:
• Структурированное извлечение из цифровых документов
• Точное понимание макета простых PDF
• Поддержка разных типов блоков: параграфы, изображения, логотипы, карточки и т.д.
• Надёжная транскрипция английского текста
• Оптимизация под масштаб — быстро, стабильно, экономично
DPT-2 Mini ориентирован на скорость, надёжность и низкую стоимость — когда документы простые, а нужно массовое и чистое структурированное извлечение.
https://github.com/landing-ai/ade-python
🏆 Конкурс научных статей Data Fusion Awards 2026
Банк ВТБ и Институт ИИ МГУ ищут авторов работ, которые могут претендовать на звание научного прорыва года в ИИ, а также на главный приз — 1 000 000 рублей.
🤖 Какие темы подойдут:
— Математический аппарат ИИ
— Алгоритмы оптимизации
— Машинное обучение и глубокое обучение
— Нейроморфные вычисления
— Робототехника
— Объяснимый ИИ (Explainable AI)
— Другие смежные области, связанные с инновациями и развитием искусственного интеллекта
🙌 Кто может участвовать:
— Автор научной статьи, опубликованной в журналах или материалах конференций в 2025 году
— Заявитель, который имеет аффилиацию с российской организацией (и это упоминается в подаваемой работе)
— Участник, который является первым в списке авторов подаваемой статьи
Важно: должны быть выполнены все 3 условия!
Победителей будет трое, но для начала необходимо подать заявку. Регистрация доступна до 20 января 2026 года.
Repost from Machinelearning
+2
Agent Skills for Context Engineering - учим агентов «думать контекстом» 🤖🧠
Этот репозиторий показывает, как прокачать LLM-агентов так, чтобы они лучше понимали задачу, историю диалога и условия, а не просто генерировали ответы.
Чем полезен:
• навыки управления длинным контекстом
• аккуратное структурирование данных и инструкций
• шаблоны для поиска, фильтрации и принятия решений
• примеры реальных сценариев (чаты, задачи с памятью, интеграции)
Часто агенты теряют важные детали, путают шаги и «забывают» цель. Эта библиотека учит их держать контекст под контролем и действовать последовательнее.
▪Github: https://github.com/muratcankoylan/Agent-Skills-for-Context-Engineering
@ai_machinelearning_big_data
Пусть работают машины, а человек занимается чем-то более приятным
Нельзя замыкаться только на работе, потому что рано или поздно работа может измениться до неузнаваемости. В свежем эпизоде подкаста «Деньги любят техно» своими мыслями о будущем, связанном с развитием ИИ, поделился профессор РАН, научный директор Института искусственного интеллекта МФТИ, директор по направлению ИИ ГосНИИ авиационных систем Юрий Визильтер.
• Какой путь ближе российской сфере ИИ: американский или китайский
• Какие перемены ждут программистов в ближайшие годы
• Почему учиться программированию по-прежнему важно
• Как ИИ поменяет наш быт и работу
• И как не потерять себя в одной профессии
Об этом и многом другом с Юрием Визитером говорил ведущий подкаста Денис Суржко, заместитель руководителя департамента анализа данных и моделирования ВТБ. Получился глубокий разговор о науке, технологиях и людях, которые их создают.
Послушать
Посмотреть
⚡️ Большинство быстрых text-to-speech моделей звучат роботизировано.
Большинство качественных - слишком медленные.
И почти ни одна не решает вопрос аутентичности аудио на уровне архитектуры.
Resemble AI закрыли все три проблемы сразу.
Chatterbox Turbo 0 это:
🟢 <150 мс до первого звука
🟢 Качество уровня SOTA - превосходит более крупные проприетарные модели
🟢 Естественные, программируемые эмоции и интонации
🟢 Zero-shot клонирование голоса всего по 5 секундам аудио
🟢 PerTh watermarking - проверяемое и аутентифицированное аудио
🟢 Полностью open source, никакой «чёрной магии»
Редкий пример, когда скорость, качество и безопасность не идут на компромисс, а работают вместе.
HuggingFace: https://huggingface.co/spaces/ResembleAI/chatterbox-turbo-demo
🤖 В страховом секторе формируется стек корпоративных ИИ-сервисов нового поколения
«АльфаСтрахование» внедрит более 10 проектов на технологиях Yandex B2B Tech, направленных на оптимизацию внутренних и клиентских процессов.
Технический контур включает три ключевых направления:
- SourceCraft Code Assistant — LLM-агент для поддержки DevOps-команд. Используется для генерации boilerplate-кода, unit-тестов и анализа изменений в репозиториях.
- Yandex SpeechSense — модуль речевой аналитики, применяющий ASR + NLU-пайплайн для обработки >20K звонков в сутки и последующего fine-tuning моделей на внутренних датасетах.
- Yandex AI Studio — оркестратор LLM-агентов для офисных и HR-воркфлоу (протоколирование встреч, классификация документов, поиск по внутренним данным).
Сценарий — переход от точечных ML-внедрений к распределённой инфраструктуре, где корпоративные процессы описываются как сеть взаимодействующих ИИ-агентов.
https://www.cnews.ru/news/line/2025-12-24_alfastrahovanie_realizuet
📘 Новая образовательная книга: Scaling ML Systems от JAX-ML
Проект Scaling Book - это свободно доступный интерактивный онлайн-ресурс, посвящённый масштабированию машинного обучения. Он создан сообществом вокруг JAX и охватывает ключевые методы, практики и архитектурные подходы, которые помогают строить масштабируемые, высокопроизводительные ML-системы.
💡 Что внутри:
— Основы масштабирования моделей и обучения
— Параллелизм данных, параметров и микшированные стратегии
— Технологии распределённого обучения (TPUs/GPUs)
— Оптимизация вычислений и памяти
— Практические примеры на JAX и других стековых инструментах
— Схемы, коды и визуализации для конкретных паттернов обучения
📍 Почему это полезно:
— Подходит как для опытных инженеров ML, так и для тех, кто хочет перейти от прототипов к промышленным ML-системам
— Объединяет теорию и практику распределённого обучения
— Обсуждает реальные ограничения архитектур и пути их решения
— Показывает, как системно мыслить о масштабировании, а не копировать хаки
🔗 Читайте онлайн: jax-ml.github.io/scaling-book
🧠Исследование: как в России обновляют ИИ-образование
J'son & Partners сравнили подготовку ИИ-кадров в США, Китае и России — и везде история одна: технологии развиваются, рынок растёт, а образование за ними не успевает. Справляются с этой проблемой по-разному. В Штатах – через автономию вузов и рыночную экономику, в Китае – через жесткое госрегулирование.
В российской модели – через коллаборацию университетов с бигтехамии: запускаются совместные программы, которые затем масштабирует государство – примеры найдете в исследовании.
Также к обучению активно привлекают практиков: около 1200+ экспертов из Яндекса, 1000 инженеров из VK, и более 900 из Т-Банка уже читают курсы, приносят в аудитории актуальные датасеты, архитектуры и доступ к облачным GPU.Обновлять систему помогают те, кто пишет продакшн-код каждый день. С учетом темпов ИИ-рынка, вполне логично.
+1
🚀 Flowra - простой и понятный open-source движок для создания AI-воркфлоу.
Это тот же движок, что стоит за FlowBench, и он позволяет собирать сложные pipelines так же легко,
как конструктор LEGO.
Что делает Flowra удобной:
✅ Один движок для всех типов данных: изображения, аудио, видео и 3D
✅ Выполнение через DAG-граф: умное кэширование, параллельность и масштабирование
✅ Подключение моделей ModelScope одной строкой — без сложной настройки
✅ Полный цикл разработки:
flowra create → build → debug → deploy
Итог: вы берёте свою ML-модель и превращаете её в визуальный блок, который можно перетаскивать
и соединять с другими.
✨ Без адских зависимостей. Без мучительного дебага.
🔗 GitHub: https://github.com/modelscope/flowra
📥 FlowBench client: https://modelscope.cn/flowbench/download
🖼️ EditThinker: теперь редакторы изображений могут «думать» итеративно!
Новая рамка от Meituan добавляет в любые модели редактирования изображений способность рассуждать: модель критикует результат, уточняет инструкции и повторяет цикл, пока не получит удовлетворяющий итог. Это имитация человеческого процесса мышления - Critique → Refine → Repeat.
EditThinker учится анализировать собственные ошибки, улучшать запросы и идти по итерациям, что значительно повышает качество следования инструкциям.
📌 Liquid AI представила LFM2 - семейство Liquid Foundation Models (350M–8.3B), оптимизированное для работы на устройствах: до 2× быстрее на CPU при префилле и декоде, при этом показывает сильные результаты на бенчмарках. Подходит для edge-приложений с ограниченной памятью.
https://huggingface.co/papers/2512.05965
Российские генеративные модели Kandinsky 5.0 Video Lite и Pro в международной text-to-video арене
🔘Pro версия является ТОП-1 опенсорсом в мире (см. модели с лицензиями MIT, Apache 2.0 в лидерборде)
🔘Lite версия (2B параметров) лучше первой версии Sora
🔘На данный момент Сбер уступает только топовым мировым бигтех компаниям: Google (Veo 3.1, Veo 3), OpenAI (Sora 2), Alibaba (Wan 2.5), KlingAI (Kling 2.5, 2.6); в паритете с Luma AI (Ray 3), MiniMax (Hailuo 2.3) — отрыв по ELO максимум 3 балла, при 95% доверительном интервале оценивания +-21 балла
🔘Для российских генеративных моделей выход на международную арену — уникальное событие
🚀 Полезные ссылки:
🔘Посмотреть весь лидерборд: lmarena
🔘Почитать подробнее про Kandinsky 5.0: пост, техрепорт
🔘Open Source Kandinsky 5.0: github и hf
OpenAI неоднократно переходила в режим «Code Red», сообщает Bloomberg.
«Code Red» - это внутренний режим, когда команды временно бросают второстепенные задачи и фокусируются на одном приоритете. По словам главы исследований OpenAI Марка Чена, компания уже не раз использовала этот подход.
Причина простая: большие команды легко распыляются между агентами, рекламой и исследованиями, из-за чего основной продукт - чат, теряет скорость и надёжность.
Последний «Code Red» последовал сразу после релиза Google Gemini 3.
Ответ OpenAI:
- возврат фокуса на core-stack
- снижение latency
- рост uptime
- более жёсткие eval-циклы, чтобы ловить деградации качества до пользователей
Результат:
- релиз GPT-5.2 и GPT-5.2-Codex
- переработка ChatGPT Images до 4× быстрее генерация при сохранении стабильности деталей между правками
Следующий фокус - сам training engine: алгоритмы + инфраструктура для масштабных обучений. OpenAI обсуждает инвестиции порядка 1.4 трлн долларов в инфраструктуру на горизонте 8 лет.
bloomberg.com/news/articles/2025-12-18/openai-has-declared-code-red-multiple-times-executive-says
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
