Machine learning Interview

前往频道在 Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

显示更多

网络:Machinelearning 俄罗斯21 939 技术与应用4 569...

📈 Telegram 频道 Machine learning Interview 的分析概览

频道 Machine learning Interview (@machinelearning_interview) 俄语语言赛道中的是活跃参与者。目前社区聚集了 30 037 名订阅者，在 技术与应用 类别中位列第 4 569，并在 俄罗斯 地区排名第 21 939 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 30 037 名订阅者。

根据 11 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 39，过去 24 小时变化为 8，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 18.49%。内容发布后 24 小时内通常能获得 8.84% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 5 554 次浏览，首日通常累积 2 656 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 39。
主题关注点： 内容集中在 claude, llm, контекст, hermes, nvidia 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

凭借高频更新（最新数据采集于 12 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

30 037

订阅者

+824 小时

-117 天

+3930 天

5 554

帖子浏览量

~ 2 65624 小时

~ 3 84048 小时

18.49%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

30 036

⚡️ Elon Musk’s xAI готовится привлечь $20 млрд — включая $7.5 млрд в виде equity и до $12.5 млрд в виде долга. Что показано: - NVIDIA может инвестировать до $2 млрд в equity, причём эта часть финансирована с привязкой к GPU-закупкам. - Структура сделки включает SPV, которая купит GPU, а сама компания xAI будет их арендовать на пять лет. Почему это важно: - схема снижает начальные капитальные затраты xAI — вместо покупки GPU сразу, они арендуют, что даёт гибкость. - крупный партнёр вроде NVIDIA усиливает доверие к проекту и подчёркивает, что аппаратная база остаётся ключевым фактором в развитии ИИ. - сочетание equity и долга в таких объёмах говорит о масштабном расширении инфраструктуры и серьёзных вычислительных мощностях. Возможные риски / вопросы: - зависимость от условий аренды: стоимость, обеспечение, апгрейды, срок замены оборудования. - долговая нагрузка может быть большой, особенно если доходы xAI не вырастут по плану. - риск устаревания оборудования: GPU-поколения меняются, и оборудование может устареть до конца пятилетнего срока аренды.

30 036

🔥Прими участие в Хакатоне от ИТ–холдинга Т1 в Минске и поборись за призовой фонд 600 000 рублей! Когда: 14–17 октября Формат: онлайн + финал на площадке Участвуй, если ты: 🔹обучаешься на технической или ИТ–специальности; 🔹развиваешься в направлении разработки, аналитики, AI/ML, NLP или DevOps; 🔹сможешь быть в Минске 17 октября. Выбери свой кейс: ✴️FaaS система биллинга: платите ровно за то, что используете. Создай биллинговую систему для FaaS – точный расчёт с учётом времени, вызовов и памяти. ✴️Smart Support: поддержка нового поколения. Разработай ИИ-ассистента для службы поддержки с real-time подсказками из базы знаний. Почему стоит участвовать: 🔘Кейс в портфолио и полезная обратная связь от менторов Т1; 🔘Шанс проявить себя, чтобы начать карьеру в одной из крупнейших ИТ-компаний; 🔘Реальный опыт командной работы; 🔘Мерч и атмосфера сильного комьюнити — в Т1 более 5 000 джунов из 580+ вузов России и Беларуси. Регистрация открыта! ➡️ Успей до 12 октября по ссылке. #реклама О рекламодателе

30 036

🔮 IREE — мост между ML-моделями и железом Это не просто очередной фреймворк, а целая экосистема для компиляции ML-моделей в универсальное промежуточное представление, которое одинаково хорошо работает и в дата-центрах, и на мобильных устройствах. Основанный на MLIR инструмент привлёк внимание крупных игроков: AMD использовала его для участия в MLPerf с реализацией SDXL, а сам проект вошёл в LF AI & Data Foundation. Для тех, кто хочет разобраться глубже с его использованием, есть записи выступлений на AsiaLLVM и Vulkanised. 🤖 GitHub @machinelearning_interview

30 036

🎥 Генерация видео из кода с Code2Video Code2Video предлагает инновационный подход к созданию образовательных видео на основе кода. Проект позволяет визуализировать программные концепции, превращая код в наглядные видеоматериалы, что упрощает обучение и понимание. 🚀Основные моменты: - Генерация видео на основе программного кода. - Поддержка различных учебных тем. - Визуализация сложных концепций в доступной форме. - Открытый доступ к проекту и данным. 📌 GitHub: https://github.com/showlab/Code2Video #python

30 036

🎯 Новый вектор атак на ИИ — скрытые промпты в картинках Trail of Bits показали, что хакеры могут прятать инструкции в изображениях. Пока картинка оригинального размера — всё чисто. Но как только сервис (например, Gemini CLI или **Vertex AI Studio**) автоматически сжимает её, проявляется скрытый текст. 📌 Что это значит: - ИИ «видит» спрятанный промпт и исполняет его, думая, что это команда пользователя. - Так можно обойти фильтры и заставить модель делать то, что задумал атакующий. 🛠 Как защититься: - Инструмент Anamorpher (open-source) для генерации и проверки таких атак. - Защита: многоуровневая проверка картинок и отслеживание артефактов при масштабировании. ⚠️ Итог: даже безобидная картинка может оказаться «троянским конем» для ИИ-систем. 🔗Github: https://github.com/trailofbits/anamorpher 🔗 Подробнее: blog.trailofbits.com/2025/08/21/weaponizing-image-scaling-against-production-ai-systems/ #AI #Security #PromptInjection #TrailOfBits

30 036

🛰 ComputerRL — новый фреймворк, который учит AI-агентов работать с компьютером так же, как это делает человек. Главная идея — парадигма API-GUI: агент может и вызывать API, и кликать по кнопкам интерфейса. Благодаря этому исчезает разрыв между машинной автоматизацией и привычным для человека рабочим столом. Команда Zai проверила ComputerRL на модели GLM-4-9B-0414 и протестировала её на бенчмарке OSWorld. Результат — новый агент AutoGLM-OS-9B, который достиг рекордной точности и уверенно решает задачи автоматизации в desktop-средах. Проще говоря: теперь AI может не только «понимать» компьютер, но и полноценно работать с ним — запускать программы, управлять окнами и выполнять сложные действия. 📌 Статья 📌 Проект

30 036

🚀 В ByteDance Seed представили новую технику для обучения LLM - Knapsack RL Проблема: в классическом RL-тренинге распределение rollout-ов идёт равномерно. ✅ Простые задачи всегда решаются → нет градиента ❌ Сложные задачи всегда проваливаются → тоже нет градиента 💡 Решение: рассматривать exploration как задачу рюкзака (knapsack) и распределять вычислительный бюджет туда, где это реально даёт сигнал обучения. ✨ Результаты: 🔼 +20–40% больше ненулевых градиентов 🧮 До 93 rollout-ов на сложные задачи (без доп. вычислений) 📈 +2–4 средних балла, до +9 на пике в математических бенчмарках 💰 ~в 2 раза дешевле, чем равномерное распределение 📄 Подробности: huggingface.co/papers/2509.25849

30 036

😂 Сэм Альтман: 🗣️ Две недели назад: “Нам нужно $7 трлн и 10 ГВт энергии, чтобы победить рак.” 🗣️ Сегодня: “Мы запускаем соц сеть для персонализированного нейрослопа #AI #OpenAI #Altman

30 036

⚡ Менять автоэнкодер в latent diffusion моделях проще, чем кажется. 🚀 DC-Gen — это новый фреймворк для ускорения диффузионных моделей после обучения. Он переводит любую готовую модель в глубоко сжатое латентное пространство, снижая затраты и многократно ускоряя генерацию. 🔑 Основное - Высокое разрешение без потерь качества Версия DC-Gen-FLUX.1-Krea-12B выдаёт то же качество, что и оригинал, но работает в 53 раза быстрее на H100 при 4K. С NVFP4 картинка 4K генерируется всего за 3.5 секунды на одной NVIDIA 5090 (20 шагов). - 💸 Низкая стоимость адаптации Перевод FLUX.1-Krea-12B в глубоко-сжатый автоэнкодер требует всего 40 GPU-дней на H100. 📄 Статья: https://arxiv.org/abs/2509.25180 💻 Код: https://github.com/dc-ai-projects/DC-Gen 🎨 Модели : https://huggingface.co/collections/dc-ai/dc-gen-6899bb095082244f396203e1 #diffusion #deeplearning #AI

30 036

Ищете мощный сервер без переплаты? Выгодное решение для обработки и анализа больших данных — выделенный сервер конфигурации AR45-NVMe от Selectel. Он подойдет для эффективной работы с многопоточностью и Python, R, Spark в рамках одной машины, а также машинного обучения на CPU. Преимущества сервера: - 16 высокочастотных ядер, - Безлимитный интернет-трафик и приватная сеть — 1 Гбит/с, - DDoS-защита, публичный IPv4, SLA — 99,8%, - Автоустановка ОС и загрузка своих ISO-образов, - Техподдержка 24/7 и замена комплектующих за 3 часа. Закажите сервер конфигурации AR45-NVMe на сайте в несколько кликов: https://slc.tl/rurq6?erid=2W5zFK7J7NY

30 036

⚡️ Сэм Альтман о том, почему энергию на ИИ тратить необходимо 💡 Даже если ИИ будет потреблять сотни мегаватт или гигаватты, это оправдано, если он поможет открыть дешёвый и эффективный ядерный синтез и заменить тысячи ГВт углеродной генерации по всему миру. 🌍 «Мы обречены, если не найдём новые научные решения климатического кризиса. Без ИИ мы делаем это слишком медленно. Давайте попробуем с ним». 🔋 Альтман подчёркивает, что современные модели уже очень эффективны по метрике *watts per token* — и в сравнении с энергозатратами человека на размышления выглядят даже выгоднее. 📜 Он сравнил это с Google: в начале компанию критиковали за энергопотребление, но один поисковый запрос тратил куда меньше ресурсов, чем поездка в библиотеку. 👉 Если ИИ поможет найти дешёвый синтез, польза для климата многократно превысит его энергозатраты.

30 036

Repost from Machinelearning

🚀 DeepSeek-V3.2-Exp - вышла новая экспериментальная версия ⚡ Главное: - Основана на V3.1-Terminus - Новый механизм Sparse Attention (DSA) → быстрее и дешевле работа с длинными контекстами - Качество почти без потерь, производительность как у V3.1 - 💰 API подешевел более чем на 50% 📊 V3.1 пока ещё будет доступна до 15 октября 2025. 🔗 Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp) 🔗 Tech Report: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf) 🔗Github: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf @ai_machinelearning_big_data #DeepSeek #AI #V32 #SparseAttention #LLM

30 036

Почему GPT-5 обучался меньше, чем GPT-4.5 Меньше pre-training, больше post-training. Обычно модели тратили в ~100 раз больше вычислений на предобучение, чем на дообучение. В GPT-5 ситуация изменилась: масштабирование post-training оказалось выгоднее по качеству на доллар. - Ключевые факты: - GPT-5 учился на меньшей базе, но с сильным упором на дообучение. - Методы reasoning-ориентированного post-training позволяют сократить предобучение примерно в 10 раз при сохранении качества. - В 2024 году бюджет R&D-вычислений OpenAI был ~$5B, в 2025 вырос до ~$9B. - Почему не масштабировали как GPT-4.5? Для безопасного увеличения post-training нужны огромные датасеты задач, среда для RL и длинные циклы экспериментов. Из-за конкуренции OpenAI решила выпустить GPT-5 быстрее, «выжав» максимум из post-training на меньшей модели. 👉 Вероятно, GPT-6 вернётся к большему pre-training + post-training, чтобы раскрыть потенциал масштабирования. 🔬 Новый отчёт от Epoch AI: https://epoch.ai/gradient-updates/why-gpt5-used-less-training-compute-than-gpt45-but-gpt6-probably-wont

30 036

🧠 Thinking Machines предложила новый способ обучения нейросетей — manifold Muon, который делает веса более стабильными и предсказуемыми. 🔑 Суть метода: - Веса ограничиваются на специальной математической поверхности (многообразии Стифеля), где они не могут «разъехаться». - Размер обновлений контролируется через спектральную норму, чтобы шаги обучения не искажали сеть слишком сильно. - Обновления считаются в касательном пространстве и возвращаются обратно на многообразие. 📊 На тестах CIFAR-10 метод оказался точнее AdamW и удерживал веса в стабильном диапазоне, хотя шаги обучения занимали больше времени. 🎯 Главная идея — ИИ может давать последовательные и надёжные ответы. То, что сейчас считается «рандомностью» моделей, авторы называют исправимым багом. Это может стать основой для создания безопасных AGI-систем, где нельзя допускать хаотичное поведение модели. https://thinkingmachines.ai/blog/modular-manifolds/

30 036

🧠 Hallucination Risk Toolkit for LLMs Этот инструмент позволяет оценивать риск галлюцинаций в больших языковых моделях без повторного обучения. Он преобразует запросы, используя закон декомпрессии, чтобы определить, стоит ли отвечать или отказываться, основываясь на целевом уровне обслуживания. 🚀Основные моменты: - Оценка риска галлюцинаций с помощью математической модели. - Поддержка двух режимов: с контекстом и без. - Использует только API Chat Completions от OpenAI. - Прозрачные математические расчеты для принятия решений. 📌 GitHub: https://github.com/leochlon/hallbayes #python

30 036

Wink AI Challenge — хакатон на стыке IT и кино. Участников ждут задачи, которые ускорят производство фильмов и сериалов за счёт прикладных AI-решений. Призовой фонд соревнования — 1 125 000 рублей. Регистрация до 31 октября: https://cnrlink.com/winkaichallengemlinterview Приглашаем на первый в России хакатон, посвящённый применению ИИ в кинопроизводстве, ML-инженеров, backend- и frontend-разработчиков, специалистов в DevOps, MLOps, а также инженеров в сфере мультимедиа. Вы сможете: 🔸 Разработать ML-модель, которую оценят и будут использовать продюсеры популярных российских фильмов и сериалов. 🔸 Решить кейсы, основанные на реальных задачах, с которыми продюсеры сталкиваются каждый день. 🔸 Использовать настоящие сценарии и видеоматериалы для анализа текстов, извлечения сущностей и генерации структуры съёмок. 🔸 Попрактиковаться в применении NLP, NER и мультимодальных данных в задачах кинопроизводства. Регистрируйтесь на платформе Codenrock и создайте ИИ-ассистента для кинопроизводства: https://cnrlink.com/winkaichallengemlinterview

30 036

📰 Реклама в ChatGPT — даже в платной версии? По данным источников, OpenAI рассматривает идею запускать рекламу прямо в ChatGPT. Ходят слухи, что Марк Симo ведёт переговоры с потенциальными кандидатами (в том числе бывшими коллегами из Facebook), чтобы собрать команду, которая займётся монетизацией — включая и подписки, и новые рекламные форматы. ⚖️ Почему это может быть правдой: - OpenAI тратит огромные суммы и остаётся убыточной. - Стартапы часто работают в минус, но рано или поздно нужно выходить на прибыльность. - Реклама — очевидный источник дохода. ⚖️ Почему это вызывает сомнения: - Платные пользователи могут потерять доверие, если реклама появится даже там. - Это ударит по бренду ChatGPT. - Вероятно, куда больший доход принесёт B2B-направление, а не потребительский сегмент. 📊 На сегодня около 3% пользователей платят за ChatGPT, а 97% используют бесплатный тариф. Поддерживать такую модель дорого, и OpenAI ищет варианты. Но станет ли реклама решением — пока не ясно. #OpenAI #ChatGPT #Ads #AIbusiness

30 036

Tiny LLM — запускаем LLM-сервис за неделю Это небольшой курс-гайд, где шаг за шагом показывается, как с нуля (на чистых матричных операциях) поднять модель Qwen2-7B, а затем оптимизировать её производительность. Неделя 1: просто на Python, без “чёрной магии” Неделя 2: оптимизации, C++ / Metal ядра Неделя 3: батчинг и масштабирование сервиса Подходит системным инженерам, которые хотят прозрачности — увидеть, из чего состоит работа LLM-сервера, без слоёв абстракций. Работает с MLX (для Apple Silicon) и проверяется через сравнение с CPU-реализацией на PyTorch. 🔗 Подробнее: https://skyzh.github.io/tiny-llm/

30 036

🧠 Yandex B2B Tech запустила AI Studio: создавай ИИ-агентов без навыков разработки Платформа позволяет собирать AI-агентов на базе облачных моделей Яндекса или опенсорсных нейросетей. 📌 Что можно делать: • Автоматизировать рутину: комплаенс-проверки, бухотчётность, поддержку клиентов • Строить мультиагентные системы (например, один анализирует спрос, другой планирует закупки) • Подключать голосовых агентов для кол-центров на базе realtime API; • Встраивать умный поиск по интернету, а также по картинкам, таблицам и документам; • Быстро подключать ИИ-агентов к внешним системам по шаблонам через MCP Hub (там уже доступны amoCRM и “Контур.Фокус”). Такие ИИ-ассистенты уже доступны в самих сервисах Yandex Cloud – они могут сами составить запросы для баз данных, проверить алерты и развернуть ВМ в консоли. Для этого достаточно сформулировать запрос на простом языке. #YandexCloud #AIStudio #NoCodeAI #бизнесавтоматизация

30 036

🧠 Интеллектуальный маршрутизатор для LLM Semantic Router направляет запросы к OpenAI API на основе семантического понимания, выбирая наиболее подходящие модели из пула. Использует классификацию BERT для повышения точности вывода и предлагает функции безопасности, такие как обнаружение PII и защита от jailbreak. 🚀 Основные моменты: - Авто-выбор моделей для оптимизации запросов - Инструменты выбора на основе контекста запроса - Обнаружение и защита от PII - Кэширование семантических представлений для ускорения обработки 📌 GitHub: https://github.com/vllm-project/semantic-router #python