Machine learning Interview

Kanalga Telegram’da o‘tish

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya21 939 Texnologiyalar & Aralashmalar4 569...

📈 Telegram kanali Machine learning Interview analitikasi

Machine learning Interview (@machinelearning_interview) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 30 037 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 4 569-o'rinni va Rossiya mintaqasida 21 939-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 30 037 obunachiga ega bo‘ldi.

11 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 39 ga, so‘nggi 24 soatda esa 8 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 18.49% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 8.84% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 5 554 marta ko‘riladi; birinchi sutkada odatda 2 656 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 39 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent claude, llm, контекст, hermes, nvidia kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 12 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

30 037

Obunachilar

+824 soatlar

-117 kunlar

+3930 kunlar

5 554

Post ko'rishlar

~ 2 65624 soatlar

~ 3 84048 soatlar

18.49%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

30 036

⚡️ Elon Musk’s xAI готовится привлечь $20 млрд — включая $7.5 млрд в виде equity и до $12.5 млрд в виде долга. Что показано: - NVIDIA может инвестировать до $2 млрд в equity, причём эта часть финансирована с привязкой к GPU-закупкам. - Структура сделки включает SPV, которая купит GPU, а сама компания xAI будет их арендовать на пять лет. Почему это важно: - схема снижает начальные капитальные затраты xAI — вместо покупки GPU сразу, они арендуют, что даёт гибкость. - крупный партнёр вроде NVIDIA усиливает доверие к проекту и подчёркивает, что аппаратная база остаётся ключевым фактором в развитии ИИ. - сочетание equity и долга в таких объёмах говорит о масштабном расширении инфраструктуры и серьёзных вычислительных мощностях. Возможные риски / вопросы: - зависимость от условий аренды: стоимость, обеспечение, апгрейды, срок замены оборудования. - долговая нагрузка может быть большой, особенно если доходы xAI не вырастут по плану. - риск устаревания оборудования: GPU-поколения меняются, и оборудование может устареть до конца пятилетнего срока аренды.

30 036

🔥Прими участие в Хакатоне от ИТ–холдинга Т1 в Минске и поборись за призовой фонд 600 000 рублей! Когда: 14–17 октября Формат: онлайн + финал на площадке Участвуй, если ты: 🔹обучаешься на технической или ИТ–специальности; 🔹развиваешься в направлении разработки, аналитики, AI/ML, NLP или DevOps; 🔹сможешь быть в Минске 17 октября. Выбери свой кейс: ✴️FaaS система биллинга: платите ровно за то, что используете. Создай биллинговую систему для FaaS – точный расчёт с учётом времени, вызовов и памяти. ✴️Smart Support: поддержка нового поколения. Разработай ИИ-ассистента для службы поддержки с real-time подсказками из базы знаний. Почему стоит участвовать: 🔘Кейс в портфолио и полезная обратная связь от менторов Т1; 🔘Шанс проявить себя, чтобы начать карьеру в одной из крупнейших ИТ-компаний; 🔘Реальный опыт командной работы; 🔘Мерч и атмосфера сильного комьюнити — в Т1 более 5 000 джунов из 580+ вузов России и Беларуси. Регистрация открыта! ➡️ Успей до 12 октября по ссылке. #реклама О рекламодателе

30 036

🔮 IREE — мост между ML-моделями и железом Это не просто очередной фреймворк, а целая экосистема для компиляции ML-моделей в универсальное промежуточное представление, которое одинаково хорошо работает и в дата-центрах, и на мобильных устройствах. Основанный на MLIR инструмент привлёк внимание крупных игроков: AMD использовала его для участия в MLPerf с реализацией SDXL, а сам проект вошёл в LF AI & Data Foundation. Для тех, кто хочет разобраться глубже с его использованием, есть записи выступлений на AsiaLLVM и Vulkanised. 🤖 GitHub @machinelearning_interview

30 036

🎥 Генерация видео из кода с Code2Video Code2Video предлагает инновационный подход к созданию образовательных видео на основе кода. Проект позволяет визуализировать программные концепции, превращая код в наглядные видеоматериалы, что упрощает обучение и понимание. 🚀Основные моменты: - Генерация видео на основе программного кода. - Поддержка различных учебных тем. - Визуализация сложных концепций в доступной форме. - Открытый доступ к проекту и данным. 📌 GitHub: https://github.com/showlab/Code2Video #python

30 036

🎯 Новый вектор атак на ИИ — скрытые промпты в картинках Trail of Bits показали, что хакеры могут прятать инструкции в изображениях. Пока картинка оригинального размера — всё чисто. Но как только сервис (например, Gemini CLI или **Vertex AI Studio**) автоматически сжимает её, проявляется скрытый текст. 📌 Что это значит: - ИИ «видит» спрятанный промпт и исполняет его, думая, что это команда пользователя. - Так можно обойти фильтры и заставить модель делать то, что задумал атакующий. 🛠 Как защититься: - Инструмент Anamorpher (open-source) для генерации и проверки таких атак. - Защита: многоуровневая проверка картинок и отслеживание артефактов при масштабировании. ⚠️ Итог: даже безобидная картинка может оказаться «троянским конем» для ИИ-систем. 🔗Github: https://github.com/trailofbits/anamorpher 🔗 Подробнее: blog.trailofbits.com/2025/08/21/weaponizing-image-scaling-against-production-ai-systems/ #AI #Security #PromptInjection #TrailOfBits

30 036

🛰 ComputerRL — новый фреймворк, который учит AI-агентов работать с компьютером так же, как это делает человек. Главная идея — парадигма API-GUI: агент может и вызывать API, и кликать по кнопкам интерфейса. Благодаря этому исчезает разрыв между машинной автоматизацией и привычным для человека рабочим столом. Команда Zai проверила ComputerRL на модели GLM-4-9B-0414 и протестировала её на бенчмарке OSWorld. Результат — новый агент AutoGLM-OS-9B, который достиг рекордной точности и уверенно решает задачи автоматизации в desktop-средах. Проще говоря: теперь AI может не только «понимать» компьютер, но и полноценно работать с ним — запускать программы, управлять окнами и выполнять сложные действия. 📌 Статья 📌 Проект

30 036

🚀 В ByteDance Seed представили новую технику для обучения LLM - Knapsack RL Проблема: в классическом RL-тренинге распределение rollout-ов идёт равномерно. ✅ Простые задачи всегда решаются → нет градиента ❌ Сложные задачи всегда проваливаются → тоже нет градиента 💡 Решение: рассматривать exploration как задачу рюкзака (knapsack) и распределять вычислительный бюджет туда, где это реально даёт сигнал обучения. ✨ Результаты: 🔼 +20–40% больше ненулевых градиентов 🧮 До 93 rollout-ов на сложные задачи (без доп. вычислений) 📈 +2–4 средних балла, до +9 на пике в математических бенчмарках 💰 ~в 2 раза дешевле, чем равномерное распределение 📄 Подробности: huggingface.co/papers/2509.25849

30 036

😂 Сэм Альтман: 🗣️ Две недели назад: “Нам нужно $7 трлн и 10 ГВт энергии, чтобы победить рак.” 🗣️ Сегодня: “Мы запускаем соц сеть для персонализированного нейрослопа #AI #OpenAI #Altman

30 036

⚡ Менять автоэнкодер в latent diffusion моделях проще, чем кажется. 🚀 DC-Gen — это новый фреймворк для ускорения диффузионных моделей после обучения. Он переводит любую готовую модель в глубоко сжатое латентное пространство, снижая затраты и многократно ускоряя генерацию. 🔑 Основное - Высокое разрешение без потерь качества Версия DC-Gen-FLUX.1-Krea-12B выдаёт то же качество, что и оригинал, но работает в 53 раза быстрее на H100 при 4K. С NVFP4 картинка 4K генерируется всего за 3.5 секунды на одной NVIDIA 5090 (20 шагов). - 💸 Низкая стоимость адаптации Перевод FLUX.1-Krea-12B в глубоко-сжатый автоэнкодер требует всего 40 GPU-дней на H100. 📄 Статья: https://arxiv.org/abs/2509.25180 💻 Код: https://github.com/dc-ai-projects/DC-Gen 🎨 Модели : https://huggingface.co/collections/dc-ai/dc-gen-6899bb095082244f396203e1 #diffusion #deeplearning #AI

30 036

Ищете мощный сервер без переплаты? Выгодное решение для обработки и анализа больших данных — выделенный сервер конфигурации AR45-NVMe от Selectel. Он подойдет для эффективной работы с многопоточностью и Python, R, Spark в рамках одной машины, а также машинного обучения на CPU. Преимущества сервера: - 16 высокочастотных ядер, - Безлимитный интернет-трафик и приватная сеть — 1 Гбит/с, - DDoS-защита, публичный IPv4, SLA — 99,8%, - Автоустановка ОС и загрузка своих ISO-образов, - Техподдержка 24/7 и замена комплектующих за 3 часа. Закажите сервер конфигурации AR45-NVMe на сайте в несколько кликов: https://slc.tl/rurq6?erid=2W5zFK7J7NY

30 036

⚡️ Сэм Альтман о том, почему энергию на ИИ тратить необходимо 💡 Даже если ИИ будет потреблять сотни мегаватт или гигаватты, это оправдано, если он поможет открыть дешёвый и эффективный ядерный синтез и заменить тысячи ГВт углеродной генерации по всему миру. 🌍 «Мы обречены, если не найдём новые научные решения климатического кризиса. Без ИИ мы делаем это слишком медленно. Давайте попробуем с ним». 🔋 Альтман подчёркивает, что современные модели уже очень эффективны по метрике *watts per token* — и в сравнении с энергозатратами человека на размышления выглядят даже выгоднее. 📜 Он сравнил это с Google: в начале компанию критиковали за энергопотребление, но один поисковый запрос тратил куда меньше ресурсов, чем поездка в библиотеку. 👉 Если ИИ поможет найти дешёвый синтез, польза для климата многократно превысит его энергозатраты.

30 036

Repost from Machinelearning

🚀 DeepSeek-V3.2-Exp - вышла новая экспериментальная версия ⚡ Главное: - Основана на V3.1-Terminus - Новый механизм Sparse Attention (DSA) → быстрее и дешевле работа с длинными контекстами - Качество почти без потерь, производительность как у V3.1 - 💰 API подешевел более чем на 50% 📊 V3.1 пока ещё будет доступна до 15 октября 2025. 🔗 Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp) 🔗 Tech Report: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf) 🔗Github: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf @ai_machinelearning_big_data #DeepSeek #AI #V32 #SparseAttention #LLM

30 036

Почему GPT-5 обучался меньше, чем GPT-4.5 Меньше pre-training, больше post-training. Обычно модели тратили в ~100 раз больше вычислений на предобучение, чем на дообучение. В GPT-5 ситуация изменилась: масштабирование post-training оказалось выгоднее по качеству на доллар. - Ключевые факты: - GPT-5 учился на меньшей базе, но с сильным упором на дообучение. - Методы reasoning-ориентированного post-training позволяют сократить предобучение примерно в 10 раз при сохранении качества. - В 2024 году бюджет R&D-вычислений OpenAI был ~$5B, в 2025 вырос до ~$9B. - Почему не масштабировали как GPT-4.5? Для безопасного увеличения post-training нужны огромные датасеты задач, среда для RL и длинные циклы экспериментов. Из-за конкуренции OpenAI решила выпустить GPT-5 быстрее, «выжав» максимум из post-training на меньшей модели. 👉 Вероятно, GPT-6 вернётся к большему pre-training + post-training, чтобы раскрыть потенциал масштабирования. 🔬 Новый отчёт от Epoch AI: https://epoch.ai/gradient-updates/why-gpt5-used-less-training-compute-than-gpt45-but-gpt6-probably-wont

30 036

🧠 Thinking Machines предложила новый способ обучения нейросетей — manifold Muon, который делает веса более стабильными и предсказуемыми. 🔑 Суть метода: - Веса ограничиваются на специальной математической поверхности (многообразии Стифеля), где они не могут «разъехаться». - Размер обновлений контролируется через спектральную норму, чтобы шаги обучения не искажали сеть слишком сильно. - Обновления считаются в касательном пространстве и возвращаются обратно на многообразие. 📊 На тестах CIFAR-10 метод оказался точнее AdamW и удерживал веса в стабильном диапазоне, хотя шаги обучения занимали больше времени. 🎯 Главная идея — ИИ может давать последовательные и надёжные ответы. То, что сейчас считается «рандомностью» моделей, авторы называют исправимым багом. Это может стать основой для создания безопасных AGI-систем, где нельзя допускать хаотичное поведение модели. https://thinkingmachines.ai/blog/modular-manifolds/

30 036

🧠 Hallucination Risk Toolkit for LLMs Этот инструмент позволяет оценивать риск галлюцинаций в больших языковых моделях без повторного обучения. Он преобразует запросы, используя закон декомпрессии, чтобы определить, стоит ли отвечать или отказываться, основываясь на целевом уровне обслуживания. 🚀Основные моменты: - Оценка риска галлюцинаций с помощью математической модели. - Поддержка двух режимов: с контекстом и без. - Использует только API Chat Completions от OpenAI. - Прозрачные математические расчеты для принятия решений. 📌 GitHub: https://github.com/leochlon/hallbayes #python

30 036

Wink AI Challenge — хакатон на стыке IT и кино. Участников ждут задачи, которые ускорят производство фильмов и сериалов за счёт прикладных AI-решений. Призовой фонд соревнования — 1 125 000 рублей. Регистрация до 31 октября: https://cnrlink.com/winkaichallengemlinterview Приглашаем на первый в России хакатон, посвящённый применению ИИ в кинопроизводстве, ML-инженеров, backend- и frontend-разработчиков, специалистов в DevOps, MLOps, а также инженеров в сфере мультимедиа. Вы сможете: 🔸 Разработать ML-модель, которую оценят и будут использовать продюсеры популярных российских фильмов и сериалов. 🔸 Решить кейсы, основанные на реальных задачах, с которыми продюсеры сталкиваются каждый день. 🔸 Использовать настоящие сценарии и видеоматериалы для анализа текстов, извлечения сущностей и генерации структуры съёмок. 🔸 Попрактиковаться в применении NLP, NER и мультимодальных данных в задачах кинопроизводства. Регистрируйтесь на платформе Codenrock и создайте ИИ-ассистента для кинопроизводства: https://cnrlink.com/winkaichallengemlinterview

30 036

📰 Реклама в ChatGPT — даже в платной версии? По данным источников, OpenAI рассматривает идею запускать рекламу прямо в ChatGPT. Ходят слухи, что Марк Симo ведёт переговоры с потенциальными кандидатами (в том числе бывшими коллегами из Facebook), чтобы собрать команду, которая займётся монетизацией — включая и подписки, и новые рекламные форматы. ⚖️ Почему это может быть правдой: - OpenAI тратит огромные суммы и остаётся убыточной. - Стартапы часто работают в минус, но рано или поздно нужно выходить на прибыльность. - Реклама — очевидный источник дохода. ⚖️ Почему это вызывает сомнения: - Платные пользователи могут потерять доверие, если реклама появится даже там. - Это ударит по бренду ChatGPT. - Вероятно, куда больший доход принесёт B2B-направление, а не потребительский сегмент. 📊 На сегодня около 3% пользователей платят за ChatGPT, а 97% используют бесплатный тариф. Поддерживать такую модель дорого, и OpenAI ищет варианты. Но станет ли реклама решением — пока не ясно. #OpenAI #ChatGPT #Ads #AIbusiness

30 036

Tiny LLM — запускаем LLM-сервис за неделю Это небольшой курс-гайд, где шаг за шагом показывается, как с нуля (на чистых матричных операциях) поднять модель Qwen2-7B, а затем оптимизировать её производительность. Неделя 1: просто на Python, без “чёрной магии” Неделя 2: оптимизации, C++ / Metal ядра Неделя 3: батчинг и масштабирование сервиса Подходит системным инженерам, которые хотят прозрачности — увидеть, из чего состоит работа LLM-сервера, без слоёв абстракций. Работает с MLX (для Apple Silicon) и проверяется через сравнение с CPU-реализацией на PyTorch. 🔗 Подробнее: https://skyzh.github.io/tiny-llm/

30 036

🧠 Yandex B2B Tech запустила AI Studio: создавай ИИ-агентов без навыков разработки Платформа позволяет собирать AI-агентов на базе облачных моделей Яндекса или опенсорсных нейросетей. 📌 Что можно делать: • Автоматизировать рутину: комплаенс-проверки, бухотчётность, поддержку клиентов • Строить мультиагентные системы (например, один анализирует спрос, другой планирует закупки) • Подключать голосовых агентов для кол-центров на базе realtime API; • Встраивать умный поиск по интернету, а также по картинкам, таблицам и документам; • Быстро подключать ИИ-агентов к внешним системам по шаблонам через MCP Hub (там уже доступны amoCRM и “Контур.Фокус”). Такие ИИ-ассистенты уже доступны в самих сервисах Yandex Cloud – они могут сами составить запросы для баз данных, проверить алерты и развернуть ВМ в консоли. Для этого достаточно сформулировать запрос на простом языке. #YandexCloud #AIStudio #NoCodeAI #бизнесавтоматизация

30 036

🧠 Интеллектуальный маршрутизатор для LLM Semantic Router направляет запросы к OpenAI API на основе семантического понимания, выбирая наиболее подходящие модели из пула. Использует классификацию BERT для повышения точности вывода и предлагает функции безопасности, такие как обнаружение PII и защита от jailbreak. 🚀 Основные моменты: - Авто-выбор моделей для оптимизации запросов - Инструменты выбора на основе контекста запроса - Обнаружение и защита от PII - Кэширование семантических представлений для ускорения обработки 📌 GitHub: https://github.com/vllm-project/semantic-router #python