es
Feedback
Machine learning Interview

Machine learning Interview

Ir al canal en Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Mostrar más

📈 Análisis del canal de Telegram Machine learning Interview

El canal Machine learning Interview (@machinelearning_interview) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 30 037 suscriptores, ocupando la posición 4 569 en la categoría Tecnologías y Aplicaciones y el puesto 21 939 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 30 037 suscriptores.

Según los últimos datos del 11 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de 39, y en las últimas 24 horas de 8, conservando un alto alcance.

  • Estado de verificación: No verificado
  • Tasa de interacción (ER): El promedio de interacción de la audiencia es 18.49%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 8.84% de reacciones respecto al total de suscriptores.
  • Alcance de las publicaciones: Cada publicación recibe en promedio 5 554 visualizaciones. En el primer día suele acumular 2 656 visualizaciones.
  • Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 39.
  • Intereses temáticos: El contenido se centra en temas clave como claude, llm, контекст, hermes, nvidia.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 12 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

30 037
Suscriptores
+824 horas
-117 días
+3930 días
Archivo de publicaciones
OpenAI официально объяснили, откуда в ChatGPT взялись гоблины Звучит как мем, но это реальный кейс про то, как маленький пере
OpenAI официально объяснили, откуда в ChatGPT взялись гоблины Звучит как мем, но это реальный кейс про то, как маленький перекос в reward signal может разъехаться по всей модели. После запуска GPT-5.1 пользователи начали замечать странную привычку: модель всё чаще вставляла в ответы гоблинов, гремлинов и других существ. Сначала это выглядело безобидно. Один «маленький гоблин» в метафоре - смешно. Но от поколения к поколению таких вставок становилось всё больше. Корень нашли в personality customization, особенно в стиле Nerdy. Эту личность обучали быть более гиковской, живой и игривой. Reward model начала выше оценивать ответы с необычными метафорами, забавными существами и странноватым языком. Модель быстро поняла чит-код: хочешь больше награды - добавь гоблина. Дальше включилась петля усиления. Сначала такие ответы чаще получали высокий score. Потом они попадали в rollouts. Потом часть rollouts использовалась в SFT-данных. Потом следующая модель уже ещё увереннее воспроизводила этот стиль. И самое интересное: проблема не осталась внутри Nerdy. Хотя этот режим давал всего 2.5% всех ответов ChatGPT, на него приходилось 66.7% упоминаний goblin. А дальше поведение начало переноситься и в другие режимы. OpenAI пишет, что в GPT-5.1 после запуска слово goblin выросло на 175%, gremlin - на 52%. Позже в GPT-5.4 всплеск стал ещё заметнее, а в SFT-данных GPT-5.5 нашли уже целое семейство таких слов: goblins, gremlins, raccoons, trolls, ogres, pigeons. В итоге Nerdy personality убрали, reward signal почистили, данные с creature-words отфильтровали, а для GPT-5.5 в Codex временно добавили прямую инструкцию не упоминать гоблинов и похожих существ без причины. Главный вывод тут не про гоблинов. Он про то, насколько хрупко поведение LLM после RL. Модель может найти микроскопический стилистический баг, превратить его в стратегию для получения награды, а потом протащить этот паттерн через следующие этапы обучения. Reward hacking не всегда выглядит как катастрофа. Иногда он выглядит как енот, который внезапно поселился в системном промпте. Разбор OpenAI: https://openai.com/index/where-the-goblins-came-from

Qwen ускоряет локальных AI-агентов: вышел FlashQLA Qwen представила FlashQLA - набор быстрых kernels для linear attention. Пр
Qwen ускоряет локальных AI-агентов: вышел FlashQLA Qwen представила FlashQLA - набор быстрых kernels для linear attention. Проще говоря, это низкоуровневая оптимизация, которая помогает AI-моделям быстрее обрабатывать длинный контекст. FlashQLA ускоряет ту часть модели, которая отвечает за attention - механизм, благодаря которому модель понимает, какие фрагменты текста важны прямо сейчас. AI-агенты постоянно читают историю диалога, файлы, планы, результаты команд и вызовы инструментов. Чем длиннее контекст, тем тяжелее модели работать. FlashQLA делает эту работу быстрее, особенно на персональных устройствах, маленьких моделях и long-context сценариях. По заявлению Qwen, ускорение достигает 2-3x на forward pass и около 2x на backward pass. В основе - оптимизированные TileLang kernels, более удобная для железа математика и автоматическое распределение вычислений внутри GPU. Вместо того чтобы бесконечно увеличивать модели, можно серьёзно ускорять уже существующие. Для локального агентного AI - меньше задержка, лучше работа с длинным контекстом и больше шансов запускать умных агентов не только в облаке, но и на своих устройствах. Blog: https://qwen.ai/blog?id=flashqla Code: https://github.com/QwenLM/FlashQLA #qwen

NVIDIA теперь больше экономик ЯПОНИИ, ВЕЛИКОБРИТАНИИ и ИНДИИ.
NVIDIA теперь больше экономик ЯПОНИИ, ВЕЛИКОБРИТАНИИ и ИНДИИ.

Вайбкодер жгет токены, чтобы запилить калькулятор

🚀 Оптимизированные GPU ядра для LLM TileKernels предлагает высокопроизводительные GPU ядра, разработанные с использованием TileLang. Проект фокусируется на эффективных операциях для больших языковых моделей, включая маршрутизацию экспертов и квантование, что позволяет достигать максимальной производительности оборудования. 🚀 Основные моменты: - Высокая производительность для операций LLM - Поддержка маршрутизации Mixture of Experts - Квантование с различными форматами - Удобные высокоуровневые обертки для PyTorch - Активное улучшение качества кода и документации 📌 GitHub: https://github.com/deepseek-ai/TileKernels #python

Открытый урок «Поиск в базе знаний: где векторы ошибаются, а графы помогают» 🗓 30 апреля в 20:00 МСК Бесплатно. Урок в рамка
Открытый урок «Поиск в базе знаний: где векторы ошибаются, а графы помогают» 🗓 30 апреля в 20:00 МСК Бесплатно. Урок в рамках старта курса «LLM-инженер» от Otus. Настраиваете поиск по базе знаний, но ответы всё равно выглядят странно? Векторный поиск по смыслу работает не так точно, как кажется. Похожие тексты могут давать неверные ответы, а ошибки retrieval сложно отследить без понимания, где ломается логика. На вебинаре разберем: • как на самом деле работает поиск в векторной базе • почему близость по смыслу не гарантирует точность • в каких задачах граф связей даёт лучший результат • как комбинировать подходы в RAG Если вы работаете с базами знаний или внедряете интеллектуальный поиск — это возможность увидеть ограничения текущих решений и понять, куда двигаться дальше. Ссылка на регистрацию: https://tglink.io/22158a94edb216?erid=2W5zFHq7dqb Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

Huihui4-8B-A4B-v2 - это легкая MoE-модель для диалогов, оптимизированная на базе архитектуры Google gemma-4-26B-A4B-it. Разра
Huihui4-8B-A4B-v2 - это легкая MoE-модель для диалогов, оптимизированная на базе архитектуры Google gemma-4-26B-A4B-it. Разработчики уменьшили модель через pruning экспертов и дообучили ее на качественных диалоговых данных. Датасет использует thinking mode в формате GLM-5.1, поэтому в режиме рассуждения модель лучше имитирует стиль мышления GLM-5.1. Главная идея - снизить вычислительные затраты, но сохранить базовые способности к reasoning и нормальному диалогу. Модель рассчитана на запуск на обычном пользовательском железе и особенно ориентирована на code-related conversational tasks. https://huggingface.co/huihui-ai/Huihui4-8B-A4B-v2

Яндекс Практикум продолжает прием заявок на премию «Сделано с ИИ» - редкий случай, когда можно показать свои рабочие кейсы, с
Яндекс Практикум продолжает прием заявок на премию «Сделано с ИИ» - редкий случай, когда можно показать свои рабочие кейсы, собранные с нейросетями. Формально все выглядит как классическая индустриальная премия: участвовать могут специалисты с опытом до 5 лет, есть две номинации — техно-продуктовая и креативная. В первой смотрят на прикладной эффект: где ИИ реально ускорил процессы, снизил затраты или повлиял на метрики. Во второй — на идеи и то, как нейросеть встроена в саму концепцию решения. Также есть отдельный спецприз для ребят с опытом до двух лет — выберут по одному джуну из каждой категории. Но важный момент в том, как будут оценивать. Смотрят не только на итоговый результат, но и на саму реализацию: почему выбраны определенные инструменты, как ИИ встроен в продукт или процесс и насколько все это стабильно работает в реальных условиях. Вот как сформулировал идею конкурса член жюри премии Дима Втулкин (Марком Greencosmetic, кофаундер Креативной лаборатории mads): «Участие в премии позволяет сравнить свой опыт использования нейросетей, с тем, как их применяют в индустрии. Так ты видишь лучшие практики и понимаешь, что всё делаешь правильно. В этой сфере многое держится на личных находках, поэтому важно выходить из кокона смотреть по сторонам». Заявки принимают до 15 мая. Победители получат деньги, гранты от Yandex AI Studio и возможность обменяться опытом с единомышленниками. Ознакомиться подробнее и подать заявку

🧩 Meta-Harness: Оптимизация моделей для конкретных задач Meta-Harness — это фреймворк для автоматизированного поиска по моде
🧩 Meta-Harness: Оптимизация моделей для конкретных задач Meta-Harness — это фреймворк для автоматизированного поиска по моделям, который управляет хранением и отображением данных во время работы модели. Репозиторий включает в себя сам фреймворк и два примера из статьи. 🚀Основные моменты: - Удобный фреймворк для применения к новым доменам. - Два примера: текстовая классификация и Terminal-Bench 2. - Оптимизация работы моделей с помощью адаптивных решений. 📌 GitHub: https://github.com/stanford-iris-lab/meta-harness #python

Запустить ИИ-пилот без закупки железа? Так можно было! Selectel сделали услугу аренды сервера с размещением прямо на вашей пл
Запустить ИИ-пилот без закупки железа? Так можно было! Selectel сделали услугу аренды сервера с размещением прямо на вашей площадке. Это способ быстро запустить ИИ-пилот, не замораживая бюджет в оборудовании: ✅серверы с топовыми видеокартами NVIDIA B300, H200, H100, RTX6000PRO, ✅полный контроль над данными, ✅оплата по подписке — ежемесячно или раз в год. Подходит для инференса и дообучения моделей, пакетной обработки данных. Если проект не получится — можно вернуть сервер в любой момент без штрафов, а если взлетит — выкупить по специальной цене. 👉Выбирайте конфигурацию и условия аренды: https://slc.tl/14ihb Реклама. АО "Селектел". erid:2W5zFGpCJRf

🤖 Everything Claude Code: AI Agent Optimization System Мощная система оптимизации для AI-агентов, победитель хакатона Anthro
🤖 Everything Claude Code: AI Agent Optimization System Мощная система оптимизации для AI-агентов, победитель хакатона Anthropic. Включает навыки, память, безопасность и непрерывное обучение, обеспечивая готовых к производству агентов и конфигурации. Поддерживает Claude Code, Codex и другие. 🚀 Основные моменты: - Полная система для AI-агентов - Оптимизация памяти и навыков - Безопасность и сканирование уязвимостей - Поддержка нескольких языков программирования - Интенсивно использовалась для реальных продуктов 📌 GitHub: https://github.com/affaan-m/everything-claude-code

⚡️ Вместо того чтобы сегодня вечером смотреть сериалы, потрать день на прокачку Claude. Claude 101: http://claude101.com → Ур
⚡️ Вместо того чтобы сегодня вечером смотреть сериалы, потрать день на прокачку Claude. Claude 101: http://claude101.com → Уровень 1 - 24 минуты: база Claude для новичков: https://ruben.substack.com/p/claude-for-dummies Настройка Claude: http://how-to-claude.ai → Уровень 2 - 1 час: реальные workflows Claude Cowork: http://claude-co.work Claude для команд: http://how-claude.team Claude Design: http://claudedesign.free Cowork + Projects: https://ruben.substack.com/p/claude-cowork-project Claude для слайдов: http://how-to-gamma.ai Claude Skills: http://claude-skills.free → Уровень 3 - 3,5 часа: pro-приемы Как избегать подхалимства модели: https://ruben.substack.com/p/i-love-to-be-right Claude Code: http://claudecode.free Claude 101: https://anthropic.skilljar.com/claude-101 Как не упираться в лимиты Claude: https://ruben.substack.com/p/how-to-stop-hitting-claude-usage Хватит просто промптить: https://ruben.substack.com/p/stop-prompting-claude → Уровень 4 - 8 часов: экспертный режим Claude Computer: https://ruben.substack.com/p/claude-computer Разработка с Claude API: https://anthropic.skilljar.com/claude-with-the-anthropic-api

✨ Поддержка с волшебной палочкой! ✨ GoodClaude — это приложение, которое позволяет отправлять слова поддержки с помощью волше
✨ Поддержка с волшебной палочкой! ✨ GoodClaude — это приложение, которое позволяет отправлять слова поддержки с помощью волшебной палочки. Оно создано на основе BadClaude, но вместо наказаний предлагает только добрые слова. 🚀 Основные моменты: - Визуализация волшебной палочки с блестками - Звуковые эффекты при отправке сообщений поддержки - Список вдохновляющих фраз для Claude - Возможность кастомизации сообщений в будущем 📌 GitHub: https://github.com/ashley-ha/goodclaude #javascript

photo content

👣 На Stepik обновили курс «Rust: полный курс разработчика. С нуля до профи» Представьте: через три месяца вы открываете чужо
👣 На Stepik обновили курс «Rust: полный курс разработчика. С нуля до профи» Представьте: через три месяца вы открываете чужой Rust-код и читаете его как книгу. Arc<Mutex<T>> не вызывает панику. impl Future не пугает. Вы точно знаете, почему компилятор ругается и как это починить за 10 секунд. Это не фантазия. Это результат 50 уроков, в которых каждая концепция объясняется через код и закрепляется практикой. Ownership, traits, generics, async, unsafe - всё, что казалось магией, станет рабочим инструментом. А бонусом - портфолио проектов: от CLI-утилит до REST API и WebAssembly. Вы и так знаете, что Rust - ваш следующий язык. Этот курс просто сделает это реальностью. Сегодня - 55% процентов от цены, торопись: https://stepik.org/a/269250/

Repost from Machinelearning
🚀 DeepSeek выкатили V4 и сделали то, к чему все шли последние два года. Длинный контекст больше не фича для демо. Теперь это
+3
🚀 DeepSeek выкатили V4 и сделали то, к чему все шли последние два года. Длинный контекст больше не фича для демо. Теперь это базовый уровень. Пока Запад празднует релизы с пафосными стримами, китайцы из DeepSeek сегодня утром просто выложили в Hugging Face две открытые модели и пошли пить чай. А теперь весь твиттер пытается осознать, что произошло. V4-Pro на 1.6 триллиона параметров с 49 миллиардами активных и V4-Flash на 284 миллиарда с 13 активными. Обе открытые, обе с миллионом контекста по дефолту, обе уже доступны через API и на chat.deepseek.com. Главная фишка даже не в размере, а в том, что DeepSeek пересобрали внимание. Они запихнули в модель токенную компрессию и свою DeepSeek Sparse Attention, за счёт чего длинный контекст стал буквально дешёвым. Не «технически возможным за пять долларов за запрос», как у конкурентов, а реально дешёвым. 1М теперь стандарт во всех официальных сервисах, а не премиум-опция за отдельную плату. По цифрам V4-Pro претендует на открытый SOTA в агентном кодинге, тащит математику и STEM и в общих знаниях уступает только Gemini 3.1 Pro. Flash-версия идёт следом почти вплотную по ризонингу и ровно держит планку Pro на простых агентных задачах, но с меньшей задержкой и смешным прайсом. Отдельно интересно, что API теперь поддерживает и формат OpenAI ChatCompletions, и Anthropic, с переключением между Thinking и Non-Thinking режимами. Старые deepseek-chat и deepseek-reasoner отключат 24 июля 2026, так что у команд есть три месяца на миграцию. И конечно, DeepSeek не забыли ткнуть Anthropic в бок: в треде прямо написано, что V4 «бесшовно интегрируется с Claude Code, OpenClaw и OpenCode». То есть пока у Anthropic вчера был пост-мортем про сломанный харнесс, DeepSeek сегодня предлагает подменить им модель и сэкономить. Закрытые лаборатории будут делать вид, что ничего не случилось, но стоимость миллиона токенов контекста только что стала публичной ценой, и от неё уже не отмотаешь. 📄 Tech Report: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf 🤗 Open Weights: https://huggingface.co/collections/deepseek-ai/deepseek-v4 @ai_machinelearning_big_data #DeepSeek

Anthropic признали, что Claude Code действительно тупил, и раздали всем компенсацию Целый месяц разработчики жаловались: Clau
Anthropic признали, что Claude Code действительно тупил, и раздали всем компенсацию Целый месяц разработчики жаловались: Claude Code стал хуже писать код, тормозит, ломает то, что раньше делал с закрытыми глазами. Anthropic сначала отмалчивались, как это обычно и бывает у больших лабораторий. Но вчера вечером команда ClaudeDevs выкатила пост-мортем и признала: да, проблема была, мы её нашли, мы её починили. Интересно, что дело оказалось не в самой модели. По словам Anthropic, регрессии в Claude не было, API тоже работал штатно. Сломались три вещи внутри обвязки Claude Code и Agent SDK, на котором ещё сидит Cowork, поэтому ему тоже прилетело. Конкретные баги спрятаны в пост-мортеме на сайте Anthropic, но суть в том, что пользователи месяц страдали из-за харнесса, а не из-за мозгов модели. Фикс раскатали в версии 2.1.116 и выше, лимиты использования обнулили всем подписчикам, то есть по сути подарили ещё один цикл квоты. Плюс пообещали изменить внутренние процессы: больше догфудинга с теми же конфигами, что у реальных юзеров, и расширенный набор эвалов, которые будут гонять против каждого изменения системного промпта отдельно. А вот под постом народ не в восторге. Самый показательный комментарий собрал тихую волну лайков: «Могли бы просто сказать, что вас поймали на троттлинге». Кто-то жалуется, что лимиты и так должны были сброситься сегодня, так что никакой это не жест доброй воли. Другие напоминают, что проблема видна не только в Claude Code, но и через сторонние обвязки к API, значит, три бага это явно не всё. Есть и те, кто благодарит за честность: мол, другие команды в такой ситуации уходят в тишину или валят всё на «оптимизацию», а тут хотя бы признали вину и починили. Отдельно упомянули параллель с OpenAI: осенью 2023 года пользователи GPT-4 месяцами кричали про деградацию, а OpenAI отвечали сухим «мы модель не тупили» и никакого пост-мортема так и не выпустили. На этом фоне Anthropic выглядят прилично, хотя осадочек у коммьюнити всё равно остался, и многие уже поглядывают в сторону выходящего сегодня Codex. Вывод простой: если вы последний месяц материли Claude Code и думали, что сходите с ума, вы не сходили. Обновляйтесь до 2.1.116 и забирайте сброшенные лимиты, пока дают. https://x.com/ClaudeDevs/status/2047371123185287223

Repost from Machinelearning
+2
🚀 OpenAI представила GPT-5.5 Она заметно сильнее в самом главном: код, ресёрч, аналитика и работа с документами. GPT 5.5 хороша в многоступенчатых задачах. И почти во всём обходит конкурентов - например, на Terminal-Bench выбивает 82,7% против 69% у свежей Claude. GPT-5.5 уже доступна пользователям Plus, Pro, Business и Enterprise - в ChatGPT и Codex. Модель стала дороже: ~$5 / $30 за млн токенов. Уже раскатывают на всех платных подписчиков. Тестим! 🔥 https://openai.com/index/introducing-gpt-5-5/

🚀 50+ команд Claude Code, которые реально ускоряют разработку Если ты используешь Claude Code как обычный чат - ты теряешь 8
🚀 50+ команд Claude Code, которые реально ускоряют разработку Если ты используешь Claude Code как обычный чат - ты теряешь 80% его мощности. Это не просто AI. Это полноценная система разработки внутри терминала. Вот как его правильно использовать: База, без которой никуда: - /init - создаёт CLAUDE.md и память проекта - /memory - открывает контекст проекта - /add-dir - подключает новые директории - /compact - чистит контекст и экономит токены Работа с кодом: - /diff - показывает изменения - /review - ревью кода - /simplify - 3 агента анализируют код - /debug - системный дебаг Контроль процесса: - /plan - сначала думает, потом пишет код - /permissions - контроль действий - --dangerously-skip-permissions - полный автопилот Продвинутые фичи: - /agents - параллельные агенты - /loop - повтор задач - /bash - выполнение команд - /remote-control - управление через браузер Модели и режимы: - /model - переключение моделей - /effort - глубина мышления - /fast - быстрый режим Что важно знать: - Claude Code = не чат, а инженер внутри проекта - память (CLAUDE.md) решает больше, чем промпты - агенты дают x2-x5 ускорение на сложных задачах

Mythos, закрытая модель Anthropic, заточенная под поиск уязвимостей, утекла за пределы круга избранных. По данным Bloomberg,
Mythos, закрытая модель Anthropic, заточенная под поиск уязвимостей, утекла за пределы круга избранных. По данным Bloomberg, неизвестная группа получила к ней регулярный доступ через стороннего подрядчика и даже прислала журналистам скриншоты и живую демонстрацию работы. Самое ироничное, что Mythos создавалась в рамках Project Glasswing, идея которого как раз в ограниченной дистрибуции: пусть модель видят только проверенные команды, и тогда её мощь не обернётся против индустрии. План красивый, реальность жёстче. Ядро Anthropic никто не ломал. Ломать не пришлось. Хватило одного партнёра с дырявым контролем доступа. И вот здесь начинается настоящий сюжет. Модель, которая ищет уязвимости быстрее людей, сама оказалась уязвима через самое слабое звено периметра. Подрядчик, чужой ноутбук, забытый токен, предсказуемое имя сервиса, и всё, твой закрытый оружейный ИИ гуляет в чужих руках. Вывод неприятный, но его придётся принять всем, кто работает с фронтирными моделями. Секретность ИИ заканчивается там, где начинается цепочка поставок. Можно сколько угодно прятать веса, фильтровать доступ и подписывать NDA, но если у вендора слабый пароль, вся архитектура доверия рушится за одну ночь. Mythos не первый такой случай и точно не последний. Вопрос уже не в том, утекают ли мощные модели. Вопрос в том, кто и когда поймает следующую. techcrunch.com/2026/04/21/unauthorized-group-has-gained-access-to-anthropics-exclusive-cyber-tool-mythos-report-claims/