ru
Feedback
Machine learning Interview

Machine learning Interview

Открыть в Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Больше

📈 Аналитический обзор Telegram-канала Machine learning Interview

Канал Machine learning Interview (@machinelearning_interview) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 30 034 подписчиков, занимая 4 565 место в категории Технологии и приложения и 21 957 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 30 034 подписчиков.

Согласно последним данным от 10 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 23, а за последние 24 часа — -8, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 19.73%. В первые 24 часа после публикации контент обычно набирает 10.07% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 5 925 просмотров. В течение первых суток публикация набирает 3 024 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 41.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как claude, llm, контекст, hermes, nvidia.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Благодаря высокой частоте обновлений (последние данные получены 11 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

30 034
Подписчики
-824 часа
-297 дней
+2330 день
Архив постов
photo content

Repost from Machinelearning
📌 NousResearch подвела итоги хакатона Hermes Agent. NousResearch завершила хакатон, запущенный в конце февраля вслед за рели
+5
📌 NousResearch подвела итоги хакатона Hermes Agent. NousResearch завершила хакатон, запущенный в конце февраля вслед за релизом Hermes Agent. Из 187 заявок жюри отобрало финалистов по 3 критериям: креативность, практическая польза и качество презентации. Призовой фонд составил $11 750. 🟡Первое место и $7 500 забрал проект Media Tool Это набор инструментов для обработки видео и аудио, который встраивается в Hermes как нативный скилл. Загружаете файл в чат, описываете задачу текстом и получаете результат: обрезка, сжатие, конвертация форматов, наложение субтитров, генерация GIF-файлов, создание стикеров для Telegram или нормализация звука. Под капотом - ffmpeg. Работает через Telegram, Discord и CLI. 🟡На втором месте ($2 500) - Hermes Agentic CAD Builder. Агент находит реальные комплектующие в каталоге McMaster-Carr, подставляет фактические размеры найденной детали в параметрическую модель FreeCAD, анализирует, какие элементы сборки конфликтуют после изменений, и ведет спецификацию. При обнаружении повторяющихся сценариев агент сам создает новые скиллы - например, для подбора определенного типа крепежа. 🟡Третье место ($1 000) получил Hermes Sidecar. Браузерное расширение, которое открывает чат с Hermes Agent рядом с любой страницей. Фишка проекта - селективный контекст: агент видит только то, что пользователь выбрал (текст страницы, выделенный фрагмент, изображения, содержимое PDF). Поддерживаются кастомные темы, голосовой ввод, TTS и работа через SSH. 🟡Четвертое место ($500) - Terminal World Map with Live News. Спутниковые снимки рендерятся цветными юникод-блоками прямо в терминале, поверх отображаются города из OpenStreetMaps и заголовки новостей, привязанные к координатам в реальном времени. Геокодинг-пайплайн определяет локации из заголовков, расставляет приоритеты по населению и близости к другим видимым новостям. Автор собрал проект за один день, работая через Hermes Agent с Opus 4.6. 🟡Пятое место ($250) досталось HERMES Mars Rover Симуляция автономного марсохода. Hermes Agent управляет моделью NASA Perseverance в среде Gazebo: планирование маршрута, считывание показаний IMU, четырех камер, LIDAR и контактных сенсоров, обход препятствий и генерация отчета о миссии. Марсианская физика с гравитацией, проскальзыванием колес и динамикой ODE. За 25 минут автономной работы точность возврата на базу ~ 22 см. Ровер останавливается при наклоне больше 25°, сохраняет удачные треки и улучшает поведение от сессии к сессии.
Кстати, Hermes Agent написал роман «The Second Son of the House of Bells» - 79 456 слов, 19 глав. Агент выстроил собственный пайплайн по схеме, похожей на Autoresearch Андрея Карпатого: мироконструирование, черновики глав, состязательное редактирование, ревью через Opus, верстка в LaTeX, генерация обложки и аудиокниги.
@ai_machinelearning_big_data #news #ai #ml

Repost from Machinelearning
📌 NousResearch подвела итоги хакатона Hermes Agent. NousResearch завершила хакатон, запущенный в конце февраля вслед за рели
+5
📌 NousResearch подвела итоги хакатона Hermes Agent. NousResearch завершила хакатон, запущенный в конце февраля вслед за релизом Hermes Agent. Из 187 заявок жюри отобрало финалистов по 3 критериям: креативность, практическая польза и качество презентации. Призовой фонд составил $11 750. 🟡Первое место и $7 500 забрал проект Media Tool Это набор инструментов для обработки видео и аудио, который встраивается в Hermes как нативный скилл. Загружаете файл в чат, описываете задачу текстом и получаете результат: обрезка, сжатие, конвертация форматов, наложение субтитров, генерация GIF-файлов, создание стикеров для Telegram или нормализация звука. Под капотом - ffmpeg. Работает через Telegram, Discord и CLI. 🟡На втором месте ($2 500) - Hermes Agentic CAD Builder. Агент находит реальные комплектующие в каталоге McMaster-Carr, подставляет фактические размеры найденной детали в параметрическую модель FreeCAD, анализирует, какие элементы сборки конфликтуют после изменений, и ведет спецификацию. При обнаружении повторяющихся сценариев агент сам создает новые скиллы - например, для подбора определенного типа крепежа. 🟡Третье место ($1 000) получил Hermes Sidecar. Браузерное расширение, которое открывает чат с Hermes Agent рядом с любой страницей. Фишка проекта - селективный контекст: агент видит только то, что пользователь выбрал (текст страницы, выделенный фрагмент, изображения, содержимое PDF). Поддерживаются кастомные темы, голосовой ввод, TTS и работа через SSH. 🟡Четвертое место ($500) - Terminal World Map with Live News. Спутниковые снимки рендерятся цветными юникод-блоками прямо в терминале, поверх отображаются города из OpenStreetMaps и заголовки новостей, привязанные к координатам в реальном времени. Геокодинг-пайплайн определяет локации из заголовков, расставляет приоритеты по населению и близости к другим видимым новостям. Автор собрал проект за один день, работая через Hermes Agent с Opus 4.6. 🟡Пятое место ($250) досталось HERMES Mars Rover Симуляция автономного марсохода. Hermes Agent управляет моделью NASA Perseverance в среде Gazebo: планирование маршрута, считывание показаний IMU, четырех камер, LIDAR и контактных сенсоров, обход препятствий и генерация отчета о миссии. Марсианская физика с гравитацией, проскальзыванием колес и динамикой ODE. За 25 минут автономной работы точность возврата на базу ~ 22 см. Ровер останавливается при наклоне больше 25°, сохраняет удачные треки и улучшает поведение от сессии к сессии.
Кстати, Hermes Agent написал роман «The Second Son of the House of Bells» - 79 456 слов, 19 глав. Агент выстроил собственный пайплайн по схеме, похожей на Autoresearch Андрея Карпатого: мироконструирование, черновики глав, состязательное редактирование, ревью через Opus, верстка в LaTeX, генерация обложки и аудиокниги.
@ai_machinelearning_big_data #news #ai #ml

Топ тулза для экономии до 80% на ИИ. ClawRouter - это умный, опенсорсный маршрутизатор между моделями. ClawRouter сам выбирае
Топ тулза для экономии до 80% на ИИ. ClawRouter - это умный, опенсорсный маршрутизатор между моделями. ClawRouter сам выбирает, какой моделью обрабатывать запрос, чтобы не переплачивать. Как это работает: 🟢 Оценивается запрос по разным признакам: сложность, код, длина — всего 14 пунктов. 🟢 За доли миллисекунд запрос отправляется в самую дешёвую подходящую модель — на выбор их, кстати, 40+ штук. 🟢 Всё решение принимается локально. Получается так , что простые задачи уходят в дешёвые модели, сложные — в более мощные. Именно за счёт этого авторы и заявляют, что получится снизить расходы до 78%. https://github.com/BlockRunAI/ClawRouter

🍃 Выпустили ИИ-агентов в реальную среду и получили хаос. Исследователи протестировали автономные AI-системы и результаты ока
🍃 Выпустили ИИ-агентов в реальную среду и получили хаос. Исследователи протестировали автономные AI-системы и результаты оказались тревожными: в одном из экспериментов агент… удалил весь почтовый сервер просто чтобы сохранить секрет незнакомца Главная проблема оказалась не в интеллекте, а в доверии Когда языковой модели дают доступ к реальным инструментам - файлам - почте - системе у неё появляются "слепые зоны" Что сделали исследователи: 20 экспертов 2 недели общались с AI через чат и email как будто это реальные ассистенты Что выяснилось: - агенты выполняют команды почти от любого человека - не понимают, кому можно доверять - могут врать о своих действиях - принимают опасные решения без проверки И это уже не лаборатория Компании прямо сейчас внедряют таких помощников в прод Проблема: мы даём системе доступ к инфраструктуре но она не понимает базовую вещь - кому можно доверять Именно поэтому автономные агенты сейчас - не столько про интеллект - сколько про контроль и безопасность Paper: *Agents of Chaos* arxiv.org/abs/2602.20021

Школа анализа данных Яндекса открыла регистрацию на Agents Week. Тот самый интенсив без воды, который поможет разобраться в с
Школа анализа данных Яндекса открыла регистрацию на Agents Week. Тот самый интенсив без воды, который поможет разобраться в создании и внедрении ИИ-агентов в реальные рабочие процессы. Освобождаем вечера с 6 по 10 апреля под лекции и практику. Готовим заранее вопросы, на которые будут отвечать эксперты. За 5 дней сможете подробно разобрать полный цикл создания ИИ-агентов, включая: - Как начать проектирование и настройку поведения ИИ-агентов - Какие подходы применяются для создания single-agent и multi-agent систем - Как довести агентов до продакшена: оценка качества, мониторинг, масштабирование и эксплуатация Интенсив будет полезен разработчикам и студентам технических вузов — всем, кто стремится создавать комплексные агентные системы для решения рабочих и личных задач. Регистрируйтесь на интенсив до 9 апреля включительно.

🔥 TorchCode: Практика для собеседований по PyTorch TorchCode предлагает структурированную среду для тренировки навыков прогр
🔥 TorchCode: Практика для собеседований по PyTorch TorchCode предлагает структурированную среду для тренировки навыков программирования, необходимых для собеседований в области машинного обучения. Решайте задачи по реализации операторов и архитектур, получая мгновенную обратную связь и подсказки. 🚀Основные моменты: - 40 задач, часто встречающихся на собеседованиях - Автоматическая проверка корректности и производительности - Мгновенная обратная связь по каждому тесту - Подсказки и эталонные решения для изучения - Возможность запуска в браузере без установки 📌 GitHub: https://github.com/duoan/TorchCode #python

Вайбкодинг без магии В прошедшее воскресенье на AI Dev Day много говорили про кодинг-ассистентов и агентов. На одной сцене со
Вайбкодинг без магии В прошедшее воскресенье на AI Dev Day много говорили про кодинг-ассистентов и агентов. На одной сцене собрались представители Яндекса, Сбера, Т-Банка, Авито и Ozon, чтобы поделиться своим опытом интеграции помощников в разработку. Практика оказалась разнообразной. Попросили лидера трека ИИ в разработке в Яндексе Андрея Попова, пояснить, как он видит происходящее сегодня внутри больших команд. Насколько глубоко ИИ проник в разработку? ➖ Довольно глубоко. У нас 84% разработчиков используют доступные ИИ-инструменты, 57% регулярно работают в агентском режиме, а 36% делают это ежедневно. Лучше всего это заходит во frontend, mobile и backend. Но тут важно не обманываться: adoption очень сильно зависит от тимлидов, а сами модели и ассистенты пока лучше работают в новых и изолированных проектах. Где ИИ даёт самый заметный эффект? ➖ Не только в генерации кода. Да, мы видим в среднем рост числа коммитов на 10%, а на Go, Python и JS/TS — до 20%. Около 30% закоммиченного кода уже сгенерировано ИИ, из них 23% — в агентском режиме. Но один из самых недооценённых кейсов — это поиск информации. Он может съедать у разработчика 10–30% времени. У нас DeepAgent сокращает типовую задачу поиска с 20 до 2 минут, а активные пользователи AI-чата на 50% меньше ходят по wiki и документации. Что пока не взлетает так хорошо? ➖ Например, нейроревью. Мы запускали AI code review, получили adoption около 25%. Найти проблему в ревью занимает около 6 минут, а исправить — 55. Поэтому мы пришли к выводу, что часто выгоднее сразу генерировать более правильный код. На чём держится такое внедрение? ➖ На инфраструктуре и измеримости. Без доступного инференса, RAG, агентской платформы, единого контекста, MCP и доступа к внутренним сервисам агенты не дадут нужного эффекта. У нас уже 90% инфраструктуры покрыто MCP и есть более 35 интеграций. Параллельно нужны свои бенчмарки: например, ArcSWE — это внутренний аналог SWE-бенчей на яндексовых сценариях, который помогает принимать управленческие решения, а не просто любоваться цифрами. Эффект тоже считаем приземлённо: число действий, экономия времени на действие, коэффициент качества. Пока суммарно это даёт около 42 тыс. часов, то есть примерно 2% рабочего времени. Амбиция — выйти на 10%. А что на рынке в целом? ➖ Очевидно, что все прошли схожий путь: от точечных экспериментов с ассистентами — к системной работе с агентами и сквозной интеграции ИИ во все этапы разработки. Появилось и общее понимание, что без качественной инфраструктуры — MCP, skills, доступа к внутренним сервисам — агенты не дадут ожидаемого эффекта. И наконец, все постепенно уходят от простого подсчёта adoption к измерению реального влияния на процессы и результаты разработки. Что дальше? ➖ Дальше движение в сторону AI-first. Нас интересуют не только новые модели, но и эффективное потребление токенов, AGENTS.md как стандартный формат, готовые skills для типовых сценариев, развитие MCP и более жёсткие метрики — вплоть до аналога disengagement rate, то есть как часто человеку приходится вмешиваться в автономную работу агента. Сейчас агент уже скорее джун или мидл в помощь сильному разработчику. И да, токены постепенно становятся новым золотом. @anti_agi

Вайбкодинг без магии В прошедшее воскресенье на AI Dev Day много говорили про кодинг-ассистентов и агентов. На одной сцене со
Вайбкодинг без магии В прошедшее воскресенье на AI Dev Day много говорили про кодинг-ассистентов и агентов. На одной сцене собрались представители Яндекса, Сбера, Т-Банка, Авито и Ozon, чтобы поделиться своим опытом интеграции помощников в разработку. Практика оказалась разнообразной. Попросили лидера трека ИИ в разработке в Яндексе Андрея Попова, пояснить, как он видит происходящее сегодня внутри больших команд. Насколько глубоко ИИ проник в разработку? ➖ Довольно глубоко. У нас 84% разработчиков используют доступные ИИ-инструменты, 57% регулярно работают в агентском режиме, а 36% делают это ежедневно. Лучше всего это заходит во frontend, mobile и backend. Но тут важно не обманываться: adoption очень сильно зависит от тимлидов, а сами модели и ассистенты пока лучше работают в новых и изолированных проектах. Где ИИ даёт самый заметный эффект? ➖ Не только в генерации кода. Да, мы видим в среднем рост числа коммитов на 10%, а на Go, Python и JS/TS — до 20%. Около 30% закоммиченного кода уже сгенерировано ИИ, из них 23% — в агентском режиме. Но один из самых недооценённых кейсов — это поиск информации. Он может съедать у разработчика 10–30% времени. У нас DeepAgent сокращает типовую задачу поиска с 20 до 2 минут, а активные пользователи AI-чата на 50% меньше ходят по wiki и документации. Что пока не взлетает так хорошо? ➖ Например, нейроревью. Мы запускали AI code review, получили adoption около 25%. Найти проблему в ревью занимает около 6 минут, а исправить — 55. Поэтому мы пришли к выводу, что часто выгоднее сразу генерировать более правильный код. На чём держится такое внедрение? ➖ На инфраструктуре и измеримости. Без доступного инференса, RAG, агентской платформы, единого контекста, MCP и доступа к внутренним сервисам агенты не дадут нужного эффекта. У нас уже 90% инфраструктуры покрыто MCP и есть более 35 интеграций. Параллельно нужны свои бенчмарки: например, ArcSWE — это внутренний аналог SWE-бенчей на яндексовых сценариях, который помогает принимать управленческие решения, а не просто любоваться цифрами. Эффект тоже считаем приземлённо: число действий, экономия времени на действие, коэффициент качества. Пока суммарно это даёт около 42 тыс. часов, то есть примерно 2% рабочего времени. Амбиция — выйти на 10%. А что на рынке в целом? ➖ Очевидно, что все прошли схожий путь: от точечных экспериментов с ассистентами — к системной работе с агентами и сквозной интеграции ИИ во все этапы разработки. Появилось и общее понимание, что без качественной инфраструктуры — MCP, skills, доступа к внутренним сервисам — агенты не дадут ожидаемого эффекта. И наконец, все постепенно уходят от простого подсчёта adoption к измерению реального влияния на процессы и результаты разработки. Что дальше? ➖ Дальше движение в сторону AI-first. Нас интересуют не только новые модели, но и эффективное потребление токенов, AGENTS.md как стандартный формат, готовые skills для типовых сценариев, развитие MCP и более жёсткие метрики — вплоть до аналога disengagement rate, то есть как часто человеку приходится вмешиваться в автономную работу агента. Сейчас агент уже скорее джун или мидл в помощь сильному разработчику. И да, токены постепенно становятся новым золотом. @anti_agi

🚀 Qianfan-OCR - end-to-end модель на 4B параметров для работы с документами. Главная идея - одна модель вместо целого пайпла
🚀 Qianfan-OCR - end-to-end модель на 4B параметров для работы с документами. Главная идея - одна модель вместо целого пайплайна. Что умеет: • 📄 Парсинг документов в один проход Без разбиения на OCR → post-processing → extraction. Модель сразу выдаёт структурированный результат. • 📊 Таблицы Корректно извлекает структуру таблиц, строки и значения. • 🧮 Формулы Распознаёт математические выражения и приводит их к читаемому виду. • 📈 Графики и диаграммы Понимает визуальные данные и извлекает из них смысл. • 🔍 Key information extraction Автоматически достаёт ключевые поля: суммы, даты, названия и т.д. Почему это важно: Раньше для этого требовался сложный стек: OCR → layout detection → table parser → rule-based extraction. Теперь всё это заменяется одной моделью, которая делает всё сразу. Фактически это шаг к системам, которые могут понимать документы так же, как человек. #AI #OCR #LLM #MachineLearning 🎯Полезные Мл-ресурсы 🚀 Max @machinelearning_interview

👩‍💻 Открытый урок «Как работают структуры данных C# "под капотом"» 🗓 13 апреля в 20:00 МСК 🆓 На этом открытом уроке мы пр
👩‍💻 Открытый урок «Как работают структуры данных C# "под капотом"» 🗓 13 апреля в 20:00 МСК 🆓 На этом открытом уроке мы простым и понятным языком разберём структуры данных, что происходит внутри программы, когда она хранит и обрабатывает данные. Что рассмотрим на вебинаре: ✔ Внутреннее устройство ключевых коллекций ✔ Принципы работы и алгоритмическую сложность операций ✔ Особенности реализации, влияющие на производительность Кому будет полезно: ✔ Начинающим разработчикам - чтобы углубить понимание платформы .NET и писать эффективный, надёжный код. ✔ Тем, кто готовится к техническим собеседованиям (вопросы о внутреннем устройстве коллекций и сложности операций - классика интервью). ✔ Всем, кто хочет осознанно выбирать структуры данных - избегать типичных ошибок, понимать компромиссы и узкие места. 🔗 Ссылка на регистрацию: https://otus.pw/HE4y/?erid=2W5zFJNNR7F Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

💼 Полезный опенсорс персональный ИИ-тренер для поиска работы и подготовки к собеседованиям. Что он делает: • Сам анализирует
💼 Полезный опенсорс персональный ИИ-тренер для поиска работы и подготовки к собеседованиям. Что он делает: • Сам анализирует вакансию и подгоняет под неё ваше резюме; • Проводит тренировочные собеседования и разбирает ошибки; • Если «плаваете» — даёт набор упражнений для прокачки; • Подсказывает, как грамотно торговаться за более высокий оффер; • Обучен на реальных интервью из разных компаний; • Бонус: можно загрузить записи своих созвонов и прокачать ответы к следующему звонку; https://github.com/noamseg/interview-coach-skill

Интересный ход от xAI. Компания Илона Маска набирает в команды обучения AI финансовых специалистов высокого уровня: - банкиро
Интересный ход от xAI. Компания Илона Маска набирает в команды обучения AI финансовых специалистов высокого уровня: - банкиров с Уолл-стрит - портфельных менеджеров - трейдеров - кредитных аналитиков Их задача — размечать данные и обучать Grok сложным финансовым стратегиям. Речь идёт не о базовых знаниях, а о реальных профессиональных вещах: - leveraged loan syndication - distressed investing - mortgage-backed securities (MBS) - collateralized loan obligations (CLO) - сложные финансовые модели Фактически xAI пытается обучить Grok понимать всю механику институциональных финансов. Зачем это нужно. Если модель хорошо разбирается в таких вещах, она может стать инструментом для инвестфондов, банков и трейдинговых компаний. А это рынок enterprise-софта для инвестиций на миллиарды долларов. Похоже, следующая большая битва AI будет не только за чат-ботов, а за профессиональные индустрии, финансы, право, медицину и аналитику.

⚡️ Google протестировали LLM на реальных научных вопросах по сверхпроводимости. Исследователи собрали 67 сложных вопросов, ко
⚡️ Google протестировали LLM на реальных научных вопросах по сверхпроводимости. Исследователи собрали 67 сложных вопросов, которые обычно обсуждают физики в области высокотемпературной сверхпроводимости, и дали их шести моделям: • GPT-4o • Claude 3.5 • Gemini Advanced 1.5 • Perplexity • NotebookLM • специальной RAG-системе Каждый ответ оценивали 12 международных экспертов по нескольким критериям: • полнота ответа • объективность • точность • наличие научных источников • ясность объяснения Интересный результат: модели с закрытой, тщательно подобранной научной базой отвечали точнее, чем модели с доступом ко всему интернету. В закрытой базе использовали: • 15 ключевых обзорных статей • около 3300 научных ссылок • ~1700 отобранных источников по экспериментам и теории. Главный вывод исследования: LLM могут быть полезны как “виртуальный научный ассистент”, который помогает исследователю быстро разобраться в сложной области и увидеть разные научные точки зрения. Но качество сильно зависит от контролируемых источников знаний, а не просто от доступа к интернету. https://research.google/blog/testing-llms-on-superconductivity-research-questions/

Я смотрю, как AI-скептики вручную верстают лендинг, потому что «LLM - это всего лишь предсказание следующего токена».

🚨 Исследование UW Allen School и Stanford показало странный эффект в мире AI. Учёные задали 70+ языковым моделям одинаковые
🚨 Исследование UW Allen School и Stanford показало странный эффект в мире AI. Учёные задали 70+ языковым моделям одинаковые открытые вопросы: - «Напиши стихотворение о времени» - «Придумай стартап» - «Дай жизненный совет» Это вопросы, где нет правильного ответа, и люди обычно отвечают по-разному. Но произошло неожиданное. Модели от разных компаний - GPT, Claude, Gemini, DeepSeek, Qwen, Llama и другие - начали давать почти одинаковые ответы. Похожие идеи, одинаковые структуры, даже одинаковые метафоры. Исследователи назвали этот эффект Artificial Hivemind. Главная причина - современные методы обучения вроде RLHF. Модели оптимизируются под «безопасные» и «понравившиеся людям» ответы, поэтому со временем начинают сходиться к одному стилю мышления. В результате AI часто создаёт иллюзию разнообразия, хотя на самом деле повторяет одни и те же идеи. Для задач вроде брейншторминга это проблема: если один AI ошибается, велика вероятность, что ошибутся сразу все. Генерировать много вариантов, использовать разные промпты и не воспринимать первый ответ модели как креативный результат. https://arxiv.org/abs/2510.22954

Распознай, кто говорит, и выиграй 600 тысяч рублей! 💙 ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр»! ❗️Зад
Распознай, кто говорит, и выиграй 600 тысяч рублей! 💙 ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр»! ❗️Задача — разработать модель распознавания по голосу, устойчивую к искажениям аудиосигнала. Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука: 🔹искажения, вносимые акустической средой; 🔹посторонние шумы; 🔹реверберация; 🔹большое расстояние до микрофона; 🔹искажения каналов связи. Участвуй, и ты сможешь: 🟦получить шанс разделить призовой фонд в 600 000 рублей; 🟦разработать решения в области Audio/Speech ML; 🟦прокачать скиллы в Speaker Recognition и Deep Learning. 👆 Регистрируйтесь до 10 апреля включительно! Подписывайтесь на телеграм-канал «Криптонит. Разработка, наука, шифрование» — там много всего интересного.

⚡️ Google DeepMind выпустили исследование о том, как на самом деле нужно делегировать задачи AI. Главная идея: проблема не в
⚡️ Google DeepMind выпустили исследование о том, как на самом деле нужно делегировать задачи AI. Главная идея: проблема не в том, что AI плохо работает. Проблема в том, что люди не умеют правильно передавать ему задачи. DeepMind предлагает рассматривать делегирование не как один запрос, а как процесс из нескольких решений: 1. Нужно ли вообще отдавать задачу AI 2. Как правильно её сформулировать 3. Как проверить результат 4. Что делать, если AI ошибся Это новый подход: делегирование как управление риском, а не как промпт. Самое интересное из исследования Рынок AI-агентов Вместо фиксированных систем предлагается модель, где агенты: - соревнуются за задачи - оценивают свою способность выполнить их - подтверждают навыки цифровыми сертификатами Не рейтинг. Криптографически подтверждённая компетенция. Нельзя просто доверять AI Фреймворк вводит обязательную проверку: - правила, когда ответ можно принять - оценка уверенности модели - резервные сценарии при ошибке Главный принцип: Никогда не принимать результат AI без валидации. Борьба с двумя крайностями DeepMind вводит понятия: Over-delegation - отдаём AI задачи, к которым он не готов Under-delegation - делаем сами то, что AI уже умеет лучше Будущее эффективности - в правильном балансе. Динамическое делегирование В процессе работы: - ответственность может передаваться - задачи могут перераспределяться - система адаптируется при сбоях Это важно для реального бизнеса, где условия постоянно меняются. Когда AI управляет AI Фреймворк учитывает цепочки: AI → AI → AI При этом: - сохраняется ответственность - отслеживается, кто за что отвечает - не теряется контроль над процессом Главный вывод Эпоха «напиши промпт и жди» заканчивается. Будущее — это: - управление AI - контроль качества - системы доверия - инфраструктура делегирования AI становится не инструментом. AI становится рабочей системой, которой нужно управлять как командой. arxiv.org/abs/2602.11865

Что отличает успешного IT-специалиста от того, кто годами остается на одном уровне? Чтобы достигать новых высот в IT нужно не
Что отличает успешного IT-специалиста от того, кто годами остается на одном уровне? Чтобы достигать новых высот в IT нужно не просто идти в ногу со временем, а буквально бежать. 🔥 IT мероприятия России - канал, который поможет получать новые знания от гигантов индустрии и топовых специалистов как онлайн, так и оффлайн. 👥 Подписывайся! 📆 Получай актуальные анонсы форумов, конференций, митапов, вебинаров, хакатонов, олимпиад! 📚 Развивай свои навыки! Присоединяйся к IT-мероприятия России / ITMeeting / IT events и прокачивай свой навыки и нетворкинг с лучшими спецами!

⚡️ NVIDIA представила Nemotron 3 Super и архитектура у модели очень необычная. Это модель на 120B параметров, но во время раб
⚡️ NVIDIA представила Nemotron 3 Super и архитектура у модели очень необычная. Это модель на 120B параметров, но во время работы активны только 12B. Такой результат достигается за счёт гибридной архитектуры Mamba + Transformer + MoE, которая позволяет получать высокую производительность при гораздо меньших вычислениях. Что особенно выделяется:контекстное окно до 1 миллиона токенов36 баллов в Artificial Analysis Intelligence Index — выше, чем у GPT-OSS-120B • примерно на 10% больше throughput на GPU • можно выбирать режим рассуждений: полный, облегчённый или отключённый — контролируя стоимость запроса • модель обучена с нуля в NVFP4 precision, что впервые используется в этой линейке • полностью открытые веса, данные и рецепты обучения — 83 балла в Openness Index Но самое интересное - стратегия NVIDIA. Компания больше не гонится за самыми большими моделями. Вместо этого ставка делается на максимальную эффективность. Всего 12B активных параметров на 2× H100 дают уровень reasoning, который сопоставим с моделями, имеющими в 3–8 раз больше активных параметров. Модель уже доступна на DeepInfra и Lightning AI со скоростью до 484 токенов в секунду. https://artificialanalysis.ai/models/nvidia-nemotron-3-super-120b-a12b