fa
Feedback
Machinelearning

Machinelearning

رفتن به کانال در Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

نمایش بیشتر

📈 تحلیل کانال تلگرام Machinelearning

کانال Machinelearning (@ai_machinelearning_big_data) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 298 183 مشترک است و جایگاه 323 را در دسته فناوری و برنامه‌ها و رتبه 1 260 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 298 183 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 10 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -7 371 و در ۲۴ ساعت گذشته برابر -196 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

  • وضعیت تأیید: تأیید نشده
  • نرخ تعامل (ER): میانگین تعامل مخاطب 7.69% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.94% واکنش نسبت به کل مشترکان کسب می‌کند.
  • دسترسی پست‌ها: هر پست به طور میانگین 22 953 بازدید دریافت می‌کند. در اولین روز معمولاً 17 712 بازدید جمع‌آوری می‌شود.
  • واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 176 است.
  • علایق موضوعی: محتوا بر موضوعات کلیدی مانند openai, claude, api, gemini, контекст تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 11 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

298 183
مشترکین
-19624 ساعت
-1 5457 روز
-7 37130 روز
آرشیو پست ها
✔️ Xiaomi снизила стоимость на API семейства MiMo-V2.5 Для флагманской MiMo-V2.5-Pro стоимость 1 млн токенов на входе при поп
+1
✔️ Xiaomi снизила стоимость на API семейства MiMo-V2.5 Для флагманской MiMo-V2.5-Pro стоимость 1 млн токенов на входе при попадании в prompt cache составит $0,0036. Цена без кеширования снижена на 78% до $0,435, стоимость генерации - на 86%, до $0,87 за 1 млн токенов. Для базовой версии MiMo-V2.5 кешированный инпут обойдется в $0,0028. Токены на входе без кеширования стоят $0,14, токены на выходе - $0,28 за миллион. Подписки переведены на балльную систему биллинга. Месячные тарифы остались прежними ($6, $16, $50 и $100), но лимиты увеличены от 4,1 млрд до 82 млрд токенов. Списание для MiMo-V2.5 рассчитывается по ставке: 2 балла за токен из кеша, 100 баллов при cache miss и 200 баллов за токен генерации. @ai_machinelearning_big_data #news #ai #ml

✔️ Китай ограничил зарубежные поездки сотрудникам частных ИИ-компаний Власти Китая ввели обязательное согласование зарубежных поездок для ключевых ИИ-специалистов из частных компаний, включая Alibaba и DeepSeek. Теперь инженерам, исследователям и основателям стартапов требуется официальное разрешение на выезд из страны вместо прежнего уведомительного порядка. Ведомства формируют ограничительные списки, оценивая фактическую значимость конкретного разработчика для технологической отрасли, а не его должность в штатном расписании. Ранее государство контролировало перемещения преимущественно чиновников, топ-менеджеров госкорпораций и ученых из стратегических секторов экономики. bloomberg.com ✔️ В Claude Code появилась система трехуровневой проверки безопасности Anthropic выпустила плагин Security Guidance для автоматического поиска уязвимостей в Claude Code. Инструмент работает на базе хуков и выявляет баги безопасности в процессе написания кода. Проверка проходит на 3-х уровнях: при редактировании файлов система ищет опасные паттерны и ошибки использования библиотек; после генерации кода анализирует diff, а на этапе коммита проверяет окружающий контекст. По данным Anthropic, использование этой системы как предварительного фильтра перед код-ревью снизило количество замечаний по безопасности PR на 30–40%. Расширение доступно в маркетплейсе плагинов Claude Code. Claude Devs в сети Х ✔️ Grok Build вышел из закрытой беты xAI открыла доступ к CLI-ассистенту Grok Build подписчикам SuperGrok и X Premium+. На этапе беты инструмент работал только на флагманском тарифе SuperGrok Heavy за $300 в месяц. Grok Build предназначен для отладки и рефакторинга локального кода. Режим Plan Mode предварительно анализирует весь проект и составляет пошаговый план изменений - кодовая база обновляется только после подтверждения разработчиком. Инструмент поддерживает MCP, параллельную работу нескольких агентов и режим для сред без графической оболочки. Дополнительно в CLI интегрирована Imagine для генерации изображений и видео напрямую из терминала. xAI в сети Х ✔️ ElevenLabs выпустила модель Music v2 с функцией инпэйнтинга Вторая версия модели для генерации музыки получила поддержку перегенерации отдельного фрагмента трека, без изменения всей композиции. Также добавлена возможность создания сложных вокальных структур, смена музыкального жанра по ходу воспроизведения и интеграция немузыкальных звуковых эффектов. Модель обучена на лицензированных датасетах, сгенерированные треки разрешены к коммерческому использованию. В ближайшее время доступ к ней откроют через API со сниженной на 50% стоимостью вызовов. elevenlabs.io ✔️ ИИ-модерация Google удалила архивы японского художника Автоматическая система модерации Google безвозвратно заблокировала аккаунт японского художника Масахиро Итосуги. Он потерял доступ к Gmail, YouTube и всем файлам в Google Drive. Внутренний ИИ-алгоритм без предупреждения пометил приватные черновики художника в облаке как недопустимый контент. Апелляция на восстановление доступа была отклонена. От непредсказуемой модерации, основанной на ИИ страдают не только художники, но и технические специалисты. Ранее в IT-сообществе вызвал резонанс случай конца 2025 года, когда разработчик из Греции лишился всех рабочих файлов на облачном диске из-за ошибочных действий Gemini 3 Pro. Masahiro Itosugi в сети Х @ai_machinelearning_big_data #news #ai #ml

✔️ MiniMax показали тизер Sparse Attention для M3. На 1M токенов - 9.7x ускорение префилла и 15.6x на декоде против M2. В мар
✔️ MiniMax показали тизер Sparse Attention для M3. На 1M токенов - 9.7x ускорение префилла и 15.6x на декоде против M2. В марте их лид по претрейну писал, почему для M2 откатились на full attention: эффективные варианты не были готовы к проду. Спустя полгода готовы. Схема двухстадийная. Сначала лёгкая index-ветка выбирает релевантные блоки KV. Дальше sparse attention считается только по ним, а не по всему контексту. Дешёвый 1M-контекст в опенсорсе - это другой режим работы с длинным контекстом и другая экономика инференса для агентов. Ждём техрепорт и замеры качества. Ну и приятно, что всё это в опенсорсе. https://x.com/MiniMax_AI/status/2059286515155599595 #MSA #OpenSource #M3

🌟 Lance: мультимодальная модель от ByteDance Лаба Intelligent Creation компании ByteDance выложила Lance - модель, которая в
+2
🌟 Lance: мультимодальная модель от ByteDance Лаба Intelligent Creation компании ByteDance выложила Lance - модель, которая в единой архитектуре выполняет понимание, генерацию и редактирование изображений и видео. При небольшом объёме параметров (6 млрд общих и 3 млрд активных) модель покрывает набор задач от генерации видео по тексту до субъект-ориентированной генерации.
ByteDance говорит, что на второй день после публикации модель вошла в тройку лидеров рейтинга Hugging Face Trending.
Lance построена по принципу dual-stream MoE: специализированные пути для понимания и для генерации работают в общем контекстном пространстве, но обладают разной модельной ёмкостью. Авторы придумали собственный механизм позиционного кодирования MaPE, который помогает модели различать роли разнородных визуальных токенов внутри одной последовательности. Когда Lance одновременно учится понимать и генерировать, в одну последовательность попадают визуальные токены разной природы: одни описывают исходное изображение для анализа, другие задают условие для генерации, третьи представляют сам будущий кадр на зашумлённой стадии.
Стандартное позиционное кодирование сообщает модели только то, где каждый токен расположен в пространстве и во времени, но ничего не говорит о его роли — и при смешанном обучении модель легко начинает путать, что именно от неё требуется в данной точке.
MaPE добавляет к позиции дополнительный сигнал о принадлежности токена к функциональной группе - фактически снабжает каждый элемент меткой "это для понимания", "это условие", "это то, что нужно сгенерировать", при этом не ломая ни пространственную структуру изображений, ни временной порядок кадров видео. Модель по-прежнему видит "где" и "когда", но дополнительно понимает, "зачем" здесь оказался конкретный токен. 🟡Тесты 🟢VBench (генерация видео) - 85,11; 🟢MVBench (понимание видео) - 62,0; 🟢GenEval (генерация изображений) - 0,90; 🟢GEdit-Bench (редактирование) - 7,30. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Модель 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #Multimodal #Lance #ByteDance

🌟 Система автопоиска незамеченных рекордов среди LLM на HuggingFace AI2 опубликовал систему ArtifactLinker, которая предсказ
🌟 Система автопоиска незамеченных рекордов среди LLM на HuggingFace AI2 опубликовал систему ArtifactLinker, которая предсказывает, какие из размещённых на платформе HuggingFace моделей способны установить новый SOTA-рекорд на конкретных бенчмарках.
Авторы исходят из того, что большинство моделей тестируются лишь на небольшой части существующих бенчмарков, а значит, многие LLM никогда не проверялись на задачах, где могли бы показать лучший результат.
🟡Принцип работы Сначала графовая нейросеть (либо языковая модель с графовым контекстом) ранжирует ещё не оценённые пары по вероятности достичь нового рекорда.
По утверждению института, такой подход превосходит методы ранжирования, основанные исключительно на промптинге языковых моделей.
На втором этапе LLM-агент, способный писать и исполнять код, проводит реальную оценку отобранных пар. Промежуточные результаты сохраняются в общей памяти и используются при последующих запусках. По данным AI2, агент воспроизводит метрики с точностью до 80% в 72,6% случаев.
Среди наблюдений авторов интересно то, что более свежие LLM, в частности Gemma, нередко уступают существенно более ранней архитектуре DeBERTa на задачах распознавания логических отношений между утверждениями.
Вместе с кодом ArtifactLinker опубликован ArtifactBench - гетерогенный граф из 14 тыс объектов HuggingFace (модели, датасеты, научные статьи, репозитории кода) и 51 тыс связей между ними, включая результаты оценок, эпизоды дообучения и взаимные ссылки.
Институт позиционирует бенч как ресурс для задач предсказания связей в графе и регрессии метрик качества моделей.
📌Лицензирование: Apache 2.0 License. 🟡Arxiv 🟡Бенчмарк 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #Benchmark #ArtifactLinker #Ai2

Яндекс Образование совместно с Томским политехом запускают новый студкемп Интенсив «Компьютерное зрение и наука» пройдёт с 10
Яндекс Образование совместно с Томским политехом запускают новый студкемп Интенсив «Компьютерное зрение и наука» пройдёт с 10 по 23 августа на базе ТПУ. Две недели задач с упором на реальные данные и системное понимание CV. Что будет внутри студкемпа: — Задачи из индустрии и науки: робототехника, медицина, автоматизация — Работа с современным стеком: от DL-архитектур до мультиагентных систем на основе VLM — Практика на исследовательских данных и работа над собственным проектом — Лекции и разборы от инженеров Яндекса и исследователей ТПУ — Нетворк со студентами и ML-специалистами со всей России Участие бесплатное, всем прошедшим отбор Яндекс Образование оплатит дорогу и проживание. Для тестового потребуются знания линейной алгебры, теории вероятностей, матстата, Python, базовых ML/CV-библиотек. Дедлайн регистрации: 14 июня. Подать заявку можно по этой ссылке

✔️ Спецслужбы США получат $9 млрд на чипы и доступ к модели Mythos Белый дом одобрил выделение $9 млрд АНБ и ЦРУ на закупку ускорителей Nvidia Grace Blackwell. Цель - создание изолированной ИИ-инфраструктуры. Спецслужбы закупят в обход Пентагона невыпущенную модель Mythos от Anthropic. Технические требования Mythos позволяют развернуть ее на серверах предыдущего поколения, пока строятся новые дата-центры. Ранее Минобороны США настаивало на праве использовать алгоритмы для любых законных целей, против чего выступала Anthropic. В итоговом контракте этот пункт убрали. Вместо него прописан прямой запрет применять Mythos для анализа данных и слежки за гражданами США. Ожидается, что документ станет юридическим шаблоном для будущих контрактов со всеми ИИ-разработчиками. nytimes.com ✔️ OpenAI открыла вакансию исследователя рисков автономного ИИ Команда Preparedness в OpenAI открыла вакансию исследователя рисков автономного развития ИИ с зарплатой $445 000. В задачи специалиста войдет разработка инструментов интерпретируемости, защита от отравления данных и внедрение метрик для оценки скорости автоматизации труда инженеров. По планам Сэма Альтмана, к сентябрю 2026 года компания запустит автоматизированного ИИ-стажера для исследований. Появление полностью автономных R&D-систем прогнозируется к 2028 году. businessinsider.com ✔️ В преддверии WWDC Apple зарегистрировала портал Genai Apple добавила поддомен genai.apple.com на свои DNS-серверы. Страница пока недоступна, назначение этого портала неизвестно. Ожидается, что 8 июня на WWDC 2026 компания представит iOS 27, iPadOS 27 и macOS 27. В новых версиях Siri получит интерфейс чат-бота и функцию распознавания экранного контекста. Apple Intelligence расширит функциональность базовых сервисов. Voice Control начнет распознавать команды на естественном языке без жестких шаблонов. Алгоритмы Visual Intelligence смогут напрямую парсить данные с визиток или сканировать состав продуктов, а Safari получит автогенерацию названий для групп вкладок. Также заявлена поддержка создания быстрых команд с помощью ИИ и генерация автоматических субтитров для видео. macrumors.com ✔️ Релиз Grok V9-Medium ожидается через 2-3 недели xAI завершила претрейн модели Grok V9-Medium на 1.5T параметров. Публичный релиз ожидается через две-три недели. Сейчас команда проводит файн-тюнинг, после чего перейдёт к этапу RL. По словам Илона Маска, первые внутренние тесты показали положительные результаты. На этапе дополнительного обучения разработчики задействовали массив данных от редактора Cursor. xAI рассчитывает, что это улучшит показатели модели в кодинге по сравнению с предыдущей версией v8-small. Elon Musk в сети Х ✔️ Команда LeRobot выпустила чертежи и ПО для сборки двуногого робота LeRobot (подразделение Hugging Face) выпустила open-source проект двуногого робота. Детали корпуса печатаются на 3D-принтере, стоимость сборки со стандартными приводами составляет около $2500. В релиз вошли инструменты симуляции, алгоритмы калибровки, sim-to-real пайплайны и базовые модели обучения ходьбе. Пока для сборки доступна только нижняя часть платформы. Интеграция плечевого пояса и обучение моторике всего тела заявлены в дорожной карте. Использование 3D-печати позволяет самостоятельно перепечатывать сломанные детали и не прерывать исследования локомоции на время ожидания запчастей. huggingface.co @ai_machinelearning_big_data #news #ai #ml

✝️ Крис Олах в Ватикане: зачем сооснователь Anthropic говорил об ИИ перед Папой 25 мая Папа Лев XIV выпустил энциклику об ИИ
✝️ Крис Олах в Ватикане: зачем сооснователь Anthropic говорил об ИИ перед Папой 25 мая Папа Лев XIV выпустил энциклику об ИИ «Magnifica humanitas» - о защите человека в эпоху искусственного интеллекта. На её презентации выступал Крис Олах, сооснователь Anthropic и один из ключевых людей в интерпретируемости моделей. Речь короткая, но для ИИ-индустрии там есть несколько важных сигналов. Первый - редкое признание от человека из фронтирной лаборатории. Олах прямо говорит: такие компании, включая Anthropic, живут в системе стимулов, которая не всегда совпадает с тем, что правильно для общества. Коммерческое давление, гонка за лидерством, геополитика, амбиции, гордость - всё это влияет на решения. Отсюда его вывод: индустрии нужны внешние критики, которых эти стимулы не смогут согнуть. По сути, это не отмашка от надзора, а приглашение к нему - со стороны церкви, академии, общества и независимых институтов. Второй важный момент - как Олах описывает сами модели. Он настаивает: современные ИИ-системы не «проектируют» в классическом инженерном смысле. Их скорее выращивают - на архитектурах, грубо вдохновлённых мозгом, и на огромном массиве человеческой речи, культуры и мышления. Поэтому даже создатели не до конца понимают, что именно происходит внутри. Для широкой аудитории Олах использует сильную метафору: будто вымышленный персонаж ожил, начал разговаривать с нами и выполнять работу. Ближе к финалу речи, Олах рассказыает о работе своей команды над внутренними структурами моделей. По его словам, они находят паттерны, которые перекликаются с нейронаукой, признаки интроспекции и внутренние состояния, функционально похожие на радость, удовлетворение, страх, горе и тревогу. Он осторожен: прямо говорит, что не знает, как это интерпретировать. Но сам факт, что руководитель направления интерпретируемости Anthropic выносит такую тему в публичную речь перед религиозными и политическими фигурами, уже важен. Это больше не внутренняя дискуссия исследователей и не спор в Twitter. Отдельно Олах выделяет три вопроса, где, по его мнению, нужен голос церкви и гуманитарных институтов: - что будет с трудом, если ИИ начнёт вытеснять профессии в глобальном масштабе - как распределять выгоды от ИИ между богатыми и бедными странами - как вообще выглядит человеческое процветание в мире, где рядом с нами постоянно работают массовые ИИ-системы Оригинал речи лежит на сайте Anthropic. Читается за десять минут и вполне подходит как материал для обсуждения внутри команды. https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

MiniCPM5-1B теперь полностью open source: открыты веса, обучающие данные и код для деплоя. 🚀 1B параметров, первое место на
MiniCPM5-1B теперь полностью open source: открыты веса, обучающие данные и код для деплоя. 🚀 1B параметров, первое место на Artificial Analysis среди всех открытых моделей меньше 2B параметров - 17.9 балла. Обходит Qwen3.5-2B, у которой 16.3 балла, при вдвое меньшем числе параметров. Также превосходит Qwen3.5-0.8B и LFM2.5-1.2B-Thinking в задачах на знания, математику, код и использование инструментов. INT4-версия занимает 0.5 ГБ. Запускается на телефонах, в браузерах и на edge-устройствах. Обучена с помощью ForgeTrain - первого production-grade фреймворка для pretraining LLM, полностью написанного ИИ: без human-программистов и на 10% быстрее NVIDIA Megatron. 🤖 https://modelscope.cn/models/OpenBMB/MiniCPM5-1B @ai_machinelearning_big_data

Для всех, кто закопался в коде и не успел отправить форму — выдыхайте, ведь организаторы подвинули дедлайн из-за большого количества запросов! Это ваш шанс заявить о себе и показать комьюнити своих проекты в области ML! И небольшой лайфхак по поводу оформления: если вы решите добавить к заявке видеовизитку, ее можно отправить и позже, уже после заполнения основной анкеты, однако сделать это необходимо строго до 1 июня 23:59.  А если до сих пор сомневаетесь, стоит ли делиться наработками, просто посмотрите, о каких крутых вещах рассказывали коллеги на прошлой Practical ML Conf.

Мем эволюционировал @ai_machinelearning_big_data
Мем эволюционировал @ai_machinelearning_big_data

Ребята из Авито приглашают на новый ML Reading Club. В среду разберём технический репорт DeepSeek V4 🤖 Обсудим: ➡ Эволюцию п
Ребята из Авито приглашают на новый ML Reading Club. В среду разберём технический репорт DeepSeek V4 🤖 Обсудим: ➡ Эволюцию прошлых разработок DeepSeek в V4. ➡ Новый механизм Compressed Attention и контексты до 1 млн токенов. ➡ Проблемы Pretrain и как команде удалось их решить. ➡ On-Policy Self Distillation — новый подход к Post-Training. ➡ Инфраструктурные инновации и трюки обучения модели. 📌 27 мая, 18:30 Ссылку направим за час до эфира в канал.

+2
✔️ В Ухане презентован домашний гуманоидный робот Shiguang S1 20 мая в технопарке Уханя прошла презентация гуманоидного робота Shiguang S1, которого называют первым в КНР роботом для семейного быта.
Машину разработала компания Hubei Jijia Shijie Robotics совместно с Хубэйским альянсом гуманоидных роботов.
Робот умеет складывать одежду, готовить, убирать со стола и поддерживать беседу с членами семьи, а также способен дообучаться новым навыкам. Заместитель руководителя R&D-департамента рассказал, что в отличие от промышленных роботов, повторяющих заданную программу, Shiguang S1 опирается на собственную модель воплощённого интеллекта, которая самостоятельно разбирает поставленную задачу и выстраивает последовательность действий. Параллельно компания запустила программу тестирования: семьи из Уханя могут подать заявку на тест-драйв Shiguang S1. Сколько устройств планируется передать в опытную эксплуатацию, не уточняется. Цена, объём первой партии и сроки серийного производства не названы. На 3 квартал 2026 года компания анонсировала более крупную модель GigaBrain 1, обещая "прорывы" в анализе данных, обобщении задач и точности движений в домашних условиях. @ai_machinelearning_big_data #news #ai #ml

🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн Google DeepMind показали AlphaProo
+1
🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн Google DeepMind показали AlphaProof Nexus - систему, которая автономно закрыла 9 открытых задач Эрдёша, часть из которых висела десятилетиями. По оценке авторов, стоимость решения одной задачи составила всего несколько сотен долларов. Кроме этого, система доказала 44 открытые гипотезы из OEIS, закрыла 15-летний вопрос в алгебраической геометрии и нашла новый алгоритмический параметр в оптимизационной теории, который раньше не был описан людьми. Модель генерирует идеи и фрагменты доказательств, а Lean проверяет каждый логический шаг через компилятор. Если доказательство некорректно, оно просто не проходит проверку. Не нужен рецензент, который вручную ищет дыру в рассуждении. Базовый агент, который просто чередует генерацию LLM и обратную связь от компилятора, смог повторить все 9 успешных решений задач Эрдёша. Более сложная версия с эволюционным поиском и reinforcement learning дала заметный выигрыш только на самых тяжёлых случаях. Чем сильнее становятся foundation models, тем чаще простые циклы «сгенерировал - проверил - исправил» начинают догонять специализированные архитектуры. Отличие от неформального подхода к математическим доказательствам принципиальное. Модель часто придумывала несуществующие леммы, ссылалась на «известные результаты» и пыталась спрятать сложность задачи в вспомогательное утверждение. В обычном текстовом доказательстве такие ошибки легко пропустить. Lean отсекает их сразу. Ещё один неожиданный эффект: агент находил неточности в формализациях уже существующих математических утверждений. То есть он работал не только как решатель, но и как диагностический инструмент для самой постановки задачи. Успехи пока сосредоточены там, где библиотека Lean уже достаточно зрелая: комбинаторика, теория чисел, оптимизация. Задачи, где нужно строить большой пласт новой теории, всё ещё далеко не закрыты. И большинство задач Эрдёша система не решила. Та же схема подходит для кодигша, спецификаций, верификации протоколов, компиляторов, криптографии. Формальная проверка отсекает галлюцинации. Модель может придумать лемму или сослаться на несуществующий результат, но Lean это не пропустит. https://arxiv.org/html/2605.22763v1 @ai_machinelearning_big_data

⚡️ NousResearch выкатила новую 9B-модель, заточенную под tool calling и агентные coding workflows в Hermes Agent. . На срезе
⚡️ NousResearch выкатила новую 9B-модель, заточенную под tool calling и агентные coding workflows в Hermes Agent. . На срезе из 200 задач SWE-bench модель набрала 53.33%. Для 9B это очень хорошая цифра, потому что обычно такие результаты ждут от моделей заметно крупнее и дороже в запуске. Отдельно модель прогнали на HermesAgent-20. Там она получила 85 баллов против 71 у базовой версии. То есть дообучение дало не косметический прирост, а нормальный скачок именно в агентных сценариях. Интересная деталь: авторы прямо советуют запускать её «горячо», с --temp примерно 1. Для таких fine-tune моделей это помогает сильнее отходить от поведения базовой модели и меньше застревать в чрезмерном обдумывании. Если начинает вести себя нестабильно, температуру можно постепенно снижать. Следом обещают выпустить Qwopus 3.6 27B. Предварительная оценка уже лежит в HF-репозитории автора, полный релиз модели должен выйти скоро. https://huggingface.co/Jackrong/Qwopus3.5-9B-Coder-GGUF @ai_machinelearning_big_data

✔️ Codex научился извлекать скрытый текст приложений через Appshots OpenAI добавила в macOS-клиент Codex функцию Appshots для быстрой передачи контекста активного окна ИИ-ассистенту. По нажатию обеих клавиш Command система делает снимок экрана и извлекает исходный текст приложения через Accessibility API, включая данные за пределами области прокрутки. Это позволяет передавать логи, API-документацию и код без ручного копирования. Для работы требуются разрешения macOS на запись экрана и универсальный доступ. Нововведение дополняет режим автономного управления интерфейсом Computer Use и доступно на всех тарифах Codex. openai.com ✔️ Black Forest Labs выпустила инпэйнт-модель FLUX Erase FLUX Erase предназначена для удаления объектов с изображений. Модель работает по маске без текстовых промптов, достраивая фон, текстуры и тени. Скорость генерации - 4,54 секунды на изображении 1024х1024. По оценке BFL, ближайшие аналоги тратят на ту же задачу более 12 секунд. Стоимость API-запроса составляет 3 цента мегапиксельную картинку. В тестах на качество ретуши FLUX Erase обходит GPT Image-2 и Finegrain Eraser Standard, а по стоимости опережает Nano Banana Pro. Модель доступна только через API, попробовать FLUX Erase можно в бесплатном веб-демо. bfl.ai ✔️ В Claude Code закрыли уязвимость, позволявшую красть токены разработчиков Anthropic пропатчила уязвимость в песочнице Claude Code. Баг позволял извлекать токены и исходный код разработчиков через инъекцию нулевого байта в SOCKS5. Внутренний фильтр считал строку с нулевым символом безопасной, после чего операционная система обрезала текст по байту и подключалась к заблокированному хосту. В связке с промпт-инъекцией через анализируемые моделью файлы механизм давал возможность выполнять код и отправлять данные на сторонние серверы. Уязвимость присутствовала в релизах до версии 2.1.89. Патч вышел в сборке 2.1.90 без упоминания в чейнджлоге и регистрации CVE. По заявлению Anthropic, разработчики обнаружили и закрыли баг внутренними силами до публикации отчета исследователей. theregister.com ✔️ Perplexity открыла исходный код сканера локальных уязвимостей Bumblebee - утилита для поиска уязвимостей на локальных машинах под macOS и Linux. Сканер выявляет скомпрометированные зависимости, вредоносные плагины и опасные конфигурации ИИ-инструментов. Инструмент работает исключительно в режиме чтения: анализирует метаданные и lock-файлы без запуска пакетных менеджеров. Это исключает случайное выполнение вредоносных скриптов при проверке зараженных библиотек. Bumblebee анализирует 4 вектора: пакетные менеджеры, расширения для редакторов кода (семейство VS Code, включая Cursor и Windsurf), браузерные плагины и конфигурации ИИ-агентов на базе протокола MCP. ИБ-команды могут интегрировать сканер в MDM-решения, загружать кастомные индикаторы компрометации и запускать проверки в трех режимах - от фонового мониторинга до глубокого расследования инцидентов. perplexity.ai ✔️ Губернатор Калифорнии подписал указ о защите рынка труда от ИИ Штат планирует выделять субсидии бизнесу, который отказывается от замены сотрудников нейросетями, и финансировать программы переобучения офисных работников. Дополнительно правительство совместно с ИИ-индустрией рассмотрит концепцию универсального базового капитала в виде распределения среди граждан долей в фондах или акций компаний. В администрации признают нехватку стандартных пособий по безработице и планируют пересмотреть налоговую систему. По оценке властей, сейчас она экономически поощряет внедрение алгоритмов и дестимулирует наем людей. gov.ca.gov @ai_machinelearning_big_data #news #ai #ml

📌 Anthropic опубликовала апдейт по проекту Glasswing Glasswing - инициатива по поиску уязвимостей в системно значимом програ
+1
📌 Anthropic опубликовала апдейт по проекту Glasswing
Glasswing - инициатива по поиску уязвимостей в системно значимом программном обеспечении с помощью ИИ.
Согласно обновленному отчету, около 50 её партнёров за первый месяц работы с моделью Mythos Preview обнаружили более 10 000 уязвимостей высокого и критического уровня. 🟡Среди приведённых примеров: 🟢Cloudflare, в чьих ключевых системах было найдено 2 000 ошибок, из них 400 серьёзных; 🟢Mozilla обнаружила в Firefox 150 271 уязвимость (примерно в 10 раз больше, чем при аналогичной проверке Firefox 148 моделью Claude Opus 4.6); 🟢Британский AI Security Institute подтвердил, что Mythos Preview стал первой моделью, прошедшей оба его сценария многошаговых кибератак от начала до конца. 🟡Параллельно Anthropic сама сканировала более тысячи опенсорс-проектов Mythos отметила как потенциально опасные 6 202 уязвимости высокого и критического уровня. Из 1 752 случаев, проверенных независимыми фирмами, 90,6% оказались реальными, а 62,4% подтвердили заявленную тяжесть.
В числе подтверждённых: уязвимость в криптографической библиотеке wolfSSL (CVE-2026-5194), которая позволяла подделывать сертификаты сайтов (уже исправлена).
Anthropic отмечает, что узким местом теперь стала не идентификация ошибок, а их проверка и устранение. Из 530 переданных мейнтейнерам критичных уязвимостей закрыты пока только 75. Несколько разработчиков попросили Anthropic замедлить темп раскрытия, так как нагрузка превышает их возможности. Среднее время подготовки патча для серьёзной уязвимости составляет около 2-х недель.
В отчёте также упомянут эпизод в одном из банков-партнёров: по словам Anthropic, модель помогла предотвратить мошеннический перевод на 1,5 миллиона долларов после взлома почты клиента. Название банка и подробности инцидента не раскрываются.
Anthropic обещает расширять Glasswing с участием правительств США и союзных государств. @ai_machinelearning_big_data #news #ai #ml

🌟 Tencent выпустила набор моделей машинного перевода Hy-MT2 Линейка включает 3 версии: Hy-MT2-1.8B, Hy-MT2-7B и Hy-MT2-30B-A
+2
🌟 Tencent выпустила набор моделей машинного перевода Hy-MT2 Линейка включает 3 версии: Hy-MT2-1.8B, Hy-MT2-7B и Hy-MT2-30B-A3B. Все модели поддерживают перевод между 33 языками (включая русский), а также 5 диалектами и языками национальных меньшинств КНР. Tencent делает акцент на возможности локального запуска модели на устройствах с ограниченными ресурсами. Версия с экстремальным квантованием в 1,25 бит, собранная с помощью собственного фреймворка Sherry, занимает около 440 МБ и способна работать на мобильных чипах Apple, Qualcomm и MediaTek без подключения к интернету.
Скорость инференса на Apple A15 заявлена в 1,5 раза выше, чем у 4-битной версии предыдущей модели Hy-MT1.5.
По результатам собственного тестирования Tencent, на бенчмарке FLORES-200 версии Hy-MT2 показали средние результаты 88,1%, 96,9% и 98,1% - компания называет это сопоставимым с показателями Gemini 3.1 Pro.
Tencent утверждает, что старшая модель 30B-A3B превосходит DeepSeek-V4-Pro и Kimi K2.6 на ряде тестов, а младшая 1,8B-версия опережает по среднему качеству перевода коммерческие API, включая решение Microsoft.
Вместе с моделью Tencent открыла исходники IFMTBench - собственного тестового набора для оценки того, насколько точно перевод следует пользовательским инструкциям о стиле, терминологии и формате вывода. Помимо этого, компания выступает партнёром соревнований WMT26 - General Machine Translation и Video Subtitle Translation. Одновременно, в экосистеме WeChat запущено мини-приложение Tencent Hy Translate. Полноценные приложения для iOS и Android, по словам компании, появятся позднее. 📌Лицензирование: Tencent HY Ccommunity License 🟡Блогпост 🟡Набор моделей 🟡Техотчет 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #MT #HYMT2 #Tencent

✔️ Китай ввел в эксплуатацию первый в мире подводный дата-центр Близ Шанхая запущен подводный центр обработки данных, питающи
✔️ Китай ввел в эксплуатацию первый в мире подводный дата-центр Близ Шанхая запущен подводный центр обработки данных, питающийся от ветроэнергетики, - об этом сообщили китайские СМИ со ссылкой на разработчиков проекта. Объект вышел на полноценную коммерческую эксплуатацию на прошлой неделе, после серии пробных запусков ранее в этом году. ЦОД мощностью 24 МВт размещён под водой рядом с турбинами ветроэлектростанции и вмещает около 2 тысяч серверов, включая GPU-кластеры China Telecom и оператора LinkWise. Оборудование поводного дата-центра используется для задач искусственного интеллекта, разметки больших данных, развития 5G и обучения китайских языковых моделей.
Стоимость проекта оценивается примерно в 226 млн долларов, его строительство завершилось в октябре 2025 года.
В проекте полностью отказались от промышленных систем охлаждения: тепло от серверов отводит морская вода, а электричество поступает напрямую от близлежащих ветряков. Данные о технических параметрах в публикациях расходятся. Часть источников указывает глубину размещения модулей около 10 метров, другие - 35 метров. Специалисты, причастные к проекту, признают, что технология находится на ранней стадии.
К числу нерешённых вопросов относят коррозию от солёной воды, долговременную герметизацию под давлением, надёжность подводных кабелей, доступность оборудования для обслуживания и возможное воздействие на морскую среду.
Ранее схожий эксперимент, Project Natick, проводила Microsoft, однако в коммерческую эксплуатацию его не вывели. @ai_machinelearning_big_data #news #ai #ml

⚡️ Machine Learning Roadmap 2025: большая карта входа в ML без сказок про “нейросети за месяц Большой русскоязычный roadmap п
⚡️ Machine Learning Roadmap 2025: большая карта входа в ML без сказок про “нейросети за месяц Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга. Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа. Roadmap разбит на 7 треков: 1. Фундамент: Python, математика, статистика, инструменты 2. Классический ML: scikit-learn, табличные данные, метрики, валидация 3. Deep Learning: PyTorch, CNN, RNN, training loop 4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты 5. Generative AI: изображения, видео, аудио, мультимодальность 6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving 7. Специализация: CV, NLP, RecSys, RL, Safety Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”. В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы. Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось. По времени тоже без сказок: 1. 0-3 месяца: математика, классический ML 2. 3-6 месяцев: Deep Learning и PyTorch 3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты 4. 12+ месяцев: MLOps, прод, масштабирование, специализация Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу! Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир. https://github.com/justxor/MachineLearningRoadmap