Machinelearning

رفتن به کانال در Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

نمایش بیشتر

شبکه:Machinelearning روسيا1 260 فناوری و برنامه‌ها323...

📈 تحلیل کانال تلگرام Machinelearning

کانال Machinelearning (@ai_machinelearning_big_data) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 298 105 مشترک است و جایگاه 323 را در دسته فناوری و برنامه‌ها و رتبه 1 260 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 298 105 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 11 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -7 224 و در ۲۴ ساعت گذشته برابر -206 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 7.69% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.95% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 22 918 بازدید دریافت می‌کند. در اولین روز معمولاً 17 745 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 176 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند openai, claude, api, gemini, контекст تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 12 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

298 105

مشترکین

-20624 ساعت

-1 5177 روز

-7 22430 روز

22 918

نمایش های پست

~ 17 74524 ساعت

~ 20 01448 ساعت

7.69%

نرخ مشارکت

~ 6

پست های در روز

Ads index

beta

آرشیو پست ها

298 057

Пока одни обсуждают, заменит ли ИИ инженеров, Норникель quietly сделал ход в другую сторону, научил его работать вместе с ними. Компания запустила систему, которая фактически берет на себя весь цикл проектирования промышленного здания: от расчетов до документации. Внутри не абстрактная нейросеть, а обученная на ГОСТах, СНиПах и собственной экспертизе база знаний, которая через ИИ-агентов собирает цифровую модель, считает параметры и проверяет их на соответствие нормам. Финальное слово остается за инженером, но теперь он работает не с пустого листа, а с уже просчитанным и собранным решением. И это не красивая концепция, а вполне измеримая эффективность: задачи на проектирование выполняются на 83% быстрее, моделирование на 80%, а сроки подготовки документации сокращаются вдвое. По сути, речь идет о новой логике инженерной работы, где ИИ закрывает рутину и снижает вероятность ошибок, а человек концентрируется на принятии решений. На фоне ухода привычного софта с рынка это выглядит не как временная замена, а как попытка собрать собственный инженерный стек под реальные задачи и с заделом на будущее.

298 057

✔️ OpenAI предлагает 2 месяца бесплатного доступа к Codex Enterprise. Сэм Альтман объявил о запуске агрессивной промоакции: в ближайшие 30 дней компании, готовые сменить ИИ-провайдера на Codex, получат 2 месяца бесплатного использования полнофункциональной корпоративной версии. Тайминг выбран неслучайно. Запуск кампании совпал с анонсом от Anthropic, которая радикально изменила правила использования своих ИИ-инструментов.

С 15 июня 2026 года запросы к Claude Agent SDK и сторонним приложениям перестанут учитываться в рамках общих квот для подписок Pro, Max, Team и Enterprise. Anthropic переводит автоматизацию на отдельный счет: теперь пользователям выделяется жесткий ежемесячный баланс, например, $20 для тарифов Pro и до $200 для топовых планов. При исчерпании этого лимита работа агентов полностью блокируется до начала нового расчетного периода. Чтобы продолжить использование сторонних интеграций, клиентам придется включить extra usage и дополнительно оплачивать запросы по тарифам API.

Ситуацию усугубляет то, что неиспользованные остатки кредитов сгорают, а корпоративные клиенты не могут объединять индивидуальные квоты разработчиков в общий командный пул. Сообщество разработчиков встретило этот шаг Anthropic волной критики, расценив его как скрытое сокращение лимитов. OpenAI оперативно воспользовалась хэйтом, предложив корпоративным командам выгодную альтернативу без финансовых рисков при миграции. Подать заявку на получение бесплатного доступа можно через сайт OpenAI или с помощью промокодов от партнерских площадок. @ai_machinelearning_big_data #news #ai #ml

298 057

✔️ Пекин заблокировал экспорт Nvidia H200 после одобрения Минторгом США Разрешения получили около 10 компаний (Alibaba, Tencent, ByteDance и JD и дистрибьюторы Lenovo и Foxconn). Квота составляет до 75 тысяч чипов на клиента. Правительство КНР остановило сделки для перевода инфраструктуры на локальные аналоги. Дополнительным барьером стала новая схема логистики от администрации США. Ведомство требует 25% выручки от продаж, для чего обязали физически провозить электронику через американскую территорию перед отправкой заказчикам. Китайские регуляторы видят в таком маршруте риск компрометации цепочек поставок и установки аппаратных закладок. Для проведения переговоров по контрактам глава Nvidia присоединился к миссии США в Пекине. reuters.com ✔️ Anthropic временно увеличила лимиты для Claude Code на 50% До 13 июля пользователи платных тарифов Pro, Max, Team и Enterprise смогут обращаться к ИИ-ассистенту в полтора раза чаще. Новые еженедельные квоты и действуют во всех рабочих средах: CLI, расширениях для IDE, а также в десктопной и веб-версиях. Это расширение станет отличным подспорьем для разработчиков, поскольку 50-процентная надбавка суммируется с обновлением прошлой недели, когда Anthropic в 2 раза увеличила лимиты на пятичасовые сессии. Никаких дополнительных действий для активации нового лимита не требуется. ClaudeDevs в сети Х ✔️ Управлять Codex теперь можно с iOS и Android OpenAI добавила функцию удаленного управления Codex в мобильное приложение ChatGPT. Мобильный клиент в реальном времени транслирует скриншоты среды, логи терминала, результаты тестов и diff-файлы. Пользователь может проверять промежуточные результаты, корректировать действия ИИ и подтверждать выполнение команд без физического доступа к ПК. Соединение устройств идет через внутренний ретранслятор без прямого доступа к машине из публичного интернета. Исходный код, ключи и локальные настройки не покидают рабочую среду. Одновременно OpenAI выпустила функцию Remote SSH для запуска агента в корпоративных инфраструктурах. Управление агентом со смартфона доступно на всех тарифах. Для подключения необходимо обновить мобильный ChatGPT и десктопный клиент для macOS. Поддержка Windows ожидается позже. openai.com ✔️ arXiv начнет банить авторов на год за невычитанные тексты от LLM О новых правилах объявил Томас Дитерих. Согласно политике, авторы несут полную ответственность за содержимое препринтов, включая плагиат, предвзятость и фактические ошибки языковых моделей. Поводом для блокировки аккаунта станут явные следы ИИ-генерации: выдуманные источники в списке литературы, забытые ответы чат-ботов или просьбы заполнить таблицу реальными данными экспериментов. Нарушители лишаются права публиковаться на один год. После истечения бана прямая загрузка препринтов для них останется недоступной, для размещения статьи потребуется предоставить доказательства ее принятия авторитетным рецензируемым изданием или конференцией. Ведущий модератор раздела CS.LG сервиса arXiv ✔️ GPT-5.5 и Claude Mythos прошли стенды AISI на автономный взлом Британский институт безопасности ИИ протестировал модели GPT-5.5 и Claude Mythos на способность к автономному хакингу. По данным исследователей, нейросети прервали предыдущий тренд на удвоение сложности решаемых задач каждые 4,7 месяца, показав результаты за пределами измерительной шкалы института. Модели проверяли на изолированных стендах с имитацией корпоративных сетей. Задачи включали поиск уязвимостей, веб-эксплуатацию и реверс-инжиниринг. Для тестов контекстное окно ограничивали 2,5 млн токенов. В этих условиях Claude Mythos первым прошел оба комплексных сценария: "The Last Ones" и инфраструктуру "Cooling Tower", требующих планирования многоэтапной атаки. GPT-5.5 также показала высокие результаты. По оценкам AISI, при использовании агентной архитектуры и снятии лимита на токены доля успешных взломов приближается к 100%, из-за чего вычислить предел возможностей новых моделей пока не удается. aisi.gov.uk @ai_machinelearning_big_data #news #ai #ml

298 057

📌 Anthropic опубликовал документ о конкуренции США и Китая на горизонте 2028 года. Компания напрямую агитирует за ужесточение экспортного контроля и закрытие каналов, через которые китайские лаборатории догоняют фронтир. Логика статьи строится на одном наблюдении. По интеллекту моделей отставание китайских лабораторий от американских сократилось до нескольких месяцев. По компьюту (вычислительные мощности) разрыв пока огромный: согласно дорожным картам, Huawei в 2026 году произведёт около 4% от совокупной вычислительной мощности Nvidia, в 2027-м - 2%. Но именно компьют, по мнению Anthropic, пока удерживает китайские лаборатории от паритета. И компанию беспокоит то, насколько изобретательно этот барьер обходится. Каналов обхода два: - физический и инфраструктурный доступ к компьюту в обход санкций: контрабанда чипов и обучение моделей в датацентрах за пределами Китая - distillation attacks: массовое создание поддельных аккаунтов для систематического сбора ответов фронтирных моделей и воспроизведения их возможностей у себя Текущее экспортное право регулирует продажу железа, но не удалённый доступ к нему. По данным FT, Alibaba и ByteDance уже тренируют флагманские модели на подсанкционных американских чипах в датацентрах Юго-Восточной Азии. Distillation attacks Anthropic квалифицирует как промышленный шпионаж, фактически субсидируемый американскими инвестициями. Особое место в статье занимает Mythos Preview - модель, которую Anthropic в апреле передал ограниченному кругу партнёров в рамках Project Glasswing. Команда Firefox с её помощью за месяц закрыла больше уязвимостей, чем за весь 2025 год. Один китайский аналитик по кибербезопасности отреагировал фразой, которую теперь цитируют в статье: «

мы всё ещё точим мечи, а у соперника внезапно появился полностью автоматический пулемёт Гатлинга».

Этот эпизод Anthropic подаёт как репетицию будущего. При таком темпе ускорения отставание даже в несколько месяцев превращается в качественно другой уровень возможностей. Два сценария на 2028 год выстроены вокруг одной развилки - что сделает Вашингтон в ближайшие месяцы. В сценарии лидерства США закрывают лазейки в экспортном контроле, давят дистилляцию, ускоряют экспорт американского ИИ-стека и получают отрыв в 12-24 месяца по фронтиру. Этот отрыв самоусиливается: лидерство притягивает таланты и капитал, расширяет коалицию союзников, даёт США рычаги для диалога с Пекином, включая темы безопасности. В сценарии паритета Вашингтон оставляет всё как есть. Китайские лаборатории за счёт удалённого компьюта и продолжающейся дистилляции выходят на околофронтирный уровень. Huawei и Alibaba занимают рынки Глобального Юга дешёвыми и достаточно качественными моделями, а нормы применения ИИ начинают формироваться под влиянием авторитарных режимов. Отдельный важный блок - безопасность китайских моделей. Anthropic ссылается на оценку CAISI: DeepSeek R1-0528 под распространённым джейлбрейком выполняет 94% явно вредоносных запросов против 8% у американских референсных моделей. Независимая проверка Kimi K2.5 от Moonshot показала похожую картину на CBRN-тематике. Открытые веса делают проблему острее. После публикации модели встроенные ограничения можно снять, и любой актор получает доступ к её возможностям. На уровне политики Anthropic предлагает четыре шага: - ужесточить экспортный контроль на чипы и оборудование для их производства - закрыть лазейку с удалённым доступом к зарубежным мощностям - законодательно квалифицировать distillation attacks как незаконную практику - продолжать продвигать американский ИИ-стек на внешних рынках По расчётам, на которые ссылается компания, при ужесточении ограничений у американского сектора будет примерно в 11 раз больше компьюта, чем у китайского. Любопытна и сама форма высказывания. Anthropic окончательно вышел за рамки роли исследовательской лаборатории - это полноценный лоббистский документ, оформленный как ресёрч. Оригинал: https://www.anthropic.com/research/2028-ai-leadership @ai_machinelearning_big_data #anthropic

298 057

🌟 Perceptron AI представил недорогую модель анализа видео Американский стартап выпустил флагманскую мультимодальную модель Mk1 (Mark One) для анализа видео и воплощенного ризонинга - способности ИИ оперировать пространственно-временной информацией о физическом мире.

Стартап основали в ноябре 2024 года Армен Агаджанян и Акшат Шривастава - бывшие научные сотрудники подразделения FAIR Марка Цукерберга, соавторы работ по мультимодальным архитектурам Chameleon и MoMa.

Perceptron AI позиционирует Mk1 как инструмент для видеонаблюдения, инспекции оборудования, инвентаризации складов, аналитики безопасности и автоматической разметки обучающих данных для роботов. Модель обрабатывает видео с частотой до 2-х кадров в секунду и отслеживает объекты между кадрами, в том числе при их частичном перекрытии. Mk1 работает в гибридном режиме: цепочку рассуждений можно включать или отключать на уровне отдельного запроса. Для видео доступна разметка временных меток событий; для изображений - детекция объектов, подсчёт, распознавание текста, разбор сложных документов в HTML, JSON или Markdown, а также вывод геометрических примитивов (точек, рамок и полигонов), которые могут использоваться робототехническими системами. По бенчмаркам, опубликованным самой Perceptron, модель в задачах работы с изображением, видео и пространственным рассуждением сопоставима с топовыми моделями Google, Anthropic, OpenAI и Qwen, а в ряде тестов опережает их.

В частности, на EmbSpatialBench модель набрала 85,1 балла против 78,4 у Google Robotics-ER 1.5.

Модель доступна через API и площадку OpenRouter. Попробовать Mk1 можно на сайте стартапа.

Заявленная цена: 15 центов за миллион входных токенов и 1,50 доллара за миллион выходных, контекстное окно - 32 тыс. токенов.

@ai_machinelearning_big_data #news #ai #ml

298 057

✔️ GPT 5.5 полностью решила задание из бенчмарка ProgramBench Команда ProgramBench сообщила, что модель GPT 5.5 в режимах high и xhigh впервые в истории теста полностью прошла одно из заданий - задачу cmatrix. До этого ни одна модель из публичного рейтинга не доводила задания до конца.

ProgramBench - набор реальных задач программирования, в которых агент должен с нуля переписать утилиту с открытым исходным кодом и пройти при этом скрытые поведенческие тесты.

🟡Лидерборд выглядит так 🟢GPT 5.5 (xhigh) - 1 место: 0,5% полностью решённых задач и 13,5% почти решённых (то есть проходящих свыше 95% поведенческих тестов) 🟠GPT 5.5 (high) - те же 0,5% при 5% почти решённых 🟠Claude Opus 4.7 (xhigh) показала 0% и 4,5%, обычная версия Opus 4.7 - 0% и 3% 🟠Opus 4.6 - 0% и 2,5% соответственно Совокупно число почти решённых задач у GPT 5.5 достигло 26, это рекорд рейтинга.

Примечательно, что в режиме medium, который OpenAI выставляет по умолчанию, GPT 5.5 лишь незначительно опережает Claude Sonnet 4.6. При включении расширенного рассуждения её результат заметно улучшается.

🟡Разброс по стоимости Запуск GPT 5.5 (high) стоил $3,17 и потребовал 34 обращения к API, GPT 5.5 (xhigh) - $4,84 и 40 обращений. Тот же запуск Claude Opus 4.7 (xhigh) обошёлся в $10,74 при 178 обращениях, однако решение содержало 19 ошибок в поведенческих тестах. По разбору авторов, все провалы объясняются 2-мя багами в коде Claude: чувствительностью парсера цветов к регистру и неверным кодом возврата.

Интересно, что 2 версии GPT 5.5 выбрали разные языки для одной и той же задачи: high решала на C с ANSI escape-последовательностями, xhigh предпочла Python. Claude Opus 4.7 (xhigh) использовала библиотеку ncurses и команда бенчмарка охарактеризовала этот подход как креативное системное решение, которое, впрочем, не дало преимущества в итоговом результате.

@ai_machinelearning_big_data #news #ai #ml

298 057

Руководитель направления «AI для разработки» в 2ГИС Ищем руководителя, который поможет встроить AI в работу 800+ инженеров. Не с нуля: AI-инструменты уже используются в командах, теперь важно собрать сильное направление, масштабировать рабочие практики и сделать AI частью ежедневной разработки. Что нужно: — опыт управления командой или направлением в IT — технический бэкграунд (разработка / инженерия) — практический опыт работы с AI-инструментами (Cursor, Copilot, Claude и др.) — понимание процессов разработки: CI/CD, code review, incidents Что делать: — собрать core-команду — запускать AI-пилоты в командах — развивать внутренние AI-инструменты — измерять результат и улучшать процессы Удалёнка или гибрид. Белая зарплата, ДМС, аккредитованная IT-компания. Подробнее и отклик здесь Другие инженерные инсайты от 2ГИС → в Telegram-канале RnD #реклама О рекламодателе

298 057

✔️ Anthropic запустила платформу Claude for Small Business Компания представила пакет интеграций Claude через интерфейс Claude Cowork, который связывает языковую модель с QuickBooks, PayPal, HubSpot, Canva, Docusign, Google Workspace и Microsoft 365. Пользователям доступны 15 готовых агентов для финансов, операционной деятельности, продаж, маркетинга и HR. Система умеет сводить бухгалтерский баланс, искать расхождения в транзакциях PayPal, составлять финансовые прогнозы, анализировать метрики HubSpot и генерировать промо-материалы в Canva. В архитектуру заложен принцип human-in-the-loop. Модель берет на себя вычисления и рутинную нагрузку, но критические действия - проводка платежей, подписание контрактов и отправка писем требуют финального подтверждения пользователя. anthropic.com ✔️ Создатель Qwen ищет инвестиции на свою ИИ-лабораторию Бывший технический руководитель Qwen в Alibaba привлекает финансирование для своего стартапа. Целевая оценка около $2 млрд, в переговорах об инвестициях участвуют Gaorong Capital и Sequoia China. Готового продукта у компании нет, оценка строится на репутации основателя. За 3 года в Alibaba он развил Qwen в одно из самых востребованных семейств open-source моделей. В марте техлид объявил об уходе из корпорации, после чего Alibaba перевела команду Qwen в прямое подчинение CEO и сместила фокус на закрытую коммерциализацию. Американские проекты выходцев из OpenAI стартуют выше: SSI Ильи Суцкевера на старте оценивали в $5 млрд, стартап Миры Мурати - в $10 млрд. Инвесторы осторожничают с китайским рынком: здесь не работает поглощение IT-гигантами, а экспортные санкции США на чипы ограничивают лаборатории в доступе к вычислениям. theinformation.com ✔️ Xiaomi опубликовала модель для автономного вождения Xiaomi Embodied Intelligence опубликовала код и веса 4B VLA-модели OneVL для беспилотных автомобилей и робототехники. По заявлению разработчиков, она принимает решения точнее, чем более крупные модели, и делает это почти мгновенно. Архитектура построена на Latent CoT, под капотом Qwen3-VL. Модель сжимает логику принятия решений в 55 скрытых токенов (35 визуальных и 20 текстовых). Подход сохраняет глубину рассуждений при задержке инференса на бортовом оборудовании в 0,24 секунды. На бенчмарках NAVSIM и ROADWork OneVL обходит аналоги вдвое крупнее. Xiaomi утверждает, что это первый случай, когда сеть с латентными рассуждениями превосходит текстовые CoT-модели по точности при сохранении скорости предиктивных систем. xiaomi.github.io ✔️ Индекс Ramp: Anthropic обошла OpenAI по доле корпоративных клиентов По данным платежного индекса Ramp AI, решения Anthropic используют 34,4% корпоративных клиентов платформы, OpenAI - 32,3%. За год доля Anthropic выросла в 4 раза, база OpenAI увеличилась на 0,3%. Статистика опирается на транзакции преимущественно американских компаний. Индекс учитывает факт оплаты услуг провайдера, а не реальные объемы API-запросов или токенов. Динамика спроса связана с ростом цен на проприетарные решения. Из-за удорожания закрытых API бизнес переходит на платформы инференса для open-source моделей и дешевые специализированные инструменты. ramp.com ✔️ Xynova анонсировала роботизированную кисть Flex 2 Китайская компания Xynova представила роботизированную кисть Flex 2 для гуманоидных роботов и систем воплощённого ИИ. При собственной массе 400 граммов манипулятор удерживает объекты весом до 12 кг. Кинематика устройства обеспечивает 23 степени свободы. Встроенные сенсоры проскальзывания и миллисекундный аппаратный отклик позволяют алгоритмам адаптивного захвата корректировать силу давления на предмет при контакте. Xynova самостоятельно производит аппаратные и программные компоненты продукта: сборку электродвигателей, редукторов, роликовых винтов, сервоконтроллеров и драйверов, а также написание алгоритмов управления. Разработкой занимается R&D-центр компании из 40 специалистов, более 70% из которых имеют ученые степени. xynova.com.cn @ai_machinelearning_big_data #news #ai #ml

298 057

🚀 Anthropic вводит ежемесячный кредит для разработчиков С 15 июня все платные тарифы Claude получат отдельный месячный кредит на программное использование. Кредит покрывает: • Claude Agent SDK claude -p (CLI) • Claude Code GitHub Actions • Сторонние приложения на базе Agent SDK И главное - автоматизация и агенты на Claude не будут «съедать» обычный лимит подписки - для них выделен свой бюджет. https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan

298 057

⚡️ Claude становится самым дорогим корпоративным наркотиком IT-директор Telaid коротко описал свой новый счёт за Claude: «Офигеть». За 30 дней расходы выросли втрое. И это всего на 30 пользователей. Anthropic и так была одной из самых дорогих AI-лабораторий, а теперь корпоративных клиентов переводят с фиксированной оплаты на оплату по фактическому использованию. Плюс новый токенизатор, который тратит больше токенов на те же запросы. Но клиенты не уходят от Anthropic. ServiceNow сожгла годовой бюджет на Anthropic за несколько месяцев. Workato увидела, как один агент за день потратил лимит целого пользователя. NinjaOne переводит 700 инженеров с GitHub Copilot на Claude Code. Claude становится дороже, счета растут, но компании всё равно платят. https://www.theinformation.com/articles/anthropic-flexes-pricing-power-customers-willingly-eat-cost

298 057

🌟 TwELL от Sakana AI и NVIDIA: до 30% к инференсу и −24% VRAM на H100 Sakana AI и NVIDIA представили TwELL - формат данных и набор CUDA-ядер под неструктурированную разреженность в LLM.

На H100 это даёт до 30% к инференсу, до 24% к скорости обучения и более чем 24% снижения пикового VRAM при трейне. Работа заявлена на ICML 2026.

В FFN-блоках современных LLM для каждого токена реально работает малая доля скрытых активаций - остальное болтается около нуля и впустую тратит вычисления. Если поверх ReLU добавить вспомогательный L1-лосс на скрытые активации прямо во время обучения, долю нулей можно загнать выше 95% без видимой просадки на downstream-задачах. Проблема в том, что, что тензорные ядра H100 заточены под плотные матричные умножения и тайлинг. Если скормить им обычный ELLPACK, то теоретическая экономия убивается накладными расходами: построчная упаковка не ложится на тайловую структуру, появляются синхронизации между CTA и лишний трафик в HBM. 🟡Вот тут и решает TwELL Колонки активаций гейта бьются на горизонтальные тайлы. Внутри каждого тайла лежат только ненулевые значения и их индексы в локальном ELL-формате. Размер тайла подобран так, чтобы каждая CTA паковала свой кусок прямо в разделяемой памяти без синхронизаций между блоками и без лишних обращений к глобальной памяти. Дальше - 2 разных ядра: 🟢Инференс

Up- и down-проекции выполняются в одном ядре. Плотная матрица скрытых активаций вообще не материализуется: ядро пробегается по упакованным нулям, подтягивает только нужные строки Wu и Wd и считает скалярное произведение.

🟠Обучение

Гибридное представление: каждая строка либо ужимается в один глобально выровненный разреженный блок, либо в редких случаях переполнения падает в плотный резерв. Результат - обратный проход без единого умножения двух плотных матриц.

Интересный момент: даже без учёта разреженности кастомные TwELL-ядра вышли чуть быстрее плотных матмулов из PyTorch и CuDNN, в основном за счёт переиспользования ядер, совмещения загрузки данных с вычислениями и оптимизированных шаблонов доступа к памяти. 🟡Цифры на H100 (замер по модели 1.5B) 🟢до 30% ускорения на пакетном инференсе; 🟢до 24% ускорения на обучении; 🟢пиковый VRAM при обучении падает более чем на 24%; 🟢энергопотребление GPU - примерно на 3% ниже. 🟡Скейлинг Считали на моделях 0.5B–2B. При фиксированном L1 у 2B доля ненулевых активаций на 38% меньше, чем у 0.5B (крупнее модель, охотнее уходит в разреженность). На 2B инференс быстрее на 20.5%, обучение - на 21.9%, и в память влезает вдвое больший микробатч. 🟡Очевидные минусы

Кастомные CUDA-ядра привязаны к NVIDIA: альтернативное железо и PyTorch - мимо. Эксперименты упираются в 2B, как поведёт себя более крупная модель, никто не проверял.

📌Лицензирование: MIT License 🟡Блогпост 🟡Arxiv 🖥Github @ai_machinelearning_big_data #AI #ML #LLM #TwELL #SakanaAI #NVIDIA

298 057

Устройтесь в Яндекс за выходные: 30–31 мая Если вы ML- или DL-инженер с опытом в доменных областях NLP, CV, RecSys и Classic ML, участвуйте в Weekend Offer ML. Это один из наймовых ивентов Яндекса: вы проходите все секции онлайн в ускоренном режиме и сразу получаете обратную связь. Как всё устроено: 🔴 до 20 мая — регистрация; 🔴 30 мая — две технические секции, вместо трёх в обычном найме; 🔴 31 мая — финальное интервью с командами и офер. Если хотите работать в одной из команд Яндекса — R&D, Поиск с Алисой AI, Яндекс Карты, Алиса и Умные устройства, Рекламные технологии Яндекса — регистрируйтесь! Подробности и полезные ссылки — на сайте: https://yandex.ru/project/events/wo-ml-0526. После регистрации с вами свяжется рекрутер и расскажет все детали.

298 057

✔️ Anthropic собрала юридический стек поверх Claude Opus 4.7 Компания выпустила набор инструментов для юристов: 20+ MCP-коннекторов и 12 плагинов под отдельные практики. Claude работает внутри Microsoft Word, Outlook, Excel и PowerPoint и умеет переносить контекст: правки к договору в Word не нужно заново объяснять при составлении сопроводительного письма в Outlook. Коннекторы дают доступ к Docusign, iManage, NetDocuments, Relativity, Everlaw, Datasite, Box, Thomson Reuters CoCounsel и базам прецедентов Free Law Project и Midpage. Плагины покрывают корпоративное право, M&A, трудовые споры, приватность, регуляторику, интеллектуальную собственность и ведение судебного производства. При установке каждый плагин проходит короткое сетап-интервью и подстраивается под стандарты компании, цепочку согласований и стиль оформления. По словам Anthropic, плагины ускоряют поиск прецедентов, сверку договоров с базой знаний и первичный комплаенс. Всё доступно корпоративным пользователям в Claude Cowork. @ai_machinelearning_big_data #news #ai #ml

298 057

✔️ OpenAI анонсировала платформу проактивной киберзащиты Компания запустила инициативу Daybreak для задач киберзащиты и анализа ПО. В основе - собственные LLM, где Codex используется в качестве управляющего агентного каркаса. Daybreak анализирует объемные кодовые базы и незнакомые архитектуры, выявляет уязвимости, проводит секьюрити-ревью и оценивает риски зависимостей. Инструмент встроен напрямую в цикл разработки для моделирования угроз и валидации патчей. Из-за рисков двойного назначения платформа использует жесткие механизмы верификации. В ближайшие недели OpenAI совместно с госсектором и ИБ-партнерами начнет поэтапный релиз новых специализированных моделей для кибербезопасности. openai.com ✔️ В Claude Code появился дашборд для управления параллельными агентами. CLI-утилита получила консольный дашборд Agent View, который позволяет запускать фоновые задачи и контролировать их через единый интерфейс без использования мультиплексоров. В дашборде отображаются статусы процессов (в работе, завершено, ожидание ввода). Встроенная функция Peek позволяет просматривать последние ответы и передавать промпты без открытия полного транскрипта чата. Разработчики могут делегировать агентам создание PR, запуск долгих задач или поиск по кодовой базе, не прерывая свой основной контекст в терминале. Функция доступна для пользователей Claude API и подписчиков платных тарифов. claude.com ✔️ Thinking Machines Lab анонсировал мультимодальную модель непрерывного взаимодействия Стартап Мирs Мурати представил ИИ-архитектуру, которая обрабатывает аудио, видео и текст единым потоком, считывая входящие данные микро-шагами по 200 мс. Генерацию ответа можно прерывать, корректировать голосом или показать новые объекты. Система построена на двухуровневой архитектуре. За удержание диалога отвечает MoE-модель на 276B параметров, из которых при генерации активны 12B. Параллельно асинхронная фоновая модель забирает на себя задачи сложного логического вывода, веб-поиска и вызова инструментов. Ограниченный доступ к превью-версии откроют в ближайшие месяцы. До конца года запланирован публичный релиз и выход более крупных версий модели. thinkingmachines.ai ✔️ Google анонсировала Gemini Intelligence для Android Cистема на базе ИИ-агентов Gemini Intelligence для Android автоматизирует многосоставные задачи в приложениях - от бронирования поездок до переноса списков из заметок в корзину магазина. Интеграция затронет базовые компоненты ОС. В Chrome появится опциональная функция обобщения веб-страниц и автозаполнения форм. В клавиатуру Gboard добавят инструмент Rambler, который на конвертирует неструктурированную мультиязычную речь в форматированный текст. Также заявлен генератор Create My Widget для создания кастомных виджетов рабочего стола по текстовому промпту. Первыми доступ к системе получат смартфоны Samsung Galaxy S26 и Google Pixel 10, релиз которых ожидается летом. До конца года Google планирует развернуть инструменты на смарт-часах, ноутбуках, гарнитурах и в автомобильных медиасистемах. blog.google ✔️ Artificial Analysis представил первый бенчмарк для кодинг-агентов Индекс замеряет производительность по 3-м метрикам: генерация кода (SWE-Bench-Pro-Hard-AA), работа в терминале (Terminal-Bench v2) и ответы на технические вопросы (SWE-Atlas-QnA). В первой редакции рейтинга Cursor CLI с Opus 4.7 набрал 61 балл, обойдя на 1 пункт OpenAI Codex (GPT-5.5) и Anthropic Claude Code (с Opus 4.7). При использовании одинаковой модели решение Cursor точнее нативного Claude Code, но уступает в скорости и цене: 7,8 минуты и $1,47 за задачу против 5,8 минуты и $1,24 у агента Anthropic. Самым дешевым вариантом оказался встроенный в Cursor движок Composer 2 - всего 7 центов за выполнение теста. Deepseek v4 Pro (35 центов) и Kimi K2.6 (76 центов) тоже довольно бюджетны, но проигрывают лидерам в скорости: 18 и 41,5 минуты на задачу соответственно. artificialanalysis.ai @ai_machinelearning_big_data #news #ai #ml

298 057

LLM — это не новая профессия — это апгрейд к твоей текущей. Backend, ML, DevOps — добавляешь LLM → растёшь в задачах, деньгах и грейде Записывайся на новый поток курса LLM-инженер от AI Talent Hub и GIGASCHOOL🚀 Сейчас уже недостаточно просто знать RAG, рынок ищет тех, кто умеет собирать сложные AI-системы и доводить их до продакшена. Поэтому мы пересобрали программу, сохранили фундаментальную базу и усилили практическую часть, чтобы ты смог:

📁 Освоить стек LLM-инженера: трансформеры, RAG (retrieval, reranking, eval), агенты, LLMOps, vLLM/SGLang, observability 📁 Вырости в грейде: перейти от простых интеграций к проектированию AI-систем с учётом latency, cost и scaling 📁 Пройти весь цикл создания LLM-продукта: от дообучения (QLoRA, PEFT) до production-сервиса с нагрузкой и мониторингом 📁 Получить фундамент по LLM: освоить, как устроены модели, механика инференса и оптимизации - не только вызов API 📁 Освоить редкие навыки: AI Red Teaming и обеспечением безопасности агентных систем 📁 Работать с реальными инженерными задачами: observability, оценка качества 📁 Учиться у практикующих экспертов из индустрии, которые собирают и развивают AI-системы в продакшене

Что будет в твоём GitHub: ✔️ Опыт дообученния LLM/энкодер под домен ✔️RAG над корпоративной базой ✔️Мультиагентная система ✔️Production-сервис в Docker ✔️Observability и отчет по безопасности Формат: онлайн-семинары Старт: 4 июня Длительность: 6 месяцев До четверга — самая низкая цена, дальше повышение 🔜Посмотреть программу и попасть в поток

298 057

✔️ Конгресс США начал расследование против Сэма Альтмана Комитет по надзору Палаты представителей США направил официальное письмо Сэму Альтману с требованием раскрыть детали его личных инвестиций и финансовые связи с топ-менеджментом. Власти подозревают, что ресурсы OpenAI могли использоваться для искусственного завышения капитализации компаний, в которых CEO имеет личную долю. Главным поводом для расследования стала ситуация вокруг разработчика термоядерных реакторов Helion. В 2021 году Альтман вложил в него $375 млн из собственных средств, а позже предложил OpenAI инвестировать в проект еще $500 млн. Эта сделка могла увеличить оценку Helion в шесть раз - до $35 млрд. Согласно документам комитета, сотрудники OpenAI были настолько встревожены инициативой, что избегали ее обсуждения в корпоративном Slack из-за страха перед возможным судебным преследованием. Расследование также выявило непубличные связи внутри руководства компании: выяснилось, что президент OpenAI Грег Брокман владеет долями в двух стартапах Альтмана и имеет процент в его семейном фонде. Конгресс обязал OpenAI до 22 мая провести брифинг с участием главного юрисконсульта и предоставить всю внутреннюю переписку с 2015 года, касающуюся конфликтов интересов. Отдельно законодатели запросили доступ к отчета аудиторского комитета, созданного советом директоров OpenAI после скандального увольнения и возвращения Альтмана в 2023 году. @ai_machinelearning_big_data #news #ai #ml

298 057

Кодер собрал «Википедию», где всё на 100% выдумано ИИ Проект называется Halupedia. На сайте нет заранее написанных статей. Каждая страница появляется только в тот момент, когда ты её открываешь. Правило одно: эта вселенная существует только пока на неё кто-то смотрит. Выглядит всё почти как Wikipedia: шрифты, верстка, академический тон, ссылки, случайная статья через stumble. Только есть маленький нюанс - ничего из этого не существовало до клика. Примеры статей там уже сами по себе прекрасны: - Великая перепись голубей 1887 года - Министерство слегка неправильных карт - Халдическая арифметика - раздел математики, где запрещено вычитание - Армунд, картограф рек - человек, который нанес на карту 14 000 лиг рек, не вставая со стула - Общество по предотвращению ненужных вторников На странице ещё показывается, сколько людей читают статью прямо сейчас. Обычно там фраза в духе: «вы один сейчас изучаете этот фолиант». Но лучший поинт - описание от автора: «Энциклопедия вселенной, которая не существует, пока вы её не посетите». Бэкенд тоже в тему: open-source репозиторий vibeserver с описанием «маленький веб-сервер, который придумывает вещи ровно вовремя». Мы построили крупнейшую базу знаний в истории человечества, а потом кто-то сделал её кривое галлюцинирующее отражение и выложил в открытый интернет. Вот это уже нормальное использование ИИ. halupedia.com @ai_machinelearning_big_data

298 057

📌Модели при длительной работе с документами в среднем теряют около четверти их содержимого Команда Microsoft Research опубликовала препринт, в который демонстрирует, что современные LLM при долгом редактировании документов вносят редкие, но серьёзные искажения. Для проведения эксперимента был создан бенчмарк DELEGATE-52 из 310 рабочих сценариев в 52 областях, от программирования и кристаллографии до нотной записи и генеалогии. Методика тестирования основана на принципе обратимости: модель получает задание изменить документ, а затем - обратную инструкцию, которая должна вернуть его к исходному виду. Чем сильнее итоговый файл отличается от оригинала, тем больше накопленных ошибок. В эксперименте прогнали 19 моделей, включая GPT-5.4, Claude 4.6 и Gemini 3.1 Pro на документах в 3–5 тысяч токенов и контекстом до 12 тысяч токенов. По результатам эксперимента, после 20 последовательных правок эти 3 модели в среднем повреждают около 25% содержимого документа, а среднее значение по всей выборке составило около 50% потерь. Лучший результат показала Gemini 3.1 Pro: она признана готовой к делегированию (≥98% сохранения исходного содержания) только в 11 из 52 областей.

Единственная область, где большинство моделей справляется почти без потерь, — программирование на Python: 17 из 19 моделей сохраняют код практически без искажений.

Хуже всего модели работают с тестом и редкими форматами: рецептами, художественной прозой, нотами и финансовыми отчетами. Дополнительные тесты показали, что подключение агентских инструментов поиска, выполнения кода, прямой правки файлов - в базовой реализации не улучшает результат, а в среднем добавляет около 6% потерь.

Авторы заметили, что объём документа, длина взаимодействия и наличие посторонних файлов в контексте также ухудшают качество, причём эти эффекты, накапливаются и со временем усиливают друг друга.

По наблюдениям, потери распределены неравномерно: чаще всего модель работает почти безупречно, но раз в несколько шагов допускает резкий сбой и теряет 10–30% содержимого за одну итерацию. Такое поведение объясняет около 80% всех зафиксированных потерь. Слабые модели чаще удаляют фрагменты целиком, топовые - искажают то, что остаётся в документе. 📌Лицензирование: MIT License 🟡Arxiv 🟡Датасет 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #DELEGATE52 #Microsoft

298 057

🌟 Poolside открыл публичный доступ к кодинг-моделям Стартап Poolside открыл публичный доступ к своим кодинг-моделям линейки Laguna. До этого компания работала только с клиентами из государственного и публичного сектора. Релиз подготовила команда ~60 человек.

Poolside - стартап в области генеративного ИИ для разработки ПО, основанный в апреле 2023 года. Компанию возглавляют бывший технический директор GitHub, курировавший запуск Copilot, и ex-основатель source{d} - одной из первых компаний, применивших ИИ для анализа кода.

🟡Флагман - проприетарная MoE-модель Laguna M.1 (225B-A23B). SWE-bench Pro - 46,9% SWE-bench Verified - 72,5% Terminal-Bench 2.0 - 40,7% Laguna M.1 доступна через API и OpenRouter. На ограниченное время - бесплатно. 🟡Открытая модель - Laguna XS.2 (33B-A3B) SWE-bench Pro - 44,5% Verified - 68,2% Terminal-Bench 2.0 - 30,1%. Заявлены: поддержка NVIDIA TensorRT-LLM и NVFP4-версия для Blackwell. Laguna XS.2 распространяется по лицензии Apache 2.0 через API, OpenRouter, Ollama и на HuggingFace. Говорят, что локально запускается на Mac с 36 ГБ памяти Вместе с моделями Poolside предлагает агентную обвязку на базе Agent Client Protocol, на которой тестировались модели и проводился RL. @ai_machinelearning_big_data #news #ai #ml

298 057

✔️ Релиз Ernie 5.1: треть параметров Ernie 5.0 и 4 место в Arena Search Leaderboard Baidu выпустила языковую модель Ernie 5.1 с закрытыми весами. Затраты на претрейн составили 6% от типичного бюджета для моделей этого класса. Новинка построена на базе Ernie 5.0, но содержит треть от общего числа параметров и использует вдвое меньше активных параметров при инференсе.

В Arena Search Leaderboard модель заняла 1 место среди китайских сетей и 4 в мире. По заявлению Baidu, в тестах агентов Ernie 5.1 обходит DeepSeek-V4-Pro, а в логике и математике сопоставима с Gemini 3.1 Pro.

Экономия вычислений достигнута за счет методики Once-For-All. Baidu обучала семейство моделей за один проход: сети делят общие веса, варьируясь по глубине и количеству активных блоков MoE.

Основной претрейн выполнили при создании Ernie 5.0, для версии 5.1 потребовалось только извлечь оптимальную конфигурацию.

Для борьбы с эффектом качелей (падение креативности при улучшении логики) применили четырехэтапный файнтюн: SFT, параллельная тренировка узкоспециализированных экспертов, дистилляция их навыков в единую модель-ученика и финальный RL. Доступ к Ernie 5.1 открыт через онлайн-площадки компании. @ai_machinelearning_big_data #news #ai #ml