Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
نمایش بیشتر📈 تحلیل کانال تلگرام Machinelearning
کانال Machinelearning (@ai_machinelearning_big_data) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 298 105 مشترک است و جایگاه 323 را در دسته فناوری و برنامهها و رتبه 1 260 را در منطقه روسيا دارد.
📊 شاخصهای مخاطب و پویایی
از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 298 105 مشترک جذب کرده است.
بر اساس آخرین دادهها در تاریخ 11 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -7 224 و در ۲۴ ساعت گذشته برابر -206 بوده و همچنان دسترسی گستردهای حفظ شده است.
- وضعیت تأیید: تأیید نشده
- نرخ تعامل (ER): میانگین تعامل مخاطب 7.69% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.95% واکنش نسبت به کل مشترکان کسب میکند.
- دسترسی پستها: هر پست به طور میانگین 22 918 بازدید دریافت میکند. در اولین روز معمولاً 17 745 بازدید جمعآوری میشود.
- واکنشها و تعامل: مخاطبان بهطور فعال حمایت میکنند؛ میانگین واکنش به هر پست 176 است.
- علایق موضوعی: محتوا بر موضوعات کلیدی مانند openai, claude, api, gemini, контекст تمرکز دارد.
📝 توضیح و سیاست محتوایی
نویسنده این فضا را محل بیان دیدگاههای شخصی توصیف میکند:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
به لطف بهروزرسانیهای پرتکرار (آخرین داده در تاریخ 12 ژوئن, 2026)، کانال همواره بهروز و دارای دسترسی بالاست. تحلیلها نشان میدهد مخاطبان بهطور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامهها تبدیل کردهاند.
С 15 июня 2026 года запросы к Claude Agent SDK и сторонним приложениям перестанут учитываться в рамках общих квот для подписок Pro, Max, Team и Enterprise. Anthropic переводит автоматизацию на отдельный счет: теперь пользователям выделяется жесткий ежемесячный баланс, например, $20 для тарифов Pro и до $200 для топовых планов. При исчерпании этого лимита работа агентов полностью блокируется до начала нового расчетного периода. Чтобы продолжить использование сторонних интеграций, клиентам придется включить extra usage и дополнительно оплачивать запросы по тарифам API.Ситуацию усугубляет то, что неиспользованные остатки кредитов сгорают, а корпоративные клиенты не могут объединять индивидуальные квоты разработчиков в общий командный пул. Сообщество разработчиков встретило этот шаг Anthropic волной критики, расценив его как скрытое сокращение лимитов. OpenAI оперативно воспользовалась хэйтом, предложив корпоративным командам выгодную альтернативу без финансовых рисков при миграции. Подать заявку на получение бесплатного доступа можно через сайт OpenAI или с помощью промокодов от партнерских площадок. @ai_machinelearning_big_data #news #ai #ml
мы всё ещё точим мечи, а у соперника внезапно появился полностью автоматический пулемёт Гатлинга».Этот эпизод Anthropic подаёт как репетицию будущего. При таком темпе ускорения отставание даже в несколько месяцев превращается в качественно другой уровень возможностей. Два сценария на 2028 год выстроены вокруг одной развилки - что сделает Вашингтон в ближайшие месяцы. В сценарии лидерства США закрывают лазейки в экспортном контроле, давят дистилляцию, ускоряют экспорт американского ИИ-стека и получают отрыв в 12-24 месяца по фронтиру. Этот отрыв самоусиливается: лидерство притягивает таланты и капитал, расширяет коалицию союзников, даёт США рычаги для диалога с Пекином, включая темы безопасности. В сценарии паритета Вашингтон оставляет всё как есть. Китайские лаборатории за счёт удалённого компьюта и продолжающейся дистилляции выходят на околофронтирный уровень. Huawei и Alibaba занимают рынки Глобального Юга дешёвыми и достаточно качественными моделями, а нормы применения ИИ начинают формироваться под влиянием авторитарных режимов. Отдельный важный блок - безопасность китайских моделей. Anthropic ссылается на оценку CAISI: DeepSeek R1-0528 под распространённым джейлбрейком выполняет 94% явно вредоносных запросов против 8% у американских референсных моделей. Независимая проверка Kimi K2.5 от Moonshot показала похожую картину на CBRN-тематике. Открытые веса делают проблему острее. После публикации модели встроенные ограничения можно снять, и любой актор получает доступ к её возможностям. На уровне политики Anthropic предлагает четыре шага: - ужесточить экспортный контроль на чипы и оборудование для их производства - закрыть лазейку с удалённым доступом к зарубежным мощностям - законодательно квалифицировать distillation attacks как незаконную практику - продолжать продвигать американский ИИ-стек на внешних рынках По расчётам, на которые ссылается компания, при ужесточении ограничений у американского сектора будет примерно в 11 раз больше компьюта, чем у китайского. Любопытна и сама форма высказывания. Anthropic окончательно вышел за рамки роли исследовательской лаборатории - это полноценный лоббистский документ, оформленный как ресёрч. Оригинал: https://www.anthropic.com/research/2028-ai-leadership @ai_machinelearning_big_data #anthropic
Стартап основали в ноябре 2024 года Армен Агаджанян и Акшат Шривастава - бывшие научные сотрудники подразделения FAIR Марка Цукерберга, соавторы работ по мультимодальным архитектурам Chameleon и MoMa.Perceptron AI позиционирует Mk1 как инструмент для видеонаблюдения, инспекции оборудования, инвентаризации складов, аналитики безопасности и автоматической разметки обучающих данных для роботов. Модель обрабатывает видео с частотой до 2-х кадров в секунду и отслеживает объекты между кадрами, в том числе при их частичном перекрытии. Mk1 работает в гибридном режиме: цепочку рассуждений можно включать или отключать на уровне отдельного запроса. Для видео доступна разметка временных меток событий; для изображений - детекция объектов, подсчёт, распознавание текста, разбор сложных документов в HTML, JSON или Markdown, а также вывод геометрических примитивов (точек, рамок и полигонов), которые могут использоваться робототехническими системами. По бенчмаркам, опубликованным самой Perceptron, модель в задачах работы с изображением, видео и пространственным рассуждением сопоставима с топовыми моделями Google, Anthropic, OpenAI и Qwen, а в ряде тестов опережает их.
В частности, на EmbSpatialBench модель набрала 85,1 балла против 78,4 у Google Robotics-ER 1.5.Модель доступна через API и площадку OpenRouter. Попробовать Mk1 можно на сайте стартапа.
Заявленная цена: 15 центов за миллион входных токенов и 1,50 доллара за миллион выходных, контекстное окно - 32 тыс. токенов.@ai_machinelearning_big_data #news #ai #ml
ProgramBench - набор реальных задач программирования, в которых агент должен с нуля переписать утилиту с открытым исходным кодом и пройти при этом скрытые поведенческие тесты.🟡Лидерборд выглядит так 🟢GPT 5.5 (xhigh) - 1 место: 0,5% полностью решённых задач и 13,5% почти решённых (то есть проходящих свыше 95% поведенческих тестов) 🟠GPT 5.5 (high) - те же 0,5% при 5% почти решённых 🟠Claude Opus 4.7 (xhigh) показала 0% и 4,5%, обычная версия Opus 4.7 - 0% и 3% 🟠Opus 4.6 - 0% и 2,5% соответственно Совокупно число почти решённых задач у GPT 5.5 достигло 26, это рекорд рейтинга.
Примечательно, что в режиме medium, который OpenAI выставляет по умолчанию, GPT 5.5 лишь незначительно опережает Claude Sonnet 4.6. При включении расширенного рассуждения её результат заметно улучшается.🟡Разброс по стоимости Запуск GPT 5.5 (high) стоил $3,17 и потребовал 34 обращения к API, GPT 5.5 (xhigh) - $4,84 и 40 обращений. Тот же запуск Claude Opus 4.7 (xhigh) обошёлся в $10,74 при 178 обращениях, однако решение содержало 19 ошибок в поведенческих тестах. По разбору авторов, все провалы объясняются 2-мя багами в коде Claude: чувствительностью парсера цветов к регистру и неверным кодом возврата.
Интересно, что 2 версии GPT 5.5 выбрали разные языки для одной и той же задачи: high решала на C с ANSI escape-последовательностями, xhigh предпочла Python. Claude Opus 4.7 (xhigh) использовала библиотеку ncurses и команда бенчмарка охарактеризовала этот подход как креативное системное решение, которое, впрочем, не дало преимущества в итоговом результате.@ai_machinelearning_big_data #news #ai #ml
На H100 это даёт до 30% к инференсу, до 24% к скорости обучения и более чем 24% снижения пикового VRAM при трейне. Работа заявлена на ICML 2026.В FFN-блоках современных LLM для каждого токена реально работает малая доля скрытых активаций - остальное болтается около нуля и впустую тратит вычисления. Если поверх ReLU добавить вспомогательный L1-лосс на скрытые активации прямо во время обучения, долю нулей можно загнать выше 95% без видимой просадки на downstream-задачах. Проблема в том, что, что тензорные ядра H100 заточены под плотные матричные умножения и тайлинг. Если скормить им обычный ELLPACK, то теоретическая экономия убивается накладными расходами: построчная упаковка не ложится на тайловую структуру, появляются синхронизации между CTA и лишний трафик в HBM. 🟡Вот тут и решает TwELL Колонки активаций гейта бьются на горизонтальные тайлы. Внутри каждого тайла лежат только ненулевые значения и их индексы в локальном ELL-формате. Размер тайла подобран так, чтобы каждая CTA паковала свой кусок прямо в разделяемой памяти без синхронизаций между блоками и без лишних обращений к глобальной памяти. Дальше - 2 разных ядра: 🟢Инференс
Up- и down-проекции выполняются в одном ядре. Плотная матрица скрытых активаций вообще не материализуется: ядро пробегается по упакованным нулям, подтягивает только нужные строки Wu и Wd и считает скалярное произведение.🟠Обучение
Гибридное представление: каждая строка либо ужимается в один глобально выровненный разреженный блок, либо в редких случаях переполнения падает в плотный резерв. Результат - обратный проход без единого умножения двух плотных матриц.Интересный момент: даже без учёта разреженности кастомные TwELL-ядра вышли чуть быстрее плотных матмулов из PyTorch и CuDNN, в основном за счёт переиспользования ядер, совмещения загрузки данных с вычислениями и оптимизированных шаблонов доступа к памяти. 🟡Цифры на H100 (замер по модели 1.5B) 🟢до 30% ускорения на пакетном инференсе; 🟢до 24% ускорения на обучении; 🟢пиковый VRAM при обучении падает более чем на 24%; 🟢энергопотребление GPU - примерно на 3% ниже. 🟡Скейлинг Считали на моделях 0.5B–2B. При фиксированном L1 у 2B доля ненулевых активаций на 38% меньше, чем у 0.5B (крупнее модель, охотнее уходит в разреженность). На 2B инференс быстрее на 20.5%, обучение - на 21.9%, и в память влезает вдвое больший микробатч. 🟡Очевидные минусы
Кастомные CUDA-ядра привязаны к NVIDIA: альтернативное железо и PyTorch - мимо. Эксперименты упираются в 2B, как поведёт себя более крупная модель, никто не проверял.📌Лицензирование: MIT License 🟡Блогпост 🟡Arxiv 🖥Github @ai_machinelearning_big_data #AI #ML #LLM #TwELL #SakanaAI #NVIDIA
📁 Освоить стек LLM-инженера: трансформеры, RAG (retrieval, reranking, eval), агенты, LLMOps, vLLM/SGLang, observability 📁 Вырости в грейде: перейти от простых интеграций к проектированию AI-систем с учётом latency, cost и scaling 📁 Пройти весь цикл создания LLM-продукта: от дообучения (QLoRA, PEFT) до production-сервиса с нагрузкой и мониторингом 📁 Получить фундамент по LLM: освоить, как устроены модели, механика инференса и оптимизации - не только вызов API 📁 Освоить редкие навыки: AI Red Teaming и обеспечением безопасности агентных систем 📁 Работать с реальными инженерными задачами: observability, оценка качества 📁 Учиться у практикующих экспертов из индустрии, которые собирают и развивают AI-системы в продакшенеЧто будет в твоём GitHub: ✔️ Опыт дообученния LLM/энкодер под домен ✔️RAG над корпоративной базой ✔️Мультиагентная система ✔️Production-сервис в Docker ✔️Observability и отчет по безопасности Формат: онлайн-семинары Старт: 4 июня Длительность: 6 месяцев До четверга — самая низкая цена, дальше повышение 🔜Посмотреть программу и попасть в поток
Единственная область, где большинство моделей справляется почти без потерь, — программирование на Python: 17 из 19 моделей сохраняют код практически без искажений.Хуже всего модели работают с тестом и редкими форматами: рецептами, художественной прозой, нотами и финансовыми отчетами. Дополнительные тесты показали, что подключение агентских инструментов поиска, выполнения кода, прямой правки файлов - в базовой реализации не улучшает результат, а в среднем добавляет около 6% потерь.
Авторы заметили, что объём документа, длина взаимодействия и наличие посторонних файлов в контексте также ухудшают качество, причём эти эффекты, накапливаются и со временем усиливают друг друга.По наблюдениям, потери распределены неравномерно: чаще всего модель работает почти безупречно, но раз в несколько шагов допускает резкий сбой и теряет 10–30% содержимого за одну итерацию. Такое поведение объясняет около 80% всех зафиксированных потерь. Слабые модели чаще удаляют фрагменты целиком, топовые - искажают то, что остаётся в документе. 📌Лицензирование: MIT License 🟡Arxiv 🟡Датасет 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #DELEGATE52 #Microsoft
Poolside - стартап в области генеративного ИИ для разработки ПО, основанный в апреле 2023 года. Компанию возглавляют бывший технический директор GitHub, курировавший запуск Copilot, и ex-основатель source{d} - одной из первых компаний, применивших ИИ для анализа кода.🟡Флагман - проприетарная MoE-модель Laguna M.1 (225B-A23B). SWE-bench Pro - 46,9% SWE-bench Verified - 72,5% Terminal-Bench 2.0 - 40,7% Laguna M.1 доступна через API и OpenRouter. На ограниченное время - бесплатно. 🟡Открытая модель - Laguna XS.2 (33B-A3B) SWE-bench Pro - 44,5% Verified - 68,2% Terminal-Bench 2.0 - 30,1%. Заявлены: поддержка NVIDIA TensorRT-LLM и NVFP4-версия для Blackwell. Laguna XS.2 распространяется по лицензии Apache 2.0 через API, OpenRouter, Ollama и на HuggingFace. Говорят, что локально запускается на Mac с 36 ГБ памяти Вместе с моделями Poolside предлагает агентную обвязку на базе Agent Client Protocol, на которой тестировались модели и проводился RL. @ai_machinelearning_big_data #news #ai #ml
В Arena Search Leaderboard модель заняла 1 место среди китайских сетей и 4 в мире. По заявлению Baidu, в тестах агентов Ernie 5.1 обходит DeepSeek-V4-Pro, а в логике и математике сопоставима с Gemini 3.1 Pro.Экономия вычислений достигнута за счет методики Once-For-All. Baidu обучала семейство моделей за один проход: сети делят общие веса, варьируясь по глубине и количеству активных блоков MoE.
Основной претрейн выполнили при создании Ernie 5.0, для версии 5.1 потребовалось только извлечь оптимальную конфигурацию.Для борьбы с эффектом качелей (падение креативности при улучшении логики) применили четырехэтапный файнтюн: SFT, параллельная тренировка узкоспециализированных экспертов, дистилляция их навыков в единую модель-ученика и финальный RL. Доступ к Ernie 5.1 открыт через онлайн-площадки компании. @ai_machinelearning_big_data #news #ai #ml
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
