Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Больше📈 Аналитический обзор Telegram-канала Machinelearning
Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 299 926 подписчиков, занимая 323 место в категории Технологии и приложения и 1 247 место в регионе Россия.
📊 Показатели аудитории и динамика
С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 299 926 подписчиков.
Согласно последним данным от 02 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -7 825, а за последние 24 часа — -229, при этом общий охват остаётся высоким.
- Статус верификации: Не верифицирован
- Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.75%. В первые 24 часа после публикации контент обычно набирает 5.51% реакций от общего числа подписчиков.
- Охват публикаций: В среднем каждый пост получает 23 264 просмотров. В течение первых суток публикация набирает 16 546 просмотров.
- Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 179.
- Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.
📝 Описание и контентная политика
Автор описывает ресурс как площадку для выражения субъективного мнения:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Благодаря высокой частоте обновлений (последние данные получены 03 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.
В сообществе разработчиком высказывались предположения, что резкое сокращение доступных квот связано с новой версией функции Dynamic Workflows. Anthropic это опровергла.Согласно пояснению, причина кроется в особенностях обработки запросов к Opus 4.8: из-за них модель инициировала больше одновременных вызовов инструментов, чем было заложено. Сам сбой, как утверждается, уже устранён. @ai_machinelearning_big_data #news #ai #ml
На открытии выступили: глава Nvidia Дженсен Хуанг (по видеосвязи), гендиректор Qualcomm Кристиано Амон и создатель OpenClaw Питер Штайнбергер.В первый день компания представила несколько групп продуктов и сервисов. 🟡Новые модели Гендиректор Microsoft AI Мустафа Сулейман анонсировал семейство из 7 новых моделей MAI для работы с изображениями, голосом, транскрипцией и кодом. Среди названных - MAI‑Thinking‑1 (ризонинг-модель, обученная без дистилляции с 35 млрд активных параметров и окном контекста 128K), MAI‑Code‑1-Flash (заточена под GitHub и VS Code), а также MAI‑Image‑2.5 и MAI‑-Voice-2. 🟡Агенты Microsoft представила новую категорию Autopilots, всегда активных агентов с собственной идентичностью, работающих в фоне и действующих от имени пользователя. Первым стал Scout - персональный ассистент в Windows, построенный на OpenClaw. Он работает с приложениями Microsoft 365 и предназначен для фоновых задач (ведение календаря, отчётности по расходам и подготовка писем). Scout доступен в режиме превью для клиентов программы Frontier в США. Также анонсирован Microsoft IQ, слой контекста для агентов (Work IQ, Fabric IQ, Web IQ), который станет общедоступным в GitHub Copilot, Foundry и Copilot Studio. 🟡Инструменты для разработчиков Сообщили о запуске десктопного приложения GitHub Copilot (в режиме предварительного доступа), функции Frontier Tuning для дообучения агентов в рамках корпоративных требований (закрытый превью), а также Project Rayfin - управляемого бэкенда на платформе Microsoft Fabric. Windows получает функции для разработчиков: набор Coreutils (Linux-подобные утилиты командной строки, работающие в Windows 11 нативно), создание и запуск Linux-контейнеров через WSL и новый Intelligent Terminal, передающий контекст ИИ-агенту. Отдельно показали платформу Project Solara для устройств, которые работают на ИИ‑агентах. Microsoft показала два референс‑дизайна (настольный хаб с распознаванием лица и носимый бейдж с камерой и расшифровкой разговоров). 🟡Облако и инфраструктура Анонсировали виртуальные машины Azure Cobalt 200 (сказали о приросте производительности на 50%), ускоритель второго поколения Maia 200, базу данных Azure HorizonDB на основе PostgreSQL, а также Foundry Local на Azure Local для развёртывания суверенного ИИ. 🟡Квантовые вычисления и медицина Спустя год после чипа Majorana 1 Наделла представил Majorana 2 - следующее поколение, компания заявляет о кубитах примерно в 1000 раз точнее за счёт нового материала на основе свинца и о цели создать квантовый компьютер к 2029 году.
На второй, заключительный день конференции, ожидаются технические сессии и демонстрации по агентам, Copilot, Azure Foundry и локальному ИИ в Windows.@ai_machinelearning_big_data #news #ai #ml
openclaw plugins uninstall openclaw-hy-memory
📷Project & Download:
https://memory.hunyuan.tencent.com
📷 OpenClaw Docs:
https://memory.hunyuan.tencent.com/openclaw/
@ai_machinelearning_big_dataПо его словам, часть изменений уже действует, остальные находятся в разработке.Перечень мер выглядит так: 🟢Исправлена ошибка, из-за которой квоту почти полностью расходовали одно-два видео в режиме Omni. Для подписчиков тарифа Ultra число доступных генераций Omni-видео уже удвоено. 🟢Сложные запросы к модели 3.1 Pro, особенно с прикреплёнными большими файлами, тоже быстро исчерпывали лимит. Теперь вводится ограничение на максимальный объём квоты, который может уйти на один запрос. 🟢За неудавшиеся запросы плата взиматься не будет: если запрос завершился ошибкой, квота не списывается и расходуется только на успешно выполненные операции. 🟢Запросы к модели Flash-Lite станут бесплатными и не будут учитываться в лимите. 🟢Для ресурсоёмких задач, например Deep Research, создается более подробная статистика расхода квоты и уведомления, которые должны помочь планировать нагрузку. 🟢Выбранная модель будет сохраняться во всех последующих сессиях. Смена произойдёт только при ручной перенастройке или при достижении лимита, когда система автоматически переключится на более лёгкую модель. Сроков завершения работ по тем пунктам, которые ещё дорабатываются, Вудворд не назвал. @ai_machinelearning_big_data #news #ai #ml
VLA-модели получают на вход изображение с камеры и текстовую команду, а на выходе выдают конкретные действия для робота.Новинка построена на VL-основе Qwen3.5-4B и дополнена декодером действий на 1,15 млрд параметров. Модель объединяет 3 типа задач: манипуляции (захват и перемещение предметов), навигацию и прогнозирование траекторий, а переключение между разными роботами требует лишь изменения текстовой инструкции. Qwen-VLA не уступает специализированным системам, обученным под каждую отдельную задачу - GR00T (разработка NVIDIA) и π0.5 (Physical Intelligence). На наборе тестов LIBERO Qwen-VLA показала 97,9%, на RoboTwin-Hard - 87,2%, а в экспериментах с двуруким роботом ALOHA средний процент успешных выполнений в знакомых условиях составил 83,6% и 76,9% в незнакомых. Пока опубликован технический отчет и создан репозиторий проекта, о доступности самих моделей не сообщается. @ai_machinelearning_big_data #news #ai #ml
Языковые модели обычно знают уже состоявшиеся открытия из обучающих данных, поэтому при прямом вопросе об известном результате легко дают верный ответ.CUSP это блокирует: для события, скажем, 2025 года модели разрешают опираться только на сведения, доступные до этой даты.
Говоря проще, систему возвращают в прошлое и заставляют предсказывать будущее вслепую.В основу теста легли 4760 научных событий за январь 2024 - март 2026 годов из журналов Nature, Science, Cell и подборок заметных работ по ИИ. На этой базе было сформировано 17 429 заданий. В прогонах принимали участие GPT-5.4, Claude Sonnet 4.5, DeepSeek R1 и GPT-OSS 20B. 🟡Результаты Выбрать правдоподобное техническое направление смогли - на вопросах с выбором ответа GPT-5.4 показала точность 81,9%. Но определить, будет ли конкретное достижение вообще реализовано, модели почти не способны: точность держалась в пределах 45–52%, что близко к подбрасыванию монеты. Сроки все модели называли с запаздыванием: медианная ошибка GPT-5.4 составила 14 месяцев, Claude Sonnet 4.5 - 17, а вот LLaMA 3.3 оказалась самой точной - 4 месяца. В задачах на проектирование решения даже лучший результат (5,04 из 10 у GPT-5.4) не попадал в реально применённый позже технический путь.
Рисёрч отмечает деталь: качество прогноза почти не зависело от того, относится событие к периоду до или после среза знаний модели.Это означает, что дело не только в нехватке данных. Доступ к дополнительной информации повышает результаты, но не закрывает разрыв, причём для самых цитируемых работ он был заметнее. До кучи - модели систематически переоценивали уверенность в своих ответах. 🟡Вывод LLM пока выступают скорее ретроспективными толкователями уже известных результатов, чем надёжными предсказателями будущих. 📌Лицензирование: MIT License 🟡Страница проекта 🟡Arxiv 🟡Датасет 🖥Github @ai_machinelearning_big_data #AI #ML #LLM #Research #Science #Benchmark
KV-кэш - структура, в которой модель хранит промежуточные представления токенов при генерации. На длинных контекстах он занимает значительную часть памяти GPU, и его сжатие позволяет либо обслуживать больше запросов одновременно, либо ускорять чтение из памяти. Прежние попытки сжать кэш до 2-х бит ухудшали качество ответов.OSCAR обходит это ограничение за счёт того, что поворот активаций перед квантованием рассчитывается исходя из статистики внимания. Метод предлагает сначала собрать на калибровочном наборе ковариационные матрицы запросов и значений, взвешенных оценками внимания, и из них вывести персональный поворот для ключей и значений каждого слоя. После этого применяется преобразование Адамара, выравнивающее значимость каналов, и перестановка с побитовым реверсом, чтобы соседние каналы попадали в один диапазон при поквантовом сжатии. Первые 64 и последние 256 токенов контекста при этом хранятся в полной точности BF16 как опорные, всё остальное - в 2-х битах. Калибровка выполняется один раз, поворот и пороги отсечения фиксируются, а онлайн-наценка по вычислениям скрывается внутри ядер декодирования. 🟡Тесты На задачах AIME25, GPQA-Diamond, HumanEval, LiveCodeBench v6, MATH500 метод удерживается близко к точности базового режима BF16. Разрыв составляет 3,78 пункта на Qwen3-4B-Thinking-2507, 1,42 пункта на Qwen3-8B и около нуля на Qwen3-32B и GLM-4.7-FP8. 🟡Результаты на длинных контекстах По бенчмарку RULER-NIAH OSCAR работает стабильнее остальных двухбитных методов, но для меньших моделей разрыв с BF16 растёт по мере увеличения контекста: на Qwen3-4B-Thinking-2507 при 128 тыс. токенов точность падает с 81,0 до 39,5 пункта. Для GLM-4.7-FP8 кривая практически совпадает с BF16. В замерах на NVIDIA H100 скорость декодирования при контексте в 100 тыс. токенов выросла в 2,8–3,1 раза относительно BF16. OSCAR совместим с paged attention и встраивается в SGLang без изменений на стороне клиента. Для экспериментов Together AI выложила предвычисленные матрицы для Qwen3-4B-Thinking, Qwen3-8B, Qwen3-32B и GLM-4.7-FP8. 📌Лицензирование: Apache 2.0 License 🟡Страница проекта 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #Quantization #OSCAR #TogetherAI
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
