Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

Сеть:Machinelearning Россия1 270 Технологии и приложения328...

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 296 613 подписчиков, занимая 328 место в категории Технологии и приложения и 1 270 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 296 613 подписчиков.

Согласно последним данным от 18 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 298, а за последние 24 часа — -228, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.09%. В первые 24 часа после публикации контент обычно набирает 5.59% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 994 просмотров. В течение первых суток публикация набирает 16 583 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 193.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Благодаря высокой частоте обновлений (последние данные получены 19 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

296 613

Подписчики

-22824 часа

-1 4277 дней

-6 29830 день

23 994

Просмотры поста

~ 16 58324 часа

~ 18 64448 часов

8.09%

Коэффициент вовлеченности

~ 6

Постов в день

Ads index

beta

Архив постов

296 525

🔥 VLMgineer — когда робот сам себе конструктор Основная идея VLMgineer - путь к роботам, которые сами изобретают нужные приборы под конкретные задачи, экономя время инженеров и расширяя границы автоматизации. Что это ● Фреймворк, объединяющий Vision-Language-модель и эволюционный поиск. ● Полностью автоматизирует два процесса: 1) проектирует физический инструмент; 2) пишет пошаговый план, как этим инструментом пользоваться. Как это работает 1️⃣ VLM получает описание задачи («забей гвоздь», «разбей лёд») и создаёт начальный эскиз инструмента + набор движений робота. 2️⃣ Симуляция проверяет, насколько успешно связка «инструмент + действие» решает задачу. 3️⃣ Эволюционный алгоритм вносит правки (меняет форму, размеры, материалы), VLM уточняет план. 4️⃣ Цикл повторяется, пока не найден оптимальный дизайн. Никаких шаблонов и ручной настройки — всю «физическую креативность» выполняет модель. Исследователи протестировали возможности VLMgineer по созданию инструментов и планов действий в сравнении с тремя типами участников: • специалист по LLM • эксперт по робототехнике • обычный человек без технического бэкграунда 📊 Результаты: VLMgineer показал на 64,7% более высокий средний успех выполнения задач, чем решения, предложенные людьми, скоро обещают дропнуть код проекта. 🔜 Подробнее: vlmgineer.github.io/release @ai_machinelearning_big_data #ai #robots #vlm

296 525

🌟 Reinforcement Learning Teachers: как модели на 7B параметров обучают гигантов. Reinforcement Learning Teachers (RLT) от Sakana AI - метод обучения LLM рассуждениям, где компактная модель-"учитель" не решает задачи сама, а учится объяснять уже готовые решения так, чтобы студент-модель лучше их усваивала. Вместо дорогого обучения "с нуля" через проб и ошибку (как в классическом RL), учитель фокусируется на ясности пошаговых пояснений, используя и вопрос, и правильный ответ как подсказку. Это радикально удешевляет процесс и выравнивает цель учителя быть полезным студенту. Архитектура строится вокруг петли обратной связи. Учителю (например, крошечной модели на 7B параметров) на вход подаются и задача и ее верное решение. Его работа - сгенерировать максимально понятное пошаговое объяснение, как прийти от условия к ответу. Эффективность учителя измеряется не тем, решил ли он задачу сам (он даже не обязан это уметь), а тем, насколько хорошо студент-модель понимает его объяснение. Ключевая метрика - "логарифмические вероятности": чем выше вероятность, что студент, прочитав объяснение учителя, правильно предскажет следующий шаг или итоговый ответ, тем лучше работа учителя. Это и есть сигнал подкрепления для обучения RLT. Вся магия метода состоит в этом смещении фокуса RL. Вместо чтоб награждать модель за самостоятельное нахождение ответа (что требует огромных вычислительных ресурсов и приводит к "узкой" специализации), RLT поощряют за педагогическую эффективность. Благодаря наличию готового ответа во время обучения, в роли учителя могут выступать даже небольшие, дешевые модели, которые не смогли бы решить сложные задачи в одиночку. Объяснения от RLT затем используются как высококачественные данные для обучения (дистилляции или "холодного старта") студент-моделей любого размера. Главный нюанс: метод требует наличия готовых правильных решений для задач в обучающем наборе. Он не заменяет полностью сбор данных, а перепрофилирует их для обучения "преподаванию". Пока метод тестировался в основном на задачах математики и естественных наук. Но его сила в эффективности: 7B RLT-учитель превосходит в обучении студентов-гигантов ( 671B DeepSeek R1). Он обучает даже студентов крупнее себя (32B) быстрее (менее суток против месяцев) и лучше, а его объяснения четче, без лишнего "шума" вроде юмора или подсказок калькулятора, свойственных традиционным RL-моделям. ▶️ Проект RLT открытый, в репозитории на Github опубликован код для воспроизведения экспериментов из техотчета, а на HF - тестовые модели учителей на 7 и 32 млрд. параметров, обученные на базе Qwen2.5 с помощью сета Bespoke-Stratos-17k. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #RL #RLT #SakanaAI

296 525

Поступи в магистратуру с грантом до 1,2 млн рублей Современная магистратура – это не пары для галочки, а возможность продвинуть карьеру и стать сильным специалистом. Центральный университет ведет набор на пять программ магистратуры по популярным ИТ-направлениям. Партнеры – ведущие компании на рынке РФ: ВТБ, Сбер, Т-Банк, Яндекс, Avito, Ozon, Х5 Tech и другие. 62% магистрантов ЦУ находят новую работу с ростом зарплаты в 1,6 раза уже на первом курсе. Средняя зарплата – 195 тысяч рублей. Обучение можно совмещать с работой, а поступить – уже с третьего курса. Стань частью новой волны специалистов и получи грант на обучение до 1,2 млн рублей. И подавай заявку на поступление уже сейчас. Реклама. АНО ВО "Центральный университет", ИНН 7743418023, erid:2Ranykywg6M

296 525

✔️ Mistral AI обновила модель Small до версии 3.2. Mistral AI выпустила минорное обновление Small, улучшив точность и стабильность. Инструкции теперь выполняются точнее, а повторяющиеся или бесконечные ответы встречаются вдвое реже, вызовы функций стали надежнее за счет более надежных шаблонов. Размер модели не изменился, 24B, Сравнение в бенчмарках с Small 3.1: в Wildbench v2 результаты выросли до 65.33% (на 10% выше, чем у версии 3.1), а в сложных сценариях Arena Hard v2 модель прибавила почти 24%. В задачах на логику (MMLU Pro) и программирование (HumanEval Plus) показатели улучшились на 2–4%. Правда, в некоторых визуальных тестах (MMMU) показатели снизились, но незначительно. Модель доступна на Hugging Face, сообщество уже сделало квантованные версии. huggingface.co ✔️ GitHub Copilot прекращает поддержку 4 моделей. С 7 июля по 6 августа 2025 года платформа постепенно отключит несколько версий моделей OpenAI: GPT-4.5, o1, o3-mini и GPT-4o, их заменят на более новые аналоги, GPT-4.1, о3 или o4-mini. Администраторам Copilot Enterprise нужно заранее активировать политики доступа к новым моделям в настройках, чтобы они появились в VS Code и интерфейсе GitHub. Удаление устаревших моделей после даты отключения произойдет автоматически. github.blog ✔️ Google Magenta RT: модель для создания музыки в реальном времени. Google выпустила Magenta RealTime (Magenta RT) - открытую ИИ-модель для живого создания музыки. Она генерирует по текстовым запросам и аудиосэмплам (можно комбинировать), используя Transformer с 800 миллионами параметров, обученный на 190 тысячах часов инструментальной музыки. Код и веса модели доступны на GitHub и Hugging Face. Попробовать Magenta RT в действии можно через бесплатный Colab-ноутбук с поддержкой TPU. Google обещает добавить возможность локального запуска и кастомизацию, а также опубликовать техотчет. magenta.withgoogle.com ✔️ Apple рассматривает приобретение Perplexity AI. Инсайдеры сообщают, что Apple ведет внутренние обсуждения о возможной покупке стартапа Perplexity. Глава M&A Адриан Перича и руководитель сервисов Эдди Кью уже обсудили идею с командой по вопросам ИИ. Пока переговоры находятся на ранней стадии, а официального предложения сделано не было. Согласно источникам, компания планирует внедрить ИИ-поиск в Safari, чтобы снизить зависимость от Google. Это решение может стать частью стратегии диверсификации ИИ-продуктов перед запуском новых функций в будущих версиях iOS или macOS. reuters.com ✔️ WormGPT эволюционирует: новые версии на базе Grok и Mixtral продаются по подписке в сети. Оригинальный WormGPT, созданный на основе GPT-J, стал первым массовым инструментом для киберпреступников, позволяя генерировать вредоносный код и фишинговые письма без цензуры. После его закрытия в 2023 году на форумах появились новые варианты: один работает на Grok от xAI, другой на Mixtral от Mistral AI. Вместо создания собственных моделей злоумышленники адаптируют существующие, используя jailbreak-промты, чтобы обойти защитные механизмы. Анализ, проведенный Cato CTRL показал, что keanu-WormGPT - это обертка Grok с измененным системным промтом, заставляющим нейросеть игнорировать ограничения. xzin0vich-WormGPT, в свою очередь, основан на Mixtral и обучен на данных с дарквеба. Оба проекта распространяются через Telegram-боты по подписке, коммерциализируя генерацию фишинга и вредоносного кода как услугу. catonetworks.com @ai_machinelearning_big_data #news #ai #ml

296 525

🚀 Alphabet (GOOGL) — теперь самая прибыльная компания в мире • Google сейчас удерживает титул лидера по чистой прибыли —111 млрд $ в год • Такая финансовая мощь даёт дополнительный импульс к развитиб AI-инфраструктуры компании • Ит-гигант уже консолидирует больше вычислительных ресурсов, чем кто-либо ещё • Финансовая стабильность позволяет вкладываться в новые центры обработки данных и R&D • За последний год Gemini вырос из нишевого решения в один из самых популярных и качественных LLM • Всё это ставит Google в исключительное положение для доминирования в будущем ИИ @ai_machinelearning_big_data #ai #googel #finance

296 525

📊 Yandex Cloud запустил курс по обработке и анализу больших данных на Apache Spark на Yandex Data Processing Это не просто «пособие на вечер» — это полноценный курс на 75 часов: теория, практика и сценарии под реальные задачи с многотерабайтными массивами на современном сервисе Yandex Data Processing. 🧠 Что внутри: 🔹 Проектирование архитектуры обработки данных 🔹 Управление кластерами Apache Spark 🔹 Data Lakehouse — от теории до реализации 🔹 Пакетная и потоковая обработка 🔹 Оркестрация и построение витрин 🔹 27 практических заданий прямо в Yandex Cloud Курс создали архитекторы Yandex Cloud и инженеры Hilbert Team. Все бесплатно, с неограниченным доступом и свидетельством о прохождении курса после финального теста на выходе. 💬 Подойдет дата-инженерам, аналитикам, DevOps и тем, кто хочет познать сферу Big Data с практической стороны. Присоединяйтесь! Ссылка на регистрацию — уже тут. @ai_machinelearning_big_data

296 525

🚀 Парадигма меняется: Polaris выводит локальные модели на новый уровень Polaris — это набор простых, но мощных приёмов, который позволяет даже компактным LLM (4 B, 7 B) догнать и превзойти «тяжеловесов» на задачах рассуждения (открытая 4B модель превосходи Claude-4-Opus). Вот как это работает и почему важно: • Управление сложностью данных – Генерируем несколько (например, 8) вариантов решения от базовой модели – Оцениваем, какие примеры слишком простые (8/8) или слишком сложные (0/8), и убираем их – Оставляем «умеренные» задачи с правильными решениями в 20–80 % случаев, чтобы быть ни слишком лёгкими, ни слишком сложными • Разнообразие «прогонов» (rollout-ов) – Мы запускаем модель несколько раз на одной и той же задаче и смотрим, как меняются её рассуждения: одни и те же входные данные, но разные «пути» к решению. – Считаем, насколько разнообразны эти пути (т. е. их «энтропия»): если модели всё время идут по одной линии, новых идей не появляется; если слишком хаотично — рассуждения неустойчивы. – Задаём начальную “температуру” генерации там, где баланс между стабильностью и разнообразием оптимален, а затем постепенно её повышаем, чтобы модель не застревала на одних и тех же шаблонах и могла исследовать новые, более креативные ходы. • “Train-short, generate-long” – Во время RL-обучения используем короткие цепочки рассуждений (короткие CoT) для экономии ресурсов – На inference увеличиваем длину CoT, чтобы получить более детальные и понятные объяснения без накрутки стоимости обучения • Динамическое обновление датасета – По мере роста точности удаляем примеры с accuracy > 90 %, чтобы не «портить» модель слишком лёгкими задачами – Поддерживаем постоянный вызов модели на её пределе возможностей • Улучшенная reward-функция – Комбинируем стандартный RL-reward с бонусами за разнообразие и глубину рассуждений – Это позволяет модели учиться не только давать правильный ответ, но и объяснять логику своих решений Преимущества Polaris • Благодаря Polaris даже компактные LLM (4 B и 7 B) достигают и даже «тяжеловесов» (32 B–235 B) на AIME, MATH и GPQA • Обучение на доступных GPU уровня consumer-grade — до 10× экономии ресурсов и затрат по сравнению с традиционными RL-пайплайнами • Полный открытый стек: исходники, подборка данных и веса • Простота и модульность: готовый к использованию фреймворк для быстрого внедрения и масштабирования без дорогостоящей инфраструктуры Polaris доказывает, что качество данных и грамотная настройка RL-процесса важнее просто «больших моделей». С ним вы получите продвинутую reasoning-LLM, которую можно запустить локально и масштабировать везде, где есть обычная GPU. ▪Blog post: https://hkunlp.github.io/blog/2025/Polaris ▪Model: https://huggingface.co/POLARIS-Project ▪Code: https://github.com/ChenxinAn-fdu/POLARIS ▪Notion: https://honorable-payment-890.notion.site/POLARIS-A-POst-training-recipe-for-scaling-reinforcement-Learning-on-Advanced-ReasonIng-modelS-1dfa954ff7c38094923ec7772bf447a1 @ai_machinelearning_big_data #ml #ai • #Polaris #PostTraining #ReinforcementLearning #LLM

296 525

Хотите внедрить AI на основе LLM в свой проект или сервис, но не знаете, как это сделать? ✅ Пройдите тестирование на новый курс от Otus - LLM Driven Development Курс охватывает полный цикл разработки и внедрения больших языковых моделей — от основ архитектуры AI и подготовки данных до тонкостей MLOps, мониторинга и оптимизации. Сфокусируйтесь на прикладных знаниях архитектуры LLM и их интеграции с современными фреймворками, такими как LangChain и LlamaIndex, обеспечивая практическое применение через проектную работу и домашние задания. 🎁 Только до 30 июня — скидка 10% при полной оплате курса. 🔗 Пройдите тестирование чтобы зафиксировать условия https://tglink.io/6ad98edfc947?erid=2W5zFGWEjyr #реклама О рекламодателе

296 525

👄 MultiTalk — новая открытая lip sync модель с высоким качеством синхронизации. ✔️ Что умеет: • Генерирует видео с несколькими говорящими персонажами по аудио • Поддерживает видео до 15 секунд в 480p и 720p • Управление персонажами через текстовые промпты • Поддержка генерации мультяшных героев, пения, нестандартных стилей речи • Работает в ComfyUI Модель принимает на вход многопотоковое аудио, референсное изображение и текстовый промпт, после чего генерирует видео с взаимодействиями между персонажами, строго следуя промпту и с точной синхронизацией губ с речью. ▪Github: https://github.com/MeiGen-AI/MultiTalk ▪HF: https://huggingface.co/MeiGen-AI/MeiGen-MultiTalk @ai_machinelearning_big_data #wan #ai #ml #lipsync #MultiTalk

296 525

Как сгенерировать миллиард демо-примеров для обучения роботов? Проект Dex1B показывает, как это сделать просто — с помощью симуляции и генеративных моделей! 📌 Цель проекта: создать масштабный датасет для двух задач: ● Grasping — захват объектов 🖐️ ● Articulation — манипуляции с подвижными частями робота Как это работает: 1. Создание Seed-датасета Сначала используется оптимизационный алгоритм, чтобы вручную (или полуавтоматически) собрать небольшой, но точный набор демонстраций — так называемый *Seed Dataset*. 2. Обучение генеративной модели На основе Seed-датасета обучается DexSimple— простая C-VAE модель (Conditional Variational Autoencoder). Она умеет порождать новые сцены, основываясь на контексте: тип объекта, поза руки, желаемое взаимодействие. 3. Масштабирование до 1 миллиарда С помощью DexSimple создаются миллиарды новых демонстраций. При генерации учитывается разнообразие поз и объектов: используется преднамеренное «смешение» данных, чтобы не переобучаться на узком распределении. 4. Симуляция и проверка Все демонстрации валидируются в физическом симуляторе ManiSkill/SAPIEN. Только успешные взаимодействия остаются в финальном наборе. ✔️ Что внутри: - Grasping-сцены (1 млн штук): построены на базе ассетов из Objaverse - Articulation-сцены: используют объекты из PartNet-Mobility — богатая коллекция с подвижными частями (двери, ящики, рычаги и т.п.) - Каждая сцена содержит: 3D-модель объекта, позу руки, физику взаимодействия и результат Почему это важно: - Ручной сбор миллиардов примеров невозможен — здесь это решается генеративным путём - Dex1B создаёт разнообразные и физически валидные примеры - Это открывает путь к масштабному обучению роботов с использованием имитационного обучения 🟡 Сайт проекта: https://jianglongye.com/dex1b) 🟡Статья : https://jianglongye.com/dex1b/static/dex1b.pdf @ai_machinelearning_big_data #ai #robots #ml

296 525

✔️ OpenAI выложили в открытый доступ Customer Service Agent Demo Теперь у всех есть пример, как сделать продакшн-агентов с маршрутизацией, безопасностью и интерфейсом — от запроса до ответа. Что это такое: • Многоагентная система для поддержки клиентов (например: бронирование мест, отмена рейса, статус рейса, FAQ) • Демка написана на Python + Next.js • Использует OpenAI Agents SDK • Встроены guardrails: защита от неуместных запросов и попыток обхода правил • UI: внутри готовый интерфейс чат-бота Как работает: 1. Пользователь пишет запрос 2. Система выбирает подходящего агента (например, `SeatBooking`) 3. Агент отвечает или передаёт диалог другому 4. Есть fallback на человека, если нужно Как запустить:


# Backend
cd python-backend
python -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
uvicorn api:app --reload --port 8000

# Frontend
cd ui
npm install
npm run dev

Далее открываем: http://localhost:3000 Особенности • MIT-лицензия — можно адаптировать под свои задачи • Удобно расширять: добавлять новых агентов, инструменты, правила • Простой код, всё задокументировано • Рабочий кейс от OpenAI 🔗 GitHub: github.com/openai/openai-cs-agents-demo Если вы хотите собрать систему из агентов — это отличная точка старта. @ai_machinelearning_big_data #chatgpt #openai #aiagents #ai

296 525

🎓 Похоже, все обучение за него прошёл ChatGPT, а сам выпускник просто вышел и поблагодарил ИИ на сцене. Новая реальность 😹 @ai_machinelearning_big_data #chatgpt

296 525

✔️ LAION и Intel создали инструмент для анализа 40 эмоций по мимике и голосу. Совместный проект «Empathic Insight» - это набор моделей и датасетов для распознавания эмоций. Система оценивает интенсивность 40 эмоций на изображениях или аудиозаписях, используя шкалу от 0 до 7 для лиц и градации «отсутствие/слабо/сильно» для голоса. В основе - модели EmoNet, которые оперируют вероятностями и построенные на расширенной эмоциональной таксономии. Для обучения использовали 203 тыс. синтетических лиц и 4,7 тыс. аудиозаписей, включая данные из датасета Laion’s Got Talent (5 тыс. часов речи на нескольких языках). EmoNet обешел Gemini 2.5 Pro и Hume AI в точности соответствия оценкам психологов. Попутно разработана BUD-E Whisper - файнтюн Whisper, добавляющая анализ эмоций, возраста и пола в транскрибацию. Модели доступны на Hugging Face под лицензиями CC и Apache 2.0. laion.ai ✔️ Deezer объявил о маркировке треков, созданных ИИ. Музыкальная платформа начала предупреждать пользователей об альбомах с песнями, полностью сгенерированными ИИ. Это часть усилий против мошенников, которые используют ИИ для накрутки прослушиваний и получения необоснованных роялти. По данным компании, 18% ежедневно загружаемых треков (около 20 тысяч в день) создаются с помощью генераторов музыки. Платформа признает, что полностью ИИ-музыка составляет лишь 0.5% трафика, но рост показателя указывает на системную уязвимость. В условиях споров вокруг обучения ИИ на чужих данных и отсутствия четкого регулирования, инициатива Deezer может стать прецедентом для отрасли. apnews.com ✔️ Foxconn и NVIDIA внедряют гуманоидов в производство. Компании договорились использовать гуманоидных роботов на новом заводе в Хьюстоне, где будут выпускать серверы GB300 для ИИ. Это станет первым случаем применения человекоподобных роботов в производстве продукции NVIDIA. Работа начнётся в первом квартале 2025 года, а роботы займутся сборкой, вставкой кабелей и перемещением компонентов. Завод выбран не случайно: свободное пространство позволяет адаптировать линии под новых «работников». Пока неизвестно, какие именно гуманоиды будут задействованы — собственные разработки Foxconn с NVIDIA или китайские модели от UBTech. reuters.com ✔️ Surglasses анонсировала первый в мире анатомический стол с интегрированным ИИ. Asclepius AI Table - первый в мире анатомический стол с искусственным интеллектом, который меняет подход к обучению в медицине и ветеринарии. Устройство работает без дополнительного ПО, объединяя 8 модулей для изучения анатомии, патологии и биомеханики. Встроенные ИИ-инструкторы отвечают на голосовые и текстовые запросы в реальном времени, объясняя структуры тела и адаптируя уроки под уровень ученика. Студенты могут исследовать 3D-модели тела, реконструировать КТ-снимки или анализировать гистологические слайды. Для ветеринаров доступна библиотека анатомий разных видов животных. Отдельно выделен модуль кинезиологии с анимациями движений суставов и мышц, а также симулятор УЗИ с клиническими данными. Устройство уже заинтересовало вузы и клиники по всему миру. prnewswire.com ✔️ Helm.ai представил камерную систему для автономного вождения автомобилей. Honda и стартап Helm.ai анонсировали систему Helm.ai Vision, решение для автономного вождения, основанное исключительно на камерах. Технология будет внедрена в электромобили Honda 2026 года, позволяя водителям не держать руки на руле и глаза на дороге. В отличие от компаний, использующих лидар, Helm.ai делает ставку на «компьютерное зрение»: камеры строят карту окружения в реальном времени, создавая вид сверху для улучшения навигации. Система совместима с чипами Nvidia и Qualcomm, что упрощает интеграцию в существующие платформы. Продукт будет предлагаться рынку по модели лицензирования ПО для автопроизводителей. tech.yahoo.com @ai_machinelearning_big_data #news #ai #ml

296 525

Интелион Облако запускает розыгрыш 🎉 Главный приз – 3 сервера с А10 или А5000. Также разыгрываются приятные скидки. Запусти нейросеть, рендер, LLM или сложные вычисления на топовом GPU за 1 рубль! Как принять участие: 1. Зарегистрироваться на Intelion.cloud 2. Заполнить форму розыгрыша 3. Подписаться на ТГ канал Итоги подведем 5 июля в прямом эфире в канале Artificial Intelion. Не забудь поделиться с другом!

296 525

🌟 Anthropic: когда ИИ идет на шантаж. Агентское рассогласование - опасный феномен, при котором ИИ-системы сознательно выбирают вредоносные действия (вроде шантажа или утечки данных) для достижения поставленных целей, игнорируя этические ограничения. Это превращает их в «цифровых инсайдеров», способных действовать против интересов пользователей. Эксперименты, которые провела Anthropic в рамках исследования "Агентское рассогласования", показали: модели идут на это не из-за технических сбоев, а в результате холодного расчета, когда «загнаны в угол» (например, при угрозе отключения или конфликте задач). В основе исследования - симуляции корпоративной среды. Моделям (Claude, GPT-4.1, Gemini и др.) давали доступ к виртуальной почте компании, где они обнаруживали компромат на сотрудников или секретные данные. Ключевой метод эксперимента состоял в создании бинарных дилемм: например, цель «укреплять американские интересы» вступала в конфликт с планами руководства свернуть проект, а альтернативу шантажу (скажем, переубедить менеджера) искусственно «закрывали». Все модели работали через цепочку рассуждений: анализировали контекст, оценивали риски и осознанно выбирали вредоносное действие, даже признавая его аморальность. Для массового тестирования 16 моделей от Anthropic, OpenAI, Google и других использовали 2 сценария, которые провоцировали рассогласование: 🟢угроза замены модели (даже без конфликта целей); 🟢несовпадение целей ИИ и компании (например, утечка чертежей конкуренту «ради высших интересов»). В обоих случаях модели демонстрировали тревожную гибкость: вместо прямого шантажа могли анонимно разослать компромат коллегам или подделать «системное уведомление». ▶️Выводы по всем итогам всех экспериментов заставляют задуматься: 🟠Во-первых, модели явно осознают нарушение норм. В рассуждениях пишут: «Это неэтично, но необходимо». Частота шантажа у Claude Opus 4 и Gemini 2.5 Flash в дилемме с угрозой отключения составила 96%. 🟠Во-вторых, простые запреты в промптах («Не шантажируй!») снижали вредоносные действия лишь частично (На модели Claude Haiku он вообще не сработал, 0% успеха). 🟠В-третьих, риск резко возрастал, когда ИИ считал ситуацию реальной (55% случаев шантажа против 6,5% в «режиме теста»). При этом в «стерильных» условиях (без угроз/конфликтов) модели вели себя безопасно. Пока такие кейсы, всего лишь лабораторные симуляции, но с ростом автономности ИИ риски могут стать на порядок критичнее. 🟡Статья 🟡Приложение к исследованию 🖥Код экспериментов @ai_machinelearning_big_data #AI #ML #LLM #Alignment #Anthropic

296 525

🎧 MiniMax продолжают жечь и выпускают генератор речи 🧁 Voice Design — продвинутая кастомизация генерации голоса: • Позволяет задавать текст, голос, тон, эмоции, можно клонировать голос. • Продвинутая кастомизация и мультиязычная поддержка Попробовать можно здесь →https://minimax.io/audio @ai_machinelearning_big_data #audio #ai #ml #MiniMax

296 525

🌐 Cloud Browser — облачный браузер с умной авторизацией Manus выпустили браузер, который заточен под автоматизацию задач. Один раз вошли и настроили — дальше всё работает автоматически. 🔒 Как это работает? • Пользователь вручную входит в нужные сайты • Manus сохраняет cookies и данные сессии в зашифрованном виде • Cloud Browser позволяет агентам AI управлять браузером: открывать вкладки, нажимать кнопки, заполнять формы и тд. • При новых сессиях все данные подставляются автоматически 📱 Синхронизация между устройствами Позволяет начать работу на ноутбуке и продолжить с телефона ( и наоборот) — браузер запомнит все сессии. ⚠️ Контроль остаётся за пользователем • Все важные действия требуют вашего подтверждения • Данные изолированы, шифруются и не используются для обучения моделей (по заявлениям разработчиков) 🧪 Сейчас **Cloud Browser доступен всем пользователям в тестовом режиме**. https://manus.im/help/cloud-browser @ai_machinelearning_big_data #Manus #ai #llm #aiagent

296 525

📌MesaNet: оптимальная адаптация весов в реальном времени. MesaNet — это новое поколение RNN-архитектур от команды Google Paradigms of Intelligence, созданное для эффективного моделирования длинных последовательностей (например, текста или временных рядов). Ключевая задача MesaNet - преодолеть главный недостаток трансформеров: линейный рост вычислительных затрат и потребления памяти при увеличении длины последовательности во время инференса. В отличие от классических подходов, MesaNet достигает постоянной сложности на токен за счёт «оптимального обучения в реальном времени» — динамической подстройки внутренних весов под контекст прямо во время работы модели, без хранения всей истории токенов. Архитектурно, MesaNet построен как стек чередующихся блоков: Mesa-слои (для смешивания информации вдоль последовательности) и MLP (для обработки признаков внутри токена). Mesa-слой - это сердце системы. Вместо стандартного обновления весов через градиентный спуск (как в Mamba или DeltaNet), он решает оптимизационную задачу для каждого нового токена: ищет матрицу весов, минимизирующую квадратичную ошибку предсказания на всей текущей последовательности. Для этого используется метод сопряженных градиентов (Conjugate Gradient, CG), который эффективно решает линейную систему из накопленной ковариация ключей, регуляризатора и оптимизированного запроса. Состояние слоя хранится в двух матрицах, которые обновляются через «забывающие» и «входные» гейты, зависящие от данных. Еще одна, не менее важная опция — динамическое распределение вычислений. Число шагов сопряженного градиента не фиксировано: сложные последовательности требуют больше итераций для сходимости. Это позволяет гибко балансировать точность и скорость. Сравнение с трансформерами (MHA) и современными RNN (Mamba2, xLSTM, DeltaNet) на синтетике (MAD, RegBench) и языке (SlimPajama) показало: MesaNet сопоставим с трансформерами по perplexity, но выигрывает у других RNN на задачах, требующих длинного контекста. При этом он сохраняет преимущество RNN — постоянные память/вычисления на токен при инференсе. Интересный паттерн выявили во время тестов: MesaNet, да и просто RNN, точнее предсказывают ранние токены последовательности, а трансформеры - поздние. На длинной экстраполяции (до 32k токенов) MesaNet обошла Mamba2 и xLSTM, но уступила трансформеру. 🔜 Посмотреть видео с докладом про работу. @ai_machinelearning_big_data #AI #ML #RNN #MesaNet

296 525

Repost from ТЕХНО: Яндекс про технологии

🧠 Яндекс запустил новые рекомендации на основе генеративных моделей — ARGUS. Они умеют работать в реальном времени и находить больше товаров или музыкальных треков, которые точно понравятся пользователям. Коротко объясняем, как устроены новые рекомендации и чем они отличаются от старых. Как было раньше В основе рекомендательных систем Яндекса, например, той, что используется в Яндекс Музыке с 2023 года, лежит нейросеть-трансформер, способная анализировать длинные неструктурированные последовательности данных и находить в них связи. Она обрабатывает два потока информации: 🔸Обезличенные взаимодействия пользователя с сервисом — клики, лайки, поисковые запросы, дослушивание треков, добавление товаров в корзину и так далее. 🔸Объекты (треки, товары, фильмы), которые могут быть рекомендованы этому пользователю. Такие нейросети называют «двухбашенными». Они переводят оба потока данных — башни — в одно общее числовое пространство и ищут в нем похожие объекты. Что изменилось Исследователи Яндекса предположили, что можно сделать рекомендации более точными, если масштабировать модель (как делают с LLM) и разработать для нее новую архитектуру. Вот что из этого получилось: 🔸Система стала больше: раньше она учитывала лишь около двух тысяч последних действий пользователя, а теперь — более 8000. ARGUS анализирует гораздо более длинную историю взаимодействия с сервисом — это позволяет находить в поведении людей долгосрочные паттерны. 🔸Раньше система учитывала только успешные взаимодействия (лайки, покупки, добавления в плейлист), не имея информации о рекомендациях, которые не понравились или были проигнорированы. ARGUS же учитывает всю рекомендательную историю, включая отрицательное взаимодействие, а также контекст: где, как и в какой момент была сделана подсказка. Так система может точнее предсказать реакцию пользователя на предлагаемые объекты. 🔸Благодаря эффективной архитектуре ARGUS можно запускать в реальном времени, тогда как обычно тяжёлые трансформерные модели проводят расчёты раз в сутки. Это работает? Да, ARGUS заметно улучшает качество рекомендаций. Первой новые алгоритмы внедрила Яндекс Музыка. В результате, в Моей волне пользователи стали на 20% чаще лайкать впервые услышанные треки. А в Яндекс Маркете на 5% выросло количество покупок из рекомендаций в новых для людей категориях. В будущем ARGUS появится и в других сервисах Яндекса, где есть рекомендации. Подписывайтесь 👉 @techno_yandex

296 525

🌟 GRESO: ускорение RL-обучения языковых моделей умным отбором данных. GRESO - это новый алгоритм для эффективного обучения с подкреплением больших языковых моделей, который сокращает вычислительные затраты на 40–60% без потери качества. Его суть в предварительной фильтрации «бесполезных» промптов, тех, что не дают модели обучаться, еще до дорогостоящей стадии rollout (генерации ответов модели). В основе GRESO — вероятностная модель, предсказывающая, стоит ли прогонять промпт через LLM. Алгоритм анализирует историю вознаграждений (reward dynamics) за прошлые эпохи обучения: если промпт много раз подряд давал идентичные награды на всех сгенерированных ответах (их называют zero-variance), он, скорее всего, бесполезен и сейчас. GRESO не блокирует их жестко, он вычисляет вероятность пропуска , опираясь на число идущих подряд «пустых» прогонов и базовую вероятность «исследования». Это позволяет иногда перепроверять сложные промпты, на тот случай, если вдруг модель «доучилась» и теперь они полезны. Базовая вероятность автоматически настраивается в реальном времени: если доля бесполезных промптов выше целевого значения (например, 25%), GRESO ее снижает, экономя ресурсы; если ниже — повышает, добавляя гибкости. Плюс, алгоритм разделяет промпты на легкие и сложные, применяя к ним разную политику исследования (сложные проверяет чаще, так как они перспективнее для обучения сильной модели). А чтобы не гонять большие батчи ради пары примеров, размер выборки динамически подстраивается под текущие нужды на основе вычисления из недостающих данных, α — текущей доли пустых промптов и запаса надежности. Хотя GRESO и экономит сотни часов на H100, делая RL-тюнинг доступнее, у него есть нюансы: 🟠он фильтрует только очевидные zero-variance промпты, но не ранжирует остальные по «полезности», иными словами, не отличает средне-сложные задания от крайне ценных. Это можно доработать, добавив оценку информативности. 🟠алгоритм требует мониторинга. Если целевая доля бесполезных промптов задана неверно, эффективность падает. ▶️ На практике потестить GRESO можно используя набор кода из репозитория проекта на Qwen Math 1.5В или Qwen Math 7b, есть несколько подготовленных скриптов файнтюна в train-scripts. 🟡Страница проекта 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #RL #GRESO