Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

Сеть:Machinelearning Россия1 270 Технологии и приложения328...

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 296 497 подписчиков, занимая 328 место в категории Технологии и приложения и 1 270 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 296 497 подписчиков.

Согласно последним данным от 19 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 252, а за последние 24 часа — -213, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.08%. В первые 24 часа после публикации контент обычно набирает 5.74% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 23 972 просмотров. В течение первых суток публикация набирает 17 005 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 185.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Благодаря высокой частоте обновлений (последние данные получены 20 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

296 497

Подписчики

-21324 часа

-1 4247 дней

-6 25230 день

23 972

Просмотры поста

~ 17 00524 часа

~ 19 20848 часов

8.08%

Коэффициент вовлеченности

~ 5

Постов в день

Ads index

beta

Архив постов

296 495

🖥 Новая версия модели постепенно становится доступна всем пользователям подписки ChatGPT Pro и через API. В экспертных оценках тестировщики отдают предпочтение OpenAI o3-pro по сравнению с o3, подчеркивая его улучшенную производительность в ключевых областях, включая науку, образование, программирование, анализ данных и генерациям текста. Рецензенты также неизменно высоко оценивают o3-pro за ясность ответам, полноту и точное следование запросам. @ai_machinelearning_big_data #chatgpt

296 495

⚡️ Сэм Альтман анонсирует снижение стоимости на о3 на 80% Гендир OpenAI объявил о снижении цены на o3 на 80% и намекнул на предстоящий выпуск o3-pro. Говорит, что нам понравится соотношение цена\перфоманс у о3-pro. Пост Sam Altman в сети Х

296 495

⚡️ Mistral выпустила ризонинг-модель Magistral. Magistral — первая модель рассуждений от Mistral AI. Она сочетает глубокую логическую обработку с возможностью отслеживать каждый шаг её «мышления». Модель получила поддержку 8 языков, включая русский и выпущена в 2 вариантах: 🟢опенсорсный Magistral Small с 24 млрд. параметров; 🟠корпоративный Magistral Medium. Внутри Magistral работает в режиме рассуждений, разбивая задачи на цепочки логических шагов, а Flash Answers ускоряет вывод в 10 раз по сравнению с конкурентами. Для интеграции в рабочие процессы модель умеет взаимодействовать с внешними инструментами (API или базами данных). В тестах Magistral Medium показал 73,6% точности на задачах AIME2024, демонстрируя силу в физических симуляциях и математических расчетах. Для разработчиков доступны версии на Hugging Face, AWS и IBM WatsonX, а в будущем — на Azure и Google Cloud. Демо Magistral доступно в интерфейсе Le Chat или по API в La Plateforme. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Модель 🟡Техотчет 🟡Web Demo @ai_machinelearning_big_data #AI #ML #LLM #Magistral #MistralAI

296 495

Вот как изменилась доля трафика на рынке ИИ за последние полгода: 🗓️ 6 месяцев назад: 🥇 ChatGPT: 87,5% 🥈 Google: 5,4% 🥉 Perplexity: 2,0% ⚡ Claude: 1,6% 🗓️ 3 месяца назад: 🥇 ChatGPT: 77,6% (−9,9%) 🥈 DeepSeek: 8,1% (новый игрок!) 🥉 Google: 4,9% 🤖 Grok: 2,7% (входит в игру от X) 🚀 Perplexity: 2,0% 🗓️ 1 месяц назад: 🥇 ChatGPT: 80,2% (+2,6%) 🥈 Google: 6,1% (+1,2%) 🥉DeepSeek: 5,9% (−2,2%) 🤖 Grok: 2,4% 🚀 Perplexity: 1,6% ⚡ Claude: 1,2% 🗓️ Сейчас: 🥇 ChatGPT: 78,9% (−1,3%) 🥈 Google: 8,0% (+1,9% 📈) 🥉 DeepSeek: 5,3% (−0,6%) 🤖 Grok: 2,1% (−0,3%) 🚀Perplexity: 1,7% (+0,1%) ⚡ Claude: 1,4% (+0,2%) Главные выводы: - ChatGPT по-прежнему лидирует, но понемногу теряет долю рынка (−8,6% за полгода). - Google стабильно растёт (+2,6% с прошлого года). - DeepSeek мощно стартовал, но в последнее время сдал позиции. - Grok и Perplexity держатся, а Claude показывает небольшой рост. @ai_machinelearning_big_data #GenAI #ТрендыРынка

296 495

📌Tokasaurus: проект для ускорения работы с языковыми моделями. Tokasaurus — это движок инференса для языковых моделей в режиме высоконагруженных задач. Он максимизирует пропускную способность при работе с LLM, предлагает поддержку API OpenAI, эффективно управляет памятью и оптимизирует вычисления в сценариях, где важно одновременно обрабатывать множество запросов без задержек. Архитектура Tokasaurus разделена на 3 компонента: веб-сервер, менеджер и модельные воркеры. 🟢Веб-сервер отвечает за взаимодействие с клиентами, принимая запросы и отправляя ответы. 🟢Менеджер, запущенный в отдельном процессе, управляет планированием задач, KV-кешем и группировкой последовательностей с общими префиксами. 🟢Модельные воркеры выполняют прямые запросы к подключенным LLM. Компоненты обмениваются данными асинхронно через очереди, и это позволяет держать GPU загруженным без простоев. Проект учитывает растущую потребность в масштабировании и предлагает 3 типа параллелизма: дата-параллелизм (dp_size), пайплайн (pp_size) и тензорный (tp_size) с поддержкой AsyncTP.

Async Tensor Parallelism в PyTorch — это техника ускорения распределенных вычислений для LLM, где операции связи (all-gather/reduce-scatter) разбиваются на асинхронные части и перекрываются с матричными умножениями (matmul) с помощью чередующихся CUDA-потоков: пока один поток вычисляет фрагмент matmul, другой параллельно передаtт данные для следующего фрагмента через P2P-копирование (NVLink + copy engines), минимизируя простои GPU.

При использовании нескольких GPU, например, dp_size=2 и pp_size=4, система задействует 8 GPU, создавая 2 дублирующиеся группы по 4 GPU каждая. При этом параметры управления памятью (kv_cache_size_num_tokens, max_seqs_per_forward) применяются к каждой дата-параллельной группе отдельно. Это позволяет тонко управлять ресурсами, исходя из контекста конкретных нагрузок. Tokasaurus поддерживает модели семейств Llama3 и Qwen2, использует технологию Hydragen для ускорения внимания над общими префиксами последовательностей. ⚠️ Проект пока молодой, поэтому некоторые функции могут быть нестабильными. Разработчики активно работают над улучшениями. 📌 Лицензирование: Apache 2.0 License. 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM # #Tokasaurus #Github

296 495

🤖 Золотая коллекция авторских каналов про нейросети, сохраняйте! Собрал для вас редкие и полезные каналы про нейронки: Tips AI | IT & AI — про сервисы и технологии IT и AI, которые могут упростить (или не совсем) жизнь. Пишет только то, что сам считает интересным. НейроProfit — авторский канал с проверенными инструментами для бизнеса, учебы и работы. Конкретика и пошаговые инструкции – все, чтобы использовать ИИ уже сегодня. Бурый — коллекционер нейросетей, тестит всё на себе и делится лучшими бесплатными нейронками. Сергей Булаев AI 🤖 — создание полезного контента и продуктов с помощью ИИ. Открываем эру миллиардных компаний из трёх человек. Max Votek — о технологиях, AI и предпринимательстве простыми словами. Много лет строит бизнесы и инвестирует в идеи. Co-founder Customertimes.

296 495

✔️ В приложение Gemini добавили «запланированные действия». Новая функция позволяет автоматизировать повторяющиеся задачи и получать персонализированные уведомления. Пользователи могут задавать команды, например, ежедневно присылать сводку календаря или идеи для блога, а также создавать разовые напоминания. «Запланированные действия» активируется через настройки приложения. Система работает просто: достаточно описать задачу и указать время выполнения. Доступ к инструменту открыт для подписчиков Google AI Pro/Ultra и корпоративных пользователей Google Workspace (образовательные и бизнес-планы). blog.google ✔️ Google меняет план доступа к AI Studio. Все началось из за волны возмущения платных подписчиков поводу того, что в Gemini app платный Pro-тариф ($19.99) оказался строже, чем бесплатный AI Studio. Google отреагировал увеличением лимитов для Gemini app, но параллельно объявил, что AI Studio полностью перейдет на авторизацию по API-ключам. Это напугало разработчиков, многие используют AI Studio в своих проектах. Они опасаются, что теперь придется платить за сервис. Руководитель направления, Логан Килпатрик, успокоил сообщество: "Бесплатный уровень AI Studio никуда не денется в ближайшее время". Поменяется система учета. Пока большинство укладывалось в свободные квоты, но теперь, при их превышении, точно потребуется свой ключ и, возможно, оплата. Для тех, кому критичны большие квоты Gemini app, теперь нужен уже AI Ultra за $250/мес. Будущее бесплатного доступа в AI Studio прорабатывается, компания обещает минимизировать неудобства. 9to5google.com ✔️ Microsoft Photos получило новые ИИ-инструменты. Microsoft выпустила обновление для Photos на Windows 11 с новыми фичами. Relight: позволяет управлять тремя источниками света, менять их цвет и фокус, есть готовые пресеты. Пока это работает только на Snapdragon-устройствах Copilot+, но вскоре поддержка дойдет до AMD и Intel. Поиск по текстовому запросу: вводите «закат на пляже» или «семейный пикник», и приложение найдет подходящие фото без лишних кликов. Коммерческие пользователи с Entra ID получили доступ к Restyle Image и Image Creator, ранее доступным только через личные аккаунты Microsoft. Обновление доступно в версии 2025.11060.5006.0 и выше. blogs.windows.com ✔️ Apple на WWDC 2025 анонсировала улучшенные инструменты для разработчиков. Foundation Models — фреймворк для создания интеллектуальных приложений с поддержкой офлайн-работы и приватностью данных. С ним можно добавлять ИИ-функции в приложения всего за три строки кода на Swift. Xcode 26 получил интеграцию с ChatGPT и другими LLM, позволяя писать код, тесты и документацию через API-ключи или локальные модели на Mac с чипами Apple. Удобство повысилось за счет голосового управления, обновлённой навигации и локализации. Swift 6.2 улучшил производительность и взаимодействие с C++ и JavaScript, а также получил поддержку WebAssembly. Контейнеризация для Mac теперь работает с Linux-образами благодаря изолированному опенсорсному фреймворку. apple.com ✔️ Anthropic закрыла пилотный блог, который вел Claude. Всего месяц просуществовал экспериментальный блог "Claude Explains", где Claude писал технические статьи. Инициатива, по задумке, должна была объединить обучающий контент с маркетинговыми целями, при участии редакторов и экспертов, дорабатывавших черновики Claude. Блог освещал темы от анализа данных до оптимизации кода. Однако уже через месяц пилот остановили, хотя планы были грандиозные. Пользователи соцсетей критиковали неясность: часть постов выглядела как автоматизированный маркетинг, а отсутствие меток об ИИ-генерации вызывало недоверие. Согласно сервису Backlink Checker, за месяц существования блога, на его статьи сослались 24 сайта. Вероятно, Anthropic решили дистанцироваться из-за рисков, связанных с ошибками ИИ. Сейчас с адреса блога установлено перенаправление на главную страницу Anthropic. techcrunch.com @ai_machinelearning_big_data #news #ai #ml

296 495

📌Небенчмарковый анализ математических рассуждений o3-mini. Epoch AI провели исследование, чтобы копнуть способность o3-mini в математическом ризонинге глубже, чем это происходит в популярных тестах и бенчмарках. Они дали 14 математикам разобрать, как именно o3-mini-high решает сложные задачи из FrontierMath. Цель - понять ее сильные и слабые стороны в реальном математическом мышлении, а не просто фиксировать правильные ответы. Так как внутренняя структура самой модели OpenAI не раскрывает, авторы сосредоточились на анализе ее рассуждений. По 29-и "траекториям рассуждений" стало видно: модель не просто перебирает формулы, она действует как "индуктивный решатель на ощущениях" (по выражению одного математика). Модель проявляет любопытство: пробует разные подходы, ставит "бюджетные эксперименты", чтобы прощупать задачу. Иногда даже пишет код для расчетов, избегая излишней абстракции. Но стиль ее рассуждений часто неформальный, "черновой". Рассуждения излагаются приблизительно, без строгой формулировки, с пропусками сложных моментов – совсем не как это принято в математической среде. Почему так? Возможно, строгие доказательства просто реже встречались в ее обучающих данных. Главные проблемы модели – это обратная сторона ее же достоинств. Да, она эрудирована как никто (знает кучу теорем из разных областей – в 66% случаев она адресно применяла нужные знания, даже если подход был замаскирован). Но ей не хватает строгости и глубины. Она часто "читерит": делает верную догадку интуитивно и тут же применяет ее для решения, даже не пытаясь ее подтвердить доказательствами. Порой ей не хватает буквально одного шага до верного ответа. Но главное – математики критикуют ее за слабую креативность. Как заметил один эксперт, модель похожа на аспиранта, который может блеснуть начитанностью, назвать кучу теорем и авторов, но не способен глубоко переосмыслить материал или придумать что-то новое. Набор идей модели ограничен, и если они не срабатывают – прогресса нет. Плюс ко всему, в 75% рассуждений нашли галлюцинации: модель путает термины, формулы, и зачастую выдумывает несуществующие URL для поиска недостающей информации. Модель, по заверением OpenAI, обучали на огромном массиве данных математической литературы. Это объясняет ее феноменальную эрудицию. Но смогут ли такие модели, как o3-mini-high, преодолеть свои слабости в будущем? Или же системы, обученные на синтетических данных (AlphaProof), пойдут другим путем, предлагая в инфернесе рассуждения, мало похожие на человеческое математическое мышление? А пока что вывод: o3-mini-high – это мощный, но своеобразный инструмент. Знаток с интуицией, но без дисциплины профессора. 🔜 Читать статью полностью @ai_machinelearning_big_data #AI #ML #EpochAI

296 495

🌟 True Tech Day 2025: крупнейшая ИТ-конференция от MTS Web Services MTS Web Services (MWS) провела масштабное мероприятие True Tech Day — свыше 800 000 участников онлайн и 5 000 офлайн. Ключевой фокус — искусственный интеллект и ML. Формат: 4 трека, 50+ спикеров, интерактив с флагманскими продуктами MWS. Технологии: генеративный ИИ, цифровые двойники, робототехника, AutoML, системная инженерия будущего. На главной сцене: 🟡 Пабло дель Веккио (NTT DATA) — цифровые двойники и предиктивные модели 🟡 Дмитрий Ливанов (МФТИ) — open talk об ИИ против разума 🟡 Радослав Нейчев (Яндекс) — синтетические данные и обучение моделей 🟡 Кэсси Козырков (экс-Google) — human-in-the-loop в эпоху AI 🟡 Денис Филиппов (MWS AI) — реальные кейсы генеративного ИИ 🟡 Антон Скогорев (Т-Банк) — архитектура AI-ориентированных систем Треки конференции: 🟡 MAIN — LLM-агенты, робототехника, цифровые двойники 🟡 SCIENCE — нейрофизиология, нейроимпланты, генная инженерия, частный космос 🟡 ENGINEERING — backend-архитектура, AI-ассистенты, облачные стеки 🟡 AI/ML — RAG, AutoML, временные ряды, оптимизация inference True Tech Day 2025 стал не просто конференцией, а местом встречи ИТ-сообщества, где ИИ не только обсуждали — с ним взаимодействовали на практике. @ai_machinelearning_big_data #AI #ML #TrueTech #MWS

296 495

Пост 2.Machinelearning 🌟 True Tech Day 2025: крупнейшая ИТ-конференция от MTS Web Services MTS Web Services (MWS) провела масштабное мероприятие True Tech Day — свыше 800 000 участников онлайн и 5 000 офлайн. Ключевой фокус — искусственный интеллект и ML. Формат: 4 трека, 50+ спикеров, интерактив с флагманскими продуктами MWS. Технологии: генеративный ИИ, цифровые двойники, робототехника, AutoML, системная инженерия будущего. На главной сцене: 🟡 Пабло дель Веккио (NTT DATA) — цифровые двойники и предиктивные модели 🟡 Дмитрий Ливанов (МФТИ) — open talk об ИИ против разума 🟡 Радослав Нейчев (Яндекс) — синтетические данные и обучение моделей 🟡 Кэсси Козырков (экс-Google) — human-in-the-loop в эпоху AI 🟡 Денис Филиппов (MWS AI) — реальные кейсы генеративного ИИ 🟡 Антон Скогорев (Т-Банк) — архитектура AI-ориентированных систем Треки конференции: 🟡 MAIN — LLM-агенты, робототехника, цифровые двойники 🟡 SCIENCE — нейрофизиология, нейроимпланты, генная инженерия, частный космос 🟡 ENGINEERING — backend-архитектура, AI-ассистенты, облачные стеки 🟡 AI/ML — RAG, AutoML, временные ряды, оптимизация inference True Tech Day 2025 стал не просто конференцией, а tech-экосистемой, где ИИ не только обсуждали — с ним взаимодействовали на практике. @ai_machinelearning_big_data #AI #ML #TrueTech #MWS

296 495

📈 Количество пользователей растет у всех , но ChatGPT — вне конкуренции Почти все крупные сайты растут, но ChatGPT показывает непрерывный и аномальный взлёт. В мае 2025 года его посещаемость выросла на +6,82% по сравнению с апрелем. Но ChatGPT растет быстрее всех. И это говорит о двух вещах: 1️⃣ ИИ стал по-настоящему массовым Все меньше людей , которые не использует ИИ — в работе, учёбе или просто в быту. Это уже не будущее — это часть повседневности. 2️⃣ OpenAI наращивает отрыв Именно поэтому GPT‑5 — будет не просто новой моделью, это стратегическая ставка на доминирование на ИИ рынке. У модели есть шанс пробить магическую планку в 1 миллиард пользователей и окончательно закрепить лидерство OpenAI. @ai_machinelearning_big_data #chatgpt #openai #news #ml #ai

296 495

🤍🤍🤍🤍🤍 Когда мир говорит: «Ты слишком» — Сбер отвечает: «Нам подходит» Слишком амбициозный? Слишком нестандартный? Слишком умный, громкий, яркий? Для Сбера — это преимущество! Веди за собой команду, создавай новые продукты, помогай людям. Будь собой — в команде, где возможно всё 💚

296 495

🌟 ether0: специализированная модель с ризонингом для химии. Ether0 - специализированная модель с 24 млрд. параметров, разработанная FutureHouse для проектирования соединений и решения сложных задач в химии. В отличие от традиционных моделей, она не просто пересказывает теорию, а решает практические задачи: считает атомы, проверяет химическую стабильность и генерирует структуры, подходящие для синтеза, используя естественный язык для рассуждений и вывода структур в формате SMILES.

SMILES (Simplified Molecular Input Line Entry System) — это линейная текстовая нотация для описания структуры химических соединений с использованием коротких ASCII-строк. Он позволяет кодировать молекулярные графы, включая информацию о связях, атомах и хиральности, что делает его удобным для обмена данными в химинформатике.

Пайплайн инференса выглядит так: пользователь вводит текстовый запрос (например, «создай ингибитор киназы с 30 атомами»), модель запускает цепочку рассуждений. Они работают параллельно, предлагая варианты, а потом выбирается лучший результат. Это позволяет комбинировать экспертизу: одна часть системы фокусируется на структуре кольца, другая — на функциональных группах, третья — на токсичности. Основой ether0 стала Mistral-Small-24B-Instruct-2501, которую адаптировали в несколько итераций. Сначала исходная модель Mistral прошла стадию SFT на примерах цепочек рассуждений, сгенерированных другими моделями. Затем ее усилили обучением на группах связанных задач предсказания растворимости и синтеза. После этого, знания объединили в общий пул через дистилляцию, а затем улучшили его с помощью общего RL. В завершении - GRPO, который сравнивает несколько вариантов ответов на один вопрос, выбирая наиболее точные. Финальный штрих - алайнмент. Модель обучили избегать генерации опасных соединений через дополнительные данные и RL. В тестах ether0 сравнивали с общими LLM (Claude, o1), специализированными химическими моделями (ChemDFM, TxGemma) и традиционными подходами (Molecular Transformer). На тестовых задачах с множественным выбором (MCQ), она показала 50,1% точности в режиме zero-shot, что близко к результату o1-2024-12-17 (52,2%). В задачах проектирования молекул (предсказание реакций) ether0 достигла 70% точности после 46 000 примеров, а MT, обученный на полном наборе данных USPTO (480 000 реакций), показал лишь 64,1%. ether0 превзошла людей-экспертов и специализированные модели в OA, а тесты на безопасность показали, что модель отказывается от 80% опасных запросов, не теряя точности . 📌 Лицензирование: Apache 2.0 License. 🟡Статья 🟡Модель 🟡Техотчет 🟡Demo 🖥 GitHub @ai_machinelearning_big_data #AI #ML #LLM #Ether0 #Chemistry #FutureHouse

296 495

Repost from Анализ данных (Data analysis)

🍏Иллюзия мышления: понимание сильных и слабых сторон моделей рассуждения через призму сложности задач Apple внезапно опубликовала исследование, которое разоблачает популярные LLM с "цепочкой размышлений" (Chain-of-Thought) — такие как Gemini 2.5 Pro, OpenAI o3 и DeepSeek R1. 📌 Что тестировали? Логические задачи: • башни Ханоя (100+ шагов!) • загадка про волка, козу и капусту • головоломки с правилами и условиями И всё это — с усложнением. 💥 Результаты: — 🔁 Модели не думают, а вспоминают Они не решают задачу шаг за шагом, а ищут похожие примеры в своей базе знаний. Это имитация мышления, а не само мышление. — 🤯 "Переосмысление" вредит Если задача простая, модель находит верный ответ — и… продолжает «думать» дальше, усложняя всё и случайно портя решение. — 🧠 Больше размышлений ≠ лучше результат Дать больше токенов и времени на размышления не помогает. На сложных задачах модели просто сдаются быстрее. Даже "бесконечный" бюджет не спасает. — 🧪 Few-shot примеры не работают Даже если расписать пошаговое решение и дать примеры — модель всё равно ломается, если задача ей незнакома. — 🏗 Модели обожают Ханой, но ненавидят загадки Башни Ханоя решаются идеально даже на 100+ шагов. А вот в простой задаче с козой и капустой — модели сдаются на 4-м шаге. Почему? Ханой — в датасетах, загадки про реку — нет. 🍏 Интересно, что Apple выпустила это исследование за день до WWDC 2025. Подколка конкурентам? А завтра, может, и своё покажут. 🤔 📎 Исследование: https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf @data_analysis_ml #AI #LLM #AGI #Apple #WWDC2025 #PromptEngineering #NeuralNetworks

296 495

🌟 Esoteric Language Models: гибридные AR+MDM языковые модели. Eso-LM - это новый класс языковых моделей, сочетающий автогрегрессионные (AR) и маскированные диффузионные методы (MDM), чтобы сбалансировать качество генерации и скорость работы. Основная идея состоит в том, чтобы устранить слабые места обеих технологий: медленное выполнение AR-моделей и низкую эффективность MDM при сохранении их ключевых преимуществ - параллелизма. Архитектура строится на гибридной функции потерь, которая одновременно обучает модель как AR-генератору, так и MDM-декодеру. Это достигается через модифицированный механизм внимания, который динамически переключается между причинным (для AR-фазы) и двусторонним (для MDM-фазы) режимами. В отличие от классических MDM, Eso-LM использует разреженные матрицы внимания, позволяя кэшировать KV даже во время диффузионного этапа. Эта техника ощутимо сокращает вычислительную нагрузку за счет обработки только тех токенов, которые нужно «демаскировать» на каждом шаге. Процесс генерации разбит на 2 стадии: 🟢На этапе диффузии модель последовательно раскрывает часть маскированных токенов, используя оптимизированный шедулер, который минимизирует количество проходов через сеть. 🟢На автогрегрессионной фазе, оставшиеся токены дополняются слева направо, с опорой на уже сгенерированный контекст. Обе стадии используют единый KV-кэш, что исключает повторные вычисления и ускоряет работу в разы. В итоге, для длинных последовательностей (8192 токена), Eso-LM работает в 65 раз быстрее, чем стандартные MDM. Экспериментальные модели обучали на сетах LM1B (1 млрд. слов) и OpenWebText с использованием токенизаторов BERT и GPT-2 соответственно. Тесты показали, что Eso-LM не только улучшает скорость, но и устраняет «модовое коллапсирование» (деградацию качества при малом числе шагов), характерное для предыдущих решений (BD3-LM). На наборе OWT модель достигла уровня perplexity 21.87 при высокой скорости генерации, оставаясь конкурентоспособной как с MDM, так и с AR-моделями. ▶️ Разработчики, а это совместный проект Cornell University, NVIDIA и MBZUAI, опубликовали код для инференса, обучения и оценки Eso-LM в репозитории на Github и веса экспериментальных моделей: 🟠Eso-LM(B)-alpha-1 - чистый MDM с максимальной скоростью, но меньшим качеством; 🟠Eso-LM(B)-alpha-0.25 - баланс между MDM и AR, в которой пожертвовали частью скорости ради перплексии и стабильности. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Набор моделей 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #EsoLM #HybridModel

296 495

🦣 Ты мамонтёнок? Потерял маму? 💀 А может, сам разводишь стадо?В любом случае — теперь у тебя есть бот, который знает больше, чем твой следователь. --- 📱 Вводишь номер — и получаешь:👤 ФИО, паспорт, ИНН, адрес прописки📞 С кем звонил, когда и откуда💬 WhatsApp, Telegram, VK, даже если он “удалился”🖼️ Фото, соцсети, даже одноклассница Оксана 2008 года --- – Хочешь узнать, кто названивает по ночам?– С кем твоя бывшая реально "осталась друзьями"?– Кто стоит за фейковым аккаунтом, который пишет “приветик 👀”? 🔍 Мы пробьём всех. Даже если они под VPN, с фейковым именем и через eSIM.🐾 Оставили след в сети? Мы его найдём.🚫 Думаешь, удалил — значит, исчез? Ха-ха. Ты просто добавился в базу https://tglink.io/8283b1a5c5f0?erid=2W5zFH7nRYt - постоянная ссылка @Manticore1_bot - бот

296 495

Китайская компания 4DV AI, показала проект, который позволяет превращать обычные видео в интерактивную 3D-сцену — с возможностью крутить камеру, приближать и менять ракурс. 🔍 Как это работает: Видео разбивается на облако точек — сплаты, каждая с цветом, формой и позицией в 3D. Потом эти точки собираются заново — уже под нужным углом. Получается как будто ты находишься внутри сцены и можешь смотреть на неё с любой стороны. 🔜 Всё это происходит в реальном времени, как в игровом движке. Качество впечатляет: примерно на 2.4dB лучше (Peak Signal-to-Noise Ratio), чем предыдущий метод (4DGS) и выдает — до 467 FPS на RTX 4090. 🎧 Звук синхронизируется, так что ощущается реалистично. 📹 Можно покрутить и посмотреть демки в браузере👇 https://www.4dv.ai/viewer/salmon_10s 🌟 Проект: https://zju3dv.github.io/freetimegs/ @ai_machinelearning_big_data #AI #4DV #GaussianSplatting #3Dvideo #NeRF

296 495

🏆 NVIDIA Parakeet V2 возглавила рейтинг ASR-моделей на Hugging Face Новая модель Parakeet-TDT-0.6B-V2 достигла рекордной точности распознавания речи — 6.05% Word Error Rate на Open ASR Leaderboard от Hugging Face. 🦜 Parakeet V2 выводит автоматическое распознавание речи (ASR) на новый уровень: ⚡ Молниеносный инференс — RTFx 3386 (в 50 раз быстрее аналогов) 🔍 Поддержка необычных сценариев: • Распознавание песен в текст (song-to-lyrics) • Форматирование чисел и временных меток • Высокоточная транскрибация 📌 Лицензирование: CC-BY-4.0 🔗 Leaderboard: huggingface.co/spaces/hf-audio/open_asr_leaderboard 🔗 Демо: huggingface.co/nvidia/parakeet-tdt-0.6b-v2 🔗 Попробовать: build.nvidia.com/explore/speech @ai_machinelearning_big_data #NVIDIA #ASR #SpeechRecognition #Parakeet #AIaudio

296 495

✔️ EleutherAI представила лицензированный датасет для обучения ИИ-моделей. EleutherAI выпустила The Common Pile v0.1 — 8-терабайтный набор данных для тренировки моделей, собранный при участии Hugging Face и академических институтов. В него вошли более 20-ти публичных источников, На базе датасета созданы Comma v0.1-1T и Comma v0.1-2T (по 7 млрд параметров), которые, по заявлению разработчиков, не уступают моделям, обученным на нелицензированном контенте. Модели показывают сильные результаты в прораммировании и математике, опровергая мнение, что только "пиратский" контент обеспечивает качество. Релиз датасета - это попытка исправить ошибки прошлого: ранее EleutherAI критиковали за использование защищенного авторским правом контента в старом датасете The Pile. huggingface.co ✔️ OpenAI вынуждена сохранять данные пользователей ChatGPT из-за судебного решения по иску NYT. OpenAI получила судебный приказ о временном хранении данных пользователей ChatGPT и API, даже если они были удалены. Это связано с иском New York Times о нарушении авторских прав. NYT требует сохранить «всю переписку и контент» для использования в качестве доказательств. Под приказ попадают данные пользователей бесплатных и платных версий ChatGPT (Plus, Pro, Team), а также API-клиенты без соглашения о нулевом хранении данных. Корпоративные клиенты и образовательные проекты в безопасности — их информация не попадает под приказ. OpenAI назвала требование чрезмерным, подчеркнув, что обычно удаляет данные через 30 дней и подала апелляцию, но временно соблюдает решение. openai.com ✔️ MIT & Recursion Boltz-2: модель прогнозирования взаимодействия молекул. MIT CSAIL и Recursion разработали Boltz-2 — открытую модель для анализа биомолекулярных структур и связывания. Она сочетает рекордную скорость и точность, превосходя AlphaFold3 и других конкурентов. Boltz-2 предсказывает, как молекулы взаимодействуют, с точностью, близкой к физическим методам FEP, но в 1000 раз быстрее. Разработчики надеются, что публикация модели облегчит поиск лекарств, ведь Boltz-2 может за час перебрать тысячи соединений вместо недель вычислений. globenewswire.com ✔️ AMD пополнилась командой стартапа Untether AI. AMD объявил о покупке ключевых специалистов из стартапа Untether AI, разработавшего энергоэффективные чипы для ИИ-инференса. Сделка должна укрепить возможности компании в области компиляторов и проектирования чипов. Untether AI, основанный в 2018 году, славился архитектурой «at-memory», повышающей производительность в дата-центрах и на EDGE-устройствах. Их плата speedAI240 Slim показала рекордную энергоэффективность: в 3–6 раз выше аналогов по тестам MLPerf. Сделка стала частью стратегии AMD по конкурированию с Nvidia. Ранее, приобретя стартап Brium, компания усилила оптимизацию ИИ-нагрузок на GPU Instinct. Теперь фокус смещается на интеграцию новых технологий в продукты, ориентированные на растущий рынок ИИ. crn.com ✔️ Фестиваль ИИ-фильмов в Нью-Йорке. В Нью-Йорке прошел ежегодный фестиваль ИИ-фильмов от Runway. За 3 года проект вырос от 300 до 6000 заявок, а в этом году представил десятку короткометражек, созданных с помощью ИИ. Лучшей стала «Total Pixel Space» Джейкоба Алдера, исследующая математические границы digital-изображений. По словам организаторов, технологии ускоряют процессы кинопроизводства и фестиваль делает акцент на том, как ИИ поддерживает, а не заменяет творцов. apnews.com @ai_machinelearning_big_data #news #ai #ml

296 495

⚡️ Отчет OpenAI по пресечению вредоносного использования ИИ В свежем июньском отчете, Open AI описала самые крупные кейсы, когда злоумышленники использовали модели ИИ для создания фейковых резюме, манипуляций в соцсетях, кибератак и мошенничества. Для анализа угроз исследователи применяют комбинацию ИИ и экспертные команды. ИИ помогает выявлять шаблоны текста злоумышленников и координировать расследование с платформами. Архитектура таких систем включает модели для анализа данных, детекторы аномалий и инструменты для синхронизации с правоохранительными органами. Обучались такие специализированные модели, помимо общедоступных данных, еще на примерах социальной инженерии и профилях киберугроз. Дополнительно, они получили методы обнаружения фейковых профилей, перевода текстов и анализа сетевого трафика. ▶️Всего в отчете приведено 10 случаев обнаружения: Deceptive Employment Scheme: IT Workers. 🟠Угроза использования ИИ для создания поддельных резюме и получения удалённых IT-вакансий, связанная с подозрением на участников из КНДР. 🟢Были заблокированы аккаунты ChatGPT, использовавшие модели для автоматической генерации документов, а также установлены связи с операторами в Африке и Северной Америке. Covert IO: Operation “Sneer Review” 🟠Координированная генерация комментариев в соцсетях для продвижения китайских интересов, включая критику Тайваня и Пакистана. 🟢Обнаружены и заблокированы аккаунты, создававшие иллюзию органической активности через множественные языки и платформы. Covert IO: Operation “High Five” 🟠Массовые комментарии в соцсетях на политические темы в Филиппинах, связанные с маркетинговой компанией Comm&Sense Inc. 🟢Были заблокированы аккаунты, создававшие фейковые TikTok-каналы для популяризации президента Маркоса, и выявлена схема с использованием подставных профилей. Social engineering meets IO: Operation “VAGue Focus” 🟠Социальная инженерия через поддельные СМИ (Focus Lens News, VAG Group) для сбора информации о политике США и Европы. 🟢Заблокированы аккаунты, использовавшие ИИ для перевода и создания фейковых материалов, а также выявлены признаки связи с китайскими структурами. Covert IO: Operation “Helgoland Bite” 🟠Пропаганда партии AfD в Германии через поддельные Telegram-каналы и сайт Pravda DE. 🟢Обнаружены и заблокированы аккаунты, распространявшие контент, а также установлены связи с сетью Portal Kombat, известной по предыдущим расследованиям. Cyber Operation: “ScopeCreep” 🟠Вредоносное ПО, распространяемое через поддельный игровой инструмент Crosshair-X, с функциями шпионажа и обхода антивирусов. 🟢Были заблокированы аккаунты, использовавшие ИИ для отладки кода, а также удалены вредоносные репозитории и установлены методы обнаружения. Cyber Operations: Vixen and Keyhole Panda 🟠Кибератаки и сбор информации о технологиях США через ИИ, связанные с группами APT5 и APT15. 🟢Заблокированы аккаунты, использовавшие модели для создания скриптов и анализа инфраструктуры, а также переданы индикаторы партнерам для усиления защиты. Covert IO: Operation “Uncle Spam” 🟠Поляризующий контент в США через фейковые профили с ИИ-генерируемыми изображениями и анализом данных. 🟢Заблокированы аккаунты, использовавшие ИИ для создания логотипов и сбора информации из соцсетей, также проведена оцененка степени влияния. Recidivist Influence Activity: STORM-2035 🟠Пропаганда в поддержку Ирана и других стран через фейковые аккаунты в X, касающаяся миграции и независимости регионов. 🟢Были заблокированы аккаунты, распространявшие контент на испанском и английском, а также отмечены повторные попытки операторов вернуться к активности. Scam: Operation “Wrong Number” 🟠Мошенничество с предложениями высокой зарплаты за лайки и инвестиции, связанное с Камбоджей. 🟢Заблокированы аккаунты, использовавшие ИИ для перевода сообщений, а также выявлена схема с этапами «The ping», «The zing» и «The sting» для обмана жертв. 🔜 Почитать полный отчет можно на сейте OpenAI @ai_machinelearning_big_data #news #ai #ml