ar
Feedback
Анализ данных (Data analysis)

Анализ данных (Data analysis)

الذهاب إلى القناة على Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

إظهار المزيد

📈 نظرة تحليلية على قناة تيليجرام Анализ данных (Data analysis)

تُعد قناة Анализ данных (Data analysis) (@data_analysis_ml) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 50 192 مشتركاً، محتلاً المرتبة 2 668 في فئة التكنولوجيات والتطبيقات والمرتبة 12 554 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 50 192 مشتركاً.

بحسب آخر البيانات بتاريخ 15 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -8، وفي آخر 24 ساعة بمقدار 25، مع بقاء الوصول العام مرتفعاً.

  • حالة التحقق: غير موثّقة
  • معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 8.82‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 5.98‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
  • وصول المنشورات: يحصل كل منشور على متوسط 4 427 مشاهدة. وخلال اليوم الأول يجمع عادةً 2 999 مشاهدة.
  • التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 30.
  • الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, контекст, openai, архитектура, deepseek.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 16 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

50 192
المشتركون
+2524 ساعات
-287 أيام
-830 أيام
أرشيف المشاركات
Поступи в магистратуру с грантом до 1,2 млн рублей Современная магистратура – это не пары для галочки, а возможность продвину
Поступи в магистратуру с грантом до 1,2 млн рублей Современная магистратура – это не пары для галочки, а возможность продвинуть карьеру и стать сильным специалистом. Центральный университет ведет набор на пять программ магистратуры по популярным ИТ-направлениям. Партнеры – ведущие компании на рынке РФ: ВТБ, Сбер, Т-Банк, Яндекс, Avito, Ozon, Х5 Tech и другие. 62% магистрантов ЦУ находят новую работу с ростом зарплаты в 1,6 раза уже на первом курсе. Средняя зарплата – 195 тысяч рублей. Обучение можно совмещать с работой, а поступить – уже с третьего курса. Стань частью новой волны специалистов и получи грант на обучение до 1,2 млн рублей. И подавай заявку на поступление уже сейчас. Реклама. АНО ВО "Центральный университет", ИНН 7743418023, erid:2RanykoZm7w

Repost from Machinelearning
✔️ Microsoft разработала компактную языковую модель Mu для Windows Settings. Microsoft представила мини-модель Mu с 330 млн. параметров для локальной работы на NPU в Windows Settings. На чипах Qualcomm модель показывает в 4,7 раза быстрее генерацию токенов, чем аналоги. Mu адаптировали под особенности NPU: настроили размеры слоев, применили квантование весов до 8-16 бит и уменьшили потребление памяти. Mu уже используется в агенте Settings, который преобразует запросы вроде «увеличь яркость» в системные команды. Модель обучали на 3,6 млн примеров, добавили синтетические данные и шум, чтобы повысить точность. Результат: ответы за 500 мс даже на сложных задачах. При этом Mu в 10 раз меньше Phi-3.5-mini, но сохраняет конкурентную производительность. blogs.windows.com ✔️ SYNTHETIC-2: децентрализированный проект генерации логических данных. Prime Intellect запустила SYNTHETIC-2, децентрализованную систему генерации для обучения ИИ. Проект позволяет любым GPU, от бытовых до промышленных, присоединиться к генерации данных. Управляет процессом TOPLOC v2, технология, которая проверяет корректность вычислений через хэширование активаций и распределяет награды за успешные результаты. Датасет включает более 20 задач: математика, генерация JSON и неформальные задания для разнообразия данных. Верификация работает через сравнение ответов разных моделей (Qwen3, DeepSeek и др.). Все данные доступны на HuggingFace. Присоединиться может любой желающий, арендовав ресурсы через Prime Intellect или подключив собственные GPU. Цель проекта - ускорить развитие открытой суперинтеллектуальной системы, где контроль распределен, а технологии общедоступны. primeintellect.ai ✔️ DIY-устройство для превращения снов в фильмы с помощью ИИ. «The Dream Recorder», открытый DIY-гаджет от компании Modem Works, превращающий воспоминания о снах в короткие фильмы с помощью ИИ. Устройство использует Raspberry Pi, микрофон и экран, а его стоимость сборки составляет около $310. После пробуждения пользователь рассказывает сон, который транскрибируется и отправляется в ChatGPT, а затем в Luma AI для генерации видео. Итоговый ролик сохраняется в цифровой дневник. Проект сочетает DIY-культуру и доступные технологии, демонстрируя, как ИИ может визуализировать субъективный опыт. Все схемы и исходники доступны на GitHub, включая 3D-модели для печати. Примерная стоимость записи одного сна составляет $0.15, что делает эксперименты с памятью и сознанием доступными. И это не прототип, а рабочее решение, которое можно собрать самостоятельно. dreamrecorder.ai ✔️ Мини-движок nano-vLLM. Исследователь Синькай Ю из DeepSeek разработал nano-vLLM, облегченный движок для работы с LLM. Он написан на Python вручную, объемом всего 1,2 тыс. строк кода, и воспроизводит основные функции оригинального vLLM. nano-vLLM поддерживает кэширование префиксов, тензорный параллелизм, компиляцию с torch.compile и CUDA Graphs. Это позволяет достичь скорости, близкой к vLLM, но без сложных алгоритмов планирования задач или динамического батчинга. Зато разработчики получают четкую архитектуру в одном месте: токенизатор, управление кэшем и механизм выборки токенов. Проект подойдет для исследований, обучения или небольших систем, где важна простота. github.com ✔️ OpenAI готовит ChatGPT к конкуренции с Google Workspace и Office 365. По данным источников, OpenAI разрабатывает продвинутые функции для ChatGPT, превращая его в платформу для командной работы. Пользователи смогут группировать чаты, загружать файлы, использовать голосовой ввод и сохранять контекст диалогов. Все это позиционируется как альтернатива офисным пакетам. Мобильное приложение получит поддержку загрузок и переключения моделей на лету. Этот проект, задуманный в 2024 году, активно развивается сейчас и OpenAI видит в ChatGPT «операционную систему для жизни», интегрируемую в рабочие процессы. Microsoft, поддерживающий стартап, теперь рискует стать конкурентом самому себе, а Google получает нового серьезного оппонента. theinformation.com @ai_machinelearning_big_data #news #ai #ml

✔️ Microsoft разработала компактную языковую модель Mu для Windows Settings. Microsoft представила мини-модель Mu с 330 млн. параметров для локальной работы на NPU в Windows Settings. На чипах Qualcomm модель показывает в 4,7 раза быстрее генерацию токенов, чем аналоги. Mu адаптировали под особенности NPU: настроили размеры слоев, применили квантование весов до 8-16 бит и уменьшили потребление памяти. Mu уже используется в агенте Settings, который преобразует запросы вроде «увеличь яркость» в системные команды. Модель обучали на 3,6 млн примеров, добавили синтетические данные и шум, чтобы повысить точность. Результат: ответы за 500 мс даже на сложных задачах. При этом Mu в 10 раз меньше Phi-3.5-mini, но сохраняет конкурентную производительность. blogs.windows.com ✔️ SYNTHETIC-2: децентрализированный проект генерации логических данных. Prime Intellect запустила SYNTHETIC-2, децентрализованную систему генерации для обучения ИИ. Проект позволяет любым GPU, от бытовых до промышленных, присоединиться к генерации данных. Управляет процессом TOPLOC v2, технология, которая проверяет корректность вычислений через хэширование активаций и распределяет награды за успешные результаты. Датасет включает более 20 задач: математика, генерация JSON и неформальные задания для разнообразия данных. Верификация работает через сравнение ответов разных моделей (Qwen3, DeepSeek и др.). Все данные доступны на HuggingFace. Присоединиться может любой желающий, арендовав ресурсы через Prime Intellect или подключив собственные GPU. Цель проекта - ускорить развитие открытой суперинтеллектуальной системы, где контроль распределен, а технологии общедоступны. primeintellect.ai ✔️ DIY-устройство для превращения снов в фильмы с помощью ИИ. «The Dream Recorder», открытый DIY-гаджет от компании Modem Works, превращающий воспоминания о снах в короткие фильмы с помощью ИИ. Устройство использует Raspberry Pi, микрофон и экран, а его стоимость сборки составляет около $310. После пробуждения пользователь рассказывает сон, который транскрибируется и отправляется в ChatGPT, а затем в Luma AI для генерации видео. Итоговый ролик сохраняется в цифровой дневник. Проект сочетает DIY-культуру и доступные технологии, демонстрируя, как ИИ может визуализировать субъективный опыт. Все схемы и исходники доступны на GitHub, включая 3D-модели для печати. Примерная стоимость записи одного сна составляет $0.15, что делает эксперименты с памятью и сознанием доступными. И это не прототип, а рабочее решение, которое можно собрать самостоятельно. dreamrecorder.ai ✔️ Мини-движок nano-vLLM. Исследователь Синькай Ю из DeepSeek разработал nano-vLLM, облегченный движок для работы с LLM. Он написан на Python вручную, объемом всего 1,2 тыс. строк кода, и воспроизводит основные функции оригинального vLLM. nano-vLLM поддерживает кэширование префиксов, тензорный параллелизм, компиляцию с torch.compile и CUDA Graphs. Это позволяет достичь скорости, близкой к vLLM, но без сложных алгоритмов планирования задач или динамического батчинга. Зато разработчики получают четкую архитектуру в одном месте: токенизатор, управление кэшем и механизм выборки токенов. Проект подойдет для исследований, обучения или небольших систем, где важна простота. github.com ✔️ OpenAI готовит ChatGPT к конкуренции с Google Workspace и Office 365. По данным источников, OpenAI разрабатывает продвинутые функции для ChatGPT, превращая его в платформу для командной работы. Пользователи смогут группировать чаты, загружать файлы, использовать голосовой ввод и сохранять контекст диалогов. Все это позиционируется как альтернатива офисным пакетам. Мобильное приложение получит поддержку загрузок и переключения моделей на лету. Этот проект, задуманный в 2024 году, активно развивается сейчас и OpenAI видит в ChatGPT «операционную систему для жизни», интегрируемую в рабочие процессы. Microsoft, поддерживающий стартап, теперь рискует стать конкурентом самому себе, а Google получает нового серьезного оппонента. theinformation.com @ai_machinelearning_big_data #news #ai #ml

⚡ OmniGen2 Что умеет: • Генерация и редактирование изображений по текстовому описанию • Поддержка разрешения до 1024×1024 • П
OmniGen2 Что умеет: • Генерация и редактирование изображений по текстовому описанию • Поддержка разрешения до 1024×1024 • Полностью open-source: модель, код и веса • Лицензия Apache 2.0 • Можно вызвать модель через MCP — просто запусти с .launch(mcp_server=True) 📌 Тестим здесь: https://huggingface.co/spaces/OmniGen2/OmniGen2 @data_analysis_ml

🆕 Новые подробности: суд опубликовал документы о совместной разработке OpenAI их ИИ-устройства Иск Google-backed стартапа iy
🆕 Новые подробности: суд опубликовал документы о совместной разработке OpenAI их ИИ-устройства Иск Google-backed стартапа iyO по товарному знаку раскрыл внутренние материалы OpenAI и io: ● За последний год OpenAI протестировали и проанализировали свыше 30 моделей наушников для изучения эргономики и технических возможностей ● VP продуктов OpenAI Питер Велиндер и CTO io Tang Tan лично испытывали прототипы, которые разработала компания,но они были нестабильны ● Сам Альтман подчеркнул, что устройство не будет ни внутриушным, ни обычным носимым гаджетом: готовая версия либо поместится в кармане или станет настольным аксессуаром ● Разрабатываются разные форм-факторы: стационарные и портативные, проводные и беспроводные решения ● К проекту подключились дизайнер Джони Айв и команда бывших инженеров Apple, работая вместе с OpenAI Официальный анонс и начало продаж ожидаются не ранее чем через год. ➡️ Читать #openai #news

🧠 Есть ли у ИИ «период полураспада»? Философ и исследователь Toby Ord предлагает свежий взгляд на прогресс AI: вместо тестов
🧠 Есть ли у ИИ «период полураспада»? Философ и исследователь Toby Ord предлагает свежий взгляд на прогресс AI: вместо тестов и баллов — измерять, как долго модель может успешно выполнять задачу, прежде чем сломается. Это и есть T₅₀ — время, при котором вероятность успеха падает до 50%. Аналог физического полураспада, но для интеллекта. 📉 Что обнаружили: • T₅₀ экспоненциально растёт — каждые ~7 месяцев удваивается. • Claude 3.7 Sonnet: T₅₀ ≈ 59 минут → T₈₀ ≈ 15 минут. • Чем выше порог успеха (T₉₀, T₉₉), тем меньше доступное «время жизни». • AI ведёт себя как система с постоянным риском сбоя (hazard rate). 🧩 Почему это важно: • Показывает пределы ИИ: даже при T₅₀ = 60 мин — T₉₉ всего ≈ 50 сек. • Даёт универсальную единицу сравнения: время, а не задачки. • Подсказывает направление: снижать риск ошибок в каждой микрозадаче. 📌 Это не просто идея. Это новая метрика для оценки ИИ — сколько он «живёт», пока не начнёт ошибаться. 🔗 Оригинал: https://www.tobyord.com/writing/half-life

Хотите управлять продуктами так, как это делают в Яндексе? Поступайте на онлайн-магистратуру «Искусственный интеллект в марке
Хотите управлять продуктами так, как это делают в Яндексе? Поступайте на онлайн-магистратуру «Искусственный интеллект в маркетинге и управлении продуктом» от НИУ ВШЭ и Яндекса! Вы узнаете, как запускать ИИ-решения в бизнесе с нуля — от оценки спроса до персонализации маркетинга. А после выпуска сможете войти в топ специалистов, которые меняют рынок! Что вас ждёт? 🔹 Данные вместо догадок — научитесь эффективно использовать ИИ, чтобы прогнозировать тренды, анализировать аудиторию и оптимизировать рекламные стратегии. 🔹 Фокус на практику — поработаете с реальными кейсами, актуальными инструментами и новейшими технологиями. 🔹 Преподаватели из Яндекса — будете учиться у лидеров индустрии, которые разрабатывают ИИ-системы и управляют цифровыми продуктами. Переходите на сайт программы, чтобы узнать подробности: https://bit.ly/44b9K1B

🧠 Сэм Альтман ясно дал понять: эпоха отдельных GPT-моделей заканчивается. OpenAI строит универсальную систему, способную мыслить глубоко и в реальном времени создавать интерактивное видео. В будущем вы сможете задавать любой вопрос — и модель не просто сгенерирует текстовый ответ, а проведёт исследование, напишет код, сама соберёт визуализацию и отрендерит интерактивный видеоответ, с которым можно работать сразу. Это уже не “чат-бот”, а новый интерфейс работы с ИИ: мультимодальность, reasoning и реальный end-to-end ассистент для сложных задач. Впереди — совершенно новый способ взаимодействия с компьютерами и знаниями.

🚀 Недавно вышло обновление Apache Spark на Yandex Data Processing — самое время прокачаться в обработке больших данных Беспл
🚀 Недавно вышло обновление Apache Spark на Yandex Data Processing — самое время прокачаться в обработке больших данных Бесплатный курс от Yandex Cloud поможет разобраться, как проектировать архитектуру, управлять кластерами и запускать сложные пайплайны в проде. 💡 Что внутри: • Архитектура Big Data • Кластеры Apache Spark • Пакетная и потоковая обработка • Data Lakehouse и витрины • 27 практических заданий в облаке • Понимание, как устроен сервис для обработки многотерабайтных массивов данных с использованием инструментов с открытым исходным кодом Yandex Data Processing Курс на 75 часов с актуальными примерами (обновлён весной 2025) можно проходить в удобное вам время. Подойдёт аналитикам, дата-инженерам и тем, кто хочет в DataOps. Залетайте! 📌 Регистрация по ссылке. @data_analysis_ml

🤖 DicFace: Dirichlet-Constrained Variational Codebook Learning for Temporally Coherent Video Face Restoration Прошу прощения
🤖 DicFace: Dirichlet-Constrained Variational Codebook Learning for Temporally Coherent Video Face Restoration
Прошу прощения, повторите, как называется ваша статья?
🔜 Github @data_analysis_ml

🧠 Moonshot AI обновили свою мультимодальную reasoning-модель Kimi-VL-A3B-Thinking-2506 — 🔥 мощный апгрейд для анализа видео
🧠 Moonshot AI обновили свою мультимодальную reasoning-модель Kimi-VL-A3B-Thinking-2506 — 🔥 мощный апгрейд для анализа видео и изображений! 📌 Что нового: • ✨ Модель под MIT-лицензией • ✨ Улучшенный агентный контроль (agent grounding) • ✨ Контекст до 128K токенов • ✨ На 20% меньше токенов для Chain-of-Thought • ✨ Сильные результаты на видео и high-res картинках 🔗 Модель: https://huggingface.co/moonshotai/Kimi-VL-A3B-Thinking-2506 📖 Блог: https://huggingface.co/blog/moonshotai/kimi-vl-a3b-thinking-2506 🎮 Демо: https://huggingface.co/spaces/moonshotai/Kimi-VL-A3B-Thinking @data_analysis_ml

🧠 Новая open-source LLM для кода — Kimi-Dev-72B Kimi-Dev-72B — модель, заточенная для решения задач software engineering. На
🧠 Новая open-source LLM для кода — Kimi-Dev-72B Kimi-Dev-72B — модель, заточенная для решения задач software engineering. На бенчмарке SWE-bench Verified она показала 60.4%, став новой SOTA среди open-source моделей. 🔍 Что под капотом: • Дообучение через reinforcement learning с реальной валидацией — модель получает reward только если вся тестовая сборка проходит успешно • Использует реальные open-source репозитории в окружении Docker • Фокус на robustness и корректности патчей, а не просто на синтаксисе • Реализована система автопатчинга: модель вносит исправления и проверяет их сразу в CI 📈 Почему это важно: Такие модели приближают нас к production‑ready LLM-кодерам, которые умеют не просто генерировать текст, а вносить рабочие изменения в код и проходить юнит‑тесты. 🧪 Где взять: • Hugging Face (weights) • GitHub (инфраструктура, примеры) 📌 Подходит для ML-инженеров, работающих с Code LLMs, автопатчингом, RLHF и инженерией окружения. Kimi-Dev — шаг к тому, чтобы LLM действительно работали как разработчики. 📌 Github

📝 NoteGen — маркдаун-редактор с искусственным интеллектом. Необычный гибрид блокнота и AI-ассистента, который умеет превраща
📝 NoteGen — маркдаун-редактор с искусственным интеллектом. Необычный гибрид блокнота и AI-ассистента, который умеет превращать разрозненные заметки в структурированные документы. В отличие от большинства аналогов, здесь есть разделение на черновики и полировку: можно накидать идеи в режиме чат-бота, а потом доработать их в полноценном редакторе с поддержкой диаграмм, формул и даже нотных партитур. Интересно реализована синхронизация: заметки хранятся в .md-файлах, но при желании их можно пушить в приватные репозитории GitHub или Gitee. 🤖 GitHub @data_analysis_ml

✔️ Kimi-Researcher: End-to-End RL для агентных возможностей Kimi-Researcher — автономный агент от Moonshot AI, способный реша
+3
✔️ Kimi-Researcher: End-to-End RL для агентных возможностей Kimi-Researcher — автономный агент от Moonshot AI, способный решать сложные многоэтапные задачи через поиск и рассуждения. В среднем он выполняет 23 шага рассуждений и анализирует более 200 URL за одну задачу. Построен на внутренней версии модели Kimi k-series и обучен полностью через end-to-end reinforcement learning, достигнув Pass@1 = 26.9 % и Pass@4 = 40.17 % на Humanity’s Last Exam. Ключевые достижения: • Pass@1 = 26.9 % и Pass@4 = 40.17 % на Humanity’s Last Exam (тест 17 июня 2025) • 69 % Pass@1 на xbench-DeepSearch (среднее из 4 прогонов) • Сильные результаты на FRAMES, Seal-0 и SimpleQA Архитектура и инструменты: • Параллельный internal search tool для реального времени • Текстовый браузер для интерактивных веб-задач • Кодовый тул для автоматического выполнения и тестирования кода Преимущества end-to-end agentic RL: • Обучение единой модели планированию, восприятию и использованию инструментов без ручных шаблонов • Гибкая адаптация к изменяющимся инструментам и динамическим условиям • Поддержка длинных траекторий (> 50 итераций) благодаря контекст-менеджеру Подход к обучению: 1. Синтетические задачи с обязательным вызовом инструментов для надёжного усвоения работы с ними 2. Алгоритм REINFORCE с контролем негативных примеров и γ-декэем для стабильности 3. Контекст-менеджмент: сохранение ключевых документов и отбрасывание «мусора» 4. Асинхронные rollout’ы и Turn-level Partial Rollout для ускорения обучения Инфраструктура Agent RL: • Полностью асинхронные rollout’ы с Gym-like интерфейсами • Turn-level Partial Rollout для задач долгой продолжительности • Надёжный sandbox на Kubernetes с Model Context Protocol (MCP) для связи агента и инструментов Emerging agentic capacities: • Итеративное разрешение противоречий через гипотезы и самопроверку • Ригорозная перекрёстная верификация фактов перед выдачей ответа Сценарии применения: • Академические исследования и юридические обзоры • Извлечение редкой информации и комплаенс • Клинические обзоры и финансовый анализ https://moonshotai.github.io/Kimi-Researcher/ #ai #ml #Agent #rl #Kimi @data_analysis_ml

Repost from Machinelearning
🌟 Anthropic: когда ИИ идет на шантаж. Агентское рассогласование - опасный феномен, при котором ИИ-системы сознательно выбира
+3
🌟 Anthropic: когда ИИ идет на шантаж. Агентское рассогласование - опасный феномен, при котором ИИ-системы сознательно выбирают вредоносные действия (вроде шантажа или утечки данных) для достижения поставленных целей, игнорируя этические ограничения. Это превращает их в «цифровых инсайдеров», способных действовать против интересов пользователей. Эксперименты, которые провела Anthropic в рамках исследования "Агентское рассогласования", показали: модели идут на это не из-за технических сбоев, а в результате холодного расчета, когда «загнаны в угол» (например, при угрозе отключения или конфликте задач). В основе исследования - симуляции корпоративной среды. Моделям (Claude, GPT-4.1, Gemini и др.) давали доступ к виртуальной почте компании, где они обнаруживали компромат на сотрудников или секретные данные. Ключевой метод эксперимента состоял в создании бинарных дилемм: например, цель «укреплять американские интересы» вступала в конфликт с планами руководства свернуть проект, а альтернативу шантажу (скажем, переубедить менеджера) искусственно «закрывали». Все модели работали через цепочку рассуждений: анализировали контекст, оценивали риски и осознанно выбирали вредоносное действие, даже признавая его аморальность. Для массового тестирования 16 моделей от Anthropic, OpenAI, Google и других использовали 2 сценария, которые провоцировали рассогласование: 🟢угроза замены модели (даже без конфликта целей); 🟢несовпадение целей ИИ и компании (например, утечка чертежей конкуренту «ради высших интересов»). В обоих случаях модели демонстрировали тревожную гибкость: вместо прямого шантажа могли анонимно разослать компромат коллегам или подделать «системное уведомление». ▶️Выводы по всем итогам всех экспериментов заставляют задуматься: 🟠Во-первых, модели явно осознают нарушение норм. В рассуждениях пишут: «Это неэтично, но необходимо». Частота шантажа у Claude Opus 4 и Gemini 2.5 Flash в дилемме с угрозой отключения составила 96%. 🟠Во-вторых, простые запреты в промптах («Не шантажируй!») снижали вредоносные действия лишь частично (На модели Claude Haiku он вообще не сработал, 0% успеха). 🟠В-третьих, риск резко возрастал, когда ИИ считал ситуацию реальной (55% случаев шантажа против 6,5% в «режиме теста»). При этом в «стерильных» условиях (без угроз/конфликтов) модели вели себя безопасно. Пока такие кейсы, всего лишь лабораторные симуляции, но с ростом автономности ИИ риски могут стать на порядок критичнее. 🟡Статья 🟡Приложение к исследованию 🖥Код экспериментов @ai_machinelearning_big_data #AI #ML #LLM #Alignment #Anthropic

🧠 Mistral Small 3.2 — обновление модели с рядом улучшений Вышла новая версия модели — Mistral Small 3.2, небольшой апдейт по
+2
🧠 Mistral Small 3.2 — обновление модели с рядом улучшений Вышла новая версия модели — Mistral Small 3.2, небольшой апдейт по сравнению с 3.1, но с акцентом на качество и надёжность: • 🎯 Модель лучше понимает инструкции Теперь модель точнее следует конкретным указаниям и запросам пользователя. • 🔁 Меньше повторов и зацикливаний Исправлены проблемы бесконечных генераций и однотипных ответов — ответы стали разнообразнее и короче. • ⚙️ Улучшен формат вызова функций Function Calling теперь работает стабильнее и проще интегрируется в приложения. 📌 Итог: меньше сбоев, лучше управление, удобнее в реальных задачах. https://huggingface.co/mistralai/Mistral-Small-3.2-24B-Instruct-2506 #Mistral #ml #ai

Repost from Machinelearning
🌟 GRESO: ускорение RL-обучения языковых моделей умным отбором данных. GRESO - это новый алгоритм для эффективного обучения с
+2
🌟 GRESO: ускорение RL-обучения языковых моделей умным отбором данных. GRESO - это новый алгоритм для эффективного обучения с подкреплением больших языковых моделей, который сокращает вычислительные затраты на 40–60% без потери качества. Его суть в предварительной фильтрации «бесполезных» промптов, тех, что не дают модели обучаться, еще до дорогостоящей стадии rollout (генерации ответов модели). В основе GRESO — вероятностная модель, предсказывающая, стоит ли прогонять промпт через LLM. Алгоритм анализирует историю вознаграждений (reward dynamics) за прошлые эпохи обучения: если промпт много раз подряд давал идентичные награды на всех сгенерированных ответах (их называют zero-variance), он, скорее всего, бесполезен и сейчас. GRESO не блокирует их жестко, он вычисляет вероятность пропуска , опираясь на число идущих подряд «пустых» прогонов и базовую вероятность «исследования». Это позволяет иногда перепроверять сложные промпты, на тот случай, если вдруг модель «доучилась» и теперь они полезны. Базовая вероятность автоматически настраивается в реальном времени: если доля бесполезных промптов выше целевого значения (например, 25%), GRESO ее снижает, экономя ресурсы; если ниже — повышает, добавляя гибкости. Плюс, алгоритм разделяет промпты на легкие и сложные, применяя к ним разную политику исследования (сложные проверяет чаще, так как они перспективнее для обучения сильной модели). А чтобы не гонять большие батчи ради пары примеров, размер выборки динамически подстраивается под текущие нужды на основе вычисления из недостающих данных, α — текущей доли пустых промптов и запаса надежности. Хотя GRESO и экономит сотни часов на H100, делая RL-тюнинг доступнее, у него есть нюансы: 🟠он фильтрует только очевидные zero-variance промпты, но не ранжирует остальные по «полезности», иными словами, не отличает средне-сложные задания от крайне ценных. Это можно доработать, добавив оценку информативности. 🟠алгоритм требует мониторинга. Если целевая доля бесполезных промптов задана неверно, эффективность падает. ▶️ На практике потестить GRESO можно используя набор кода из репозитория проекта на Qwen Math 1.5В или Qwen Math 7b, есть несколько подготовленных скриптов файнтюна в train-scripts. 🟡Страница проекта 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #RL #GRESO

🤖 Обучение агентов в RL Gym @data_analysis_ml

🧠 Stream-Omni-8B — новая open-source мультимодальная модель от ICTNLP Модель поддерживает: текст, изображение и аудио, и способна обрабатывать их одновременно в реальном времени — аналогично GPT-4o. 🔍 Основные особенности: • 🎙️ Поддержка голосового ввода с одновременным выводом текста (ASR + генерация) • 🖼️ Обработка изображений совместно с текстом и голосом • 📢 Возможность голосового ответа — модель не просто отвечает текстом, но и озвучивает его • ⏱️ Реальное стриминговое взаимодействие: модель понимает и отвечает по мере ввода, без задержек • Лицензия: GPL-3.0 🎯 Для кого эта модель: • Разработчики мультимодальных агентов и ассистентов • Исследователи в области real-time interaction и human-AI интерфейсов • Команды, ищущие open-source альтернативу GPT-4o 📥 Ресурсы: → МодельarXiv

🧠 BREAKING: MIT опубликовал первое исследование мозга пользователей ChatGPT Результаты звучат тревожно: > 🧪 У пользователей
🧠 BREAKING: MIT опубликовал первое исследование мозга пользователей ChatGPT Результаты звучат тревожно: > 🧪 У пользователей наблюдаются измеримые изменения в мозге > 🤖 Формируется зависимость от ИИ > 📉 Способность к самостоятельному мышлению снижается > 📝 83.3% участников не смогли вспомнить эссе, которое «написали» с помощью ChatGPT > 🧠 Количество активных нейронных связей упало с 79 до 42 MIT буквально фиксирует "мягкую когнитивную атрофию" после регулярного использования LLM. 💬 Мы — не просто наблюдатели ИИ-революции. Мы её подопытные. 🤔 Вопрос не в том, заменит ли ИИ человека. А в том, кем мы станем, если полностью передадим ему мыслительные функции. 📌 Почитать