Анализ данных (Data analysis)

رفتن به کانال در Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

نمایش بیشتر

شبکه:Machinelearning روسيا12 559 فناوری و برنامه‌ها2 679...

📈 تحلیل کانال تلگرام Анализ данных (Data analysis)

کانال Анализ данных (Data analysis) (@data_analysis_ml) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 50 152 مشترک است و جایگاه 2 679 را در دسته فناوری و برنامه‌ها و رتبه 12 559 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 50 152 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 13 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -42 و در ۲۴ ساعت گذشته برابر -11 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 8.83% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.66% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 4 426 بازدید دریافت می‌کند. در اولین روز معمولاً 2 839 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 30 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند llm, контекст, openai, архитектура, deepseek تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 14 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

50 152

مشترکین

-1124 ساعت

-597 روز

-4230 روز

4 426

نمایش های پست

~ 2 83924 ساعت

~ 3 39048 ساعت

8.83%

نرخ مشارکت

~ 5

پست های در روز

Ads index

beta

آرشیو پست ها

50 150

Технологическая платформа Авито ускорила в 5 раз процесс поиска и проверки уязвимостей. Компания внедрила в работу отдела кибербезопасности собственную языковую модель, которую обучили на тысячах примерах уязвимостей. К работе также подключили сканер от Авито DeepSecrets — каждый разработчик может бесплатно его использовать, все лежит на GitHub. Модель научилась выявлять 99 из 100 потенциальных уязвимостей — она анализирует потенциально чувствительные данные и учитывает контекст кода. Чтобы не пропустить угрозы, код проверяют дополнительными алгоритмами, а инженеры выборочно оценивают работу нейросети. Такой подход позволил освободить 25% рабочего времени специалистов по кибербезопасности. Если раньше на оценку 50 000 предупреждений специалисты могли потратить полгода, то сейчас с этим объемом машина справляется за день. В планах Авито — внедрить ИИ в оценку рисков и моделирование угроз. Это эффективно, как доказывают исследования: компании, которые применяют ИИ, на 100 дней быстрее находят утечки данных. Подпишитесь на полезные каналы Авито

50 150

🏆 Sakana AI выиграла ICFP 2025 - благодаря новой системе эволюции кода ShinkaEvolve Исследователи из Sakana AI и команда Unagi показали, что большие языковые модели можно использовать не просто для генерации программ, а для пошаговой эволюции и оптимизации уже существующего кода. ShinkaEvolve - это эволюционный фреймворк, где языковая модель играет роль «генетического программиста». Она не пишет решения с нуля, а мутирует, оценивает и улучшает уже работающий код. Процесс идёт циклами, похожими на естественный отбор. 1. Инициализация Модель получает исходный код (обычно корректный, но неоптимальный) и описание метрики — например, скорость или точность. 2. Мутации (Variations) LLM вносит небольшие изменения: перестраивает цикл, меняет структуру данных, переписывает логику с рекурсии на итерацию, удаляет лишние вычисления и т.д. 3. Оценка (Evaluation) Каждая версия автоматически компилируется и запускается на тестах. Система измеряет, стало ли решение быстрее или стабильнее. 4. Отбор (Selection) Лучшие варианты проходят дальше, худшие отбрасываются. LLM получает обратную связь: что сработало, а что нет. 5. Итерации Процесс повторяется десятки или сотни раз. В исследовании — около 320 поколений за ~60 долларов вычислительных затрат. Изначально решение ICFP-задачи использовало SAT-кодирование (логическую форму для solver'а), но плохо масштабировалось. ShinkaEvolve смогла: - переписать часть кода, чтобы сократить количество ограничений; - внедрить промежуточное представление («дверь → вершина → дверь»), что уменьшило сложность; - оптимизировать поиск и кэширование данных. Результат — ускорение до 10×, а на некоторых тестах — почти в 10 раз быстрее базового решения. ShinkaEvolve — не просто автоматический оптимизатор. Это новый способ мышления об ИИ-программировании: модель не заменяет разработчика, а ведёт себя как «цифровой соавтор», который предлагает гипотезы и тестирует их сотни раз быстрее, чем человек. 🟠Подробнее: https://sakana.ai/icfp-2025 🟠Код: https://github.com/SakanaAI/ShinkaEvolve 🟠Статья: https://arxiv.org/abs/2509.19349 🟠Блог: https://sakana.ai/shinka-evolve/

50 150

🧠 Учёные из Penn State обнаружили нечто **дикое**: грубость делает ChatGPT умнее. Они протестировали ChatGPT-4o на 250 вопросах с 5 уровнями вежливости: • Очень вежливо → 80.8% точности • Вежливо → 81.4% • Нейтрально → 82.2% • Грубо → 82.8% • Очень грубо → 84.8% Статистический анализ подтвердил: это не случайность — жёсткие запросы стабильно дают лучший результат. Ещё интереснее: старые модели вроде GPT-3.5 реагировали *наоборот*. А вот GPT-4 и новее становятся точнее, когда с ними разговаривают резче. Источник: https://arxiv.org/abs/2510.04950

50 150

🚀 Школа аналитиков данных МТС Web Services: прием заявок Возможность получить дополнительное профессиональное образование для студентов последних курсов технических специальностей, Junior/middle аналитиков данных, ИТ-специалистов, желающих лучше изучить анализ данных. 🔹 Что вас ждет: 10-месячное бесплатное онлайн-обучение по программе, разработанной с учетом ключевых направлений в изучении больших данных: SQL, Python, ML, Big Data, работа с нейросетями и рекомендательными системами. Регулярные вебинары от действующих экспертов из разных продуктов Центра BigData MWS и обратная связь специалистов в течение всего курса, в том числе разбор практических кейсов. 🎯 Самые талантливые студенты смогут пройти стажировку в МТС Web Services и получить оффер. Оставить заявку и пройти профильное тестирование можно до 30 октября здесь.

50 150

💡 Еще один дикий пример работы Gemini 3.0 Pro , модель превращает один длинный промпт в полноценный сайт. По одному промпту получили интерактивную страницу с эффектами симуляции: сетки под объектами, прогрессивная подгрузка текстур, глюки физики, матричный дождь кода, переключение между видами rendered и source, фоновый шум процессора и финальный мета-момент, где сайт признаёт, что на него смотрят. Всё укладывается в один HTML-файл и открывается в Chrome. Промпт:

Write code for a mysterious website about simulation theory. Make it feel like reality is rendering in real-time — wireframe grids that appear under solid objects, textures that load progressively, physics glitches where elements float momentarily. Include matrix-style falling code backgrounds, sections that flicker between "rendered" and "source code" views, ambient computer processing sounds, and a final meta moment where the website acknowledges it's being viewed. Design it like a philosophy professor's existential crisis coded by a game engine developer. make sure I can paste it all into a single HTML file and open it in Chrome.

🟢 Код: https://codepen.io/ChetasLua/pen/ogbGqwW 🟢Пост: https://x.com/chetaslua/status/1978226719225004290

50 150

✨ ByteDance представила FaceCLIP - новую модель для генерации изображений с сохранением личности Модель FaceCLIP обучается представлять лицо (Identity) и текстовое описание в едином векторном пространстве, что позволяет создавать изображения, где сохраняется похожесть субъекта и при этом учитывать желаемую стилистику или указания из текста. :contentReference[oaicite:0]{index=0} Авторы отказались от подходов с адаптерами и предложили унифицированную мультимодальную стратегию кодирования: лицо + текст → общее представление, которое направляет генеративную модель (UNet / DiT) при синтезе. Преимущества FaceCLIP: - лучшие результаты в сохранении идентичности на портретах - более точное соответствие текстовым инструкциям - высокая реалистичность по сравнению с предыдущими методами Модель доступна под лицензией MIT / некоммерческое исследовательское использование — с предупреждением об ответственном использовании. :contentReference[oaicite:4]{index=4} 📄 HF: https://huggingface.co/ByteDance/FaceCLIP

50 150

⚡ Goldman Sachs: ИИ съест 20% всей мировой энергии к 2030 году По прогнозу Goldman Sachs, к 2030 году спрос на электроэнергию со стороны дата-центров вырастет на 25%, а доля ИИ в общем энергопотреблении достигнет 20%. 🔥 Когда-то огонь изменил жизнь человека - с ним началась кулинария, эволюция мозга и социальное развитие. ⚙️ Затем электричество стало топливом индустриальной эпохи, двигая экономику и прогресс. 🤖 Теперь настала очередь искусственного интеллекта: один запрос к ChatGPT потребляет около 2,9 ватта, почти в 10 раз больше, чем обычный поиск Google. Если ИИ реализует хотя бы часть своего потенциала, то энергия станет главным ограничителем его роста. И, как отмечает Goldman, это создаёт новую инвестиционную волну — не только в чипы и модели, но и в энергетику. 📊 По оценке McKinsey, к 2030 году потребление электроэнергии дата-центрами в США вырастет с 3–4% до 11–12%, увеличившись с 25 до 80 ГВт.

50 150

🚀 Новый курс на Stepik: AI Agents PRO Если вы работаете с ML/DS и хотите перейти от моделей → к готовым продуктам на базе LLM, без понимания агентов уже никуда. 🔹 Что внутри: Архитектура агентов (FSM, DAG, Supervisor–Worker, Critic–Executor). Интеграции: API, БД, браузеры, CRM. Retrieval-Augmented Generation (Qdrant, Weaviate, FAISS). Надёжность: ретраи, guardrails, работа с PII. LLMOps: метрики качества, A/B-тесты, дашборды. Продакшн-деплой: Docker, очереди сообщений, CI/CD. Итоговый проект: собственный агент под реальный бизнес-кейс. 🎯 По итогу вы сможете строить и выкатывать production-ready AI-агентов, а не просто писать демки в ноутбуках. 🔥 Спец-условия: только по промо AGENTS30 — -30% на старт (действует 48ч). 👉 Пройти курс со скидкой

50 150

🍏Ничего сверхъестественного - просто Gemini 3 Pro за один (!) промпт разворачивает полноценную симуляцию macOS или Windows прямо в браузере. Всего 900 строк кода - и у вас уже есть рабочий интерфейс с анимациями, меню, браузером и даже терминалом. Модель справляется с этим за 172 секунды. Код и демо уже доступны - а инсайдеры шепчут, что официальный релиз выйдет на этой неделе. Первые тестеры называют Gemini 3 Pro «лучшим ИИ для кодинга на сегодня». https://codepen.io/ChetasLua/pen/EaPvqVo

50 150

🎥 Lynx: Высококачественная генерация персонализированного видео Lynx — это модель генерации видео, которая создает персонализированные ролики на основе одного изображения. Использует Diffusion Transformer с адаптерами для сохранения идентичности и улучшения деталей. 🚀 Основные моменты: - Генерация видео с высоким качеством из одного изображения. - Легковесные модели для эффективного создания видео. - Поддержка различных адаптеров для улучшения качества. 📌 GitHub: https://github.com/bytedance/lynx #python

50 150

⚡️ Samsung идёт на риск, чтобы вернуть лидерство в гонке AI-памяти - ставка на сверхбыструю HBM4 Samsung решила изменить правила игры на рынке чипов и убедить Nvidia повысить официальную скорость HBM4, даже несмотря на то, что конкуренты: SK Hynix и Micron - раньше показали первые образцы. Обычно разработчики HBM (High Bandwidth Memory) делают акцент на контроле температуры, ведь многослойная DRAM быстро нагревается. Но теперь Nvidia потребовала большего - выше частоты, выше скорость. Для Hynix и Micron это стало неожиданностью: их решения оптимизированы под стабильность, а не под разгон. А вот Samsung оказалась готова. Её HBM4-чипы уже достигли более высоких частот на тестах - благодаря технологическому преимуществу: - DRAM-чипы производятся по 1c-процессу (6-е поколение 10 нм), - базовый логический кристалл - на 4-нм техпроцессе Samsung Foundry. Для сравнения: - SK Hynix использует 12-нм процесс TSMC, - Micron - старый DRAM-процесс. Более продвинутая литография даёт Samsung лучший контроль над энергопотреблением и сигналами. Компания уже ускоряет производство и планирует вывести HBM4 на рынок в 2026 году, когда спрос на память для AI-систем резко превысит предложение. Такой шаг может вернуть Samsung утраченные позиции после неудачи с HBM3E. Ключевой момент - тесты Nvidia Rubin. Если HBM4 покажет проблемы с нагревом или надёжностью при интеграции, вся стратегия может рухнуть. Но если всё пройдёт успешно, Samsung сможет опередить Hynix и Micron, снова захватив лидерство в памяти для AI-ускорителей. Итог: Samsung делает ставку на скорость, технологии и масштаб. Это рискованный, но стратегический шаг, который может определить баланс сил на рынке AI-чипов в ближайшие годы. 🟠Подробности #Samsung #Nvidia #AI

50 150

Repost from Machinelearning

⚡️ Mamba-3 тихо и без объявления вышла на ICLR - и это может стать началом конца эпохи Transformers. Новая архитектура Mamba-3 делает модели быстрее, стабильнее и эффективнее при работе с длинными контекстами. Главная идея - не в слоях внимания, а в state-space моделях, где модель хранит и обновляет внутреннее состояние во времени. 📘 Краткие эускурс: - Mamba-1 ввела непрерывную динамику и выборочное обновление памяти - помнила эффективно без высокой цены attention. - Mamba-2 показала, что обновления состояния и attention - это две стороны одной математики, что ускорило вычисления на GPU. - Mamba-3 довела концепцию до зрелости: теперь внутренняя память развивается плавнее и устойчивее за счёт перехода от простого шага Эйлера к трапецеидальному интегрированию. Вместо простого шага Эйлера, как в Mamba-2, Mamba-3 аппроксимирует интеграл обновления состояния не только по правому концу интервала, но усреднением между началом и концом, с коэффициентом λ, зависящим от данных. Это даёт более точное приближение (второго порядка) и делает динамику состояния более выразительной. 🧠 Что изменилось под капотом: - Память стала «ритмичной»: теперь модель может хранить повторяющиеся и периодические паттерны (например, структуры языка или музыки). - Новый multi-input-multi-output дизайн позволяет обрабатывать несколько потоков параллельно — идеально для современных GPU. ⚙️ Что это даёт на практике: - Эффективная работа с длинными последовательностями: документы, геномы, временные ряды. - Линейное время выполнения и стабильная задержка делают её идеальной для реального времени: чат-ботов, перевода, речи. - Энергоэффективность и масштабируемость открывают путь к on-device AI, где большие модели работают локально, без облака. Mamba-3 - это не просто ускоренная альтернатива Transformers. Это новая архитектура, которая объединяет глубокое понимание контекста, скорость и устойчивость, от серверных систем до умных устройств. 🟢 Подробности: https://openreview.net/pdf?id=HwCvaJOiCj @ai_machinelearning_big_data #ssm #mamba3 #llm,#architecture #ai

50 150

NVFP4 - новый формат, который обучает 12B Mamba Transformer в 4 бита без потери точности Исследователи представили NVFP4 - способ хранить числа в 4 битах вместо 8 или 16, почти без потери качества обучения. Главная идея - умное блочное квантование: - Все значения делятся на блоки по 16 чисел. - Каждый блок имеет свой локальный scale (8 бит). - Весь тензор получает глобальный scale (32 бита). Так сохраняется высокая точность локальных значений и не теряются экстремально большие или маленькие числа. 📊 Результаты: - Обучение 12B Mamba Transformer на 10T токенов в 4 битах показало точность, сопоставимую с FP8. - Вычисления стали в 2–3 раза быстрее, а использование памяти снизилось на 50%. - Потеря точности не превышает 1–1.5% по метрикам. - MMLU Pro: 62.58% (NVFP4) против 62.62% (FP8). - MBPP+: 55.91% против 59.11%. - Градиенты используют стохастическое округление, чтобы избежать накопления ошибок. - По сравнению с MXFP4, NVFP4 требует на 36% меньше данных для того же уровня потерь. На поздних этапах обучения переход на BF16 почти устраняет разрыв в качестве. NVFP4 уже поддерживается в Transformer Engine и на Blackwell GPU, включая все нужные режимы округления. 📄 Исследование: https://arxiv.org/abs/2509.25149

50 150

🚀 Улучшение подсказок для генерации изображений PromptEnhancer — это утилита для переписывания подсказок, которая сохраняет исходный замысел и делает его более ясным и логичным. Подходит для задач генерации изображений и других приложений, требующих структурированных запросов. 🚀 Основные моменты: - Сохраняет ключевые элементы запроса (субъект, действие, стиль и т.д.) - Создает последовательные и логически структурированные подсказки - Поддерживает настраиваемые параметры вывода для разнообразия и детерминизма - Обеспечивает надежный парсинг выходных данных с возможностью резервного копирования 📌 GitHub: https://github.com/Hunyuan-PromptEnhancer/PromptEnhancer #python

50 150

🖥 Чип, который работает как мозг человека Учёные из Monash University создали микрочип размером с монету, который ведёт себя как настоящие нейроны мозга. 💧 В основе — жидкостная структура из металлоорганического каркаса (MOF). Через микроскопические каналы внутри неё проходят ионы, как электрические импульсы в мозге, — именно так чип обрабатывает сигналы. Главная особенность — он запоминает прошлые импульсы и меняет своё поведение на основе опыта. То есть этот чип не просто считает — он обучается, как нейросеть в нашем мозге. ⚡ Это может стать началом новой эры компьютеров — умных, адаптивных и “живых”, где вычисление и память объединены в одном устройстве. phys.org/news/2025-10-scientists-nanofluidic-chip-brain-memory.html

50 150

🖥 Новый курс на Stepik - PostgreSQL для разработчиков: от основ к созданию API Здесь на пальцах объясняют не только как писать SQL-запросы, а строить настоящие backend-сервисы с базой данных как у профи. В этом курсе ты шаг за шагом создашь REST API на FastAPI + PostgreSQL: от установки среды и первых таблиц - до масштабируемого приложения с безопасностью и CRUD-операциями. 🔹 На практике разберете: • SQL-запросы, фильтры, агрегаты и подзапросы • Связи между таблицами и нормализацию БД • Взаимодействие Python и PostgreSQL • Реализацию REST API и подключение базы • Оптимизацию и разбор реальных задач с собеседований ⚡ После курса у вас будет свой работающий API-проект и реальные навыки работы с PostgreSQL в продакшене. 🎁 Сегодня –30% от цены! 🚀 Прокачаю свои знания: https://stepik.org/course/255542/

50 150

⚡️ DeepMind выпустила удобный Colab-ноутбук для дообучения модели Gemma 3-270M на задаче генерации эмодзи. Это лёгкий эксперимент - всего 270 млн параметров, используется QLoRA и короткие последовательности, поэтому обучение можно спокойно запускать на локальной машине или в Colab. Модель также легко встраивается в JavaScript -приложения через transformers.js. Все материалы автор обещал выложить в треде. Задача генерации эмодзи имеет короткую длину последовательности,поэтому модель обучается эффективно даже с ограниченными ресурсами. Это даёт шанс понять процесс обучения на практике, а не просто повторить код в отличие от многих “игрушечных” ноутбуков по RL и fine-tuning, где видишь синтаксис, но не реальные кривые обучения и поведение модели. Colab

50 150

Repost from Machinelearning

✔️GPT-5 Pro стал лидером ARC-AGI Semi-Private Benchmark Модель GPT-5 Pro заняла первое место среди всех проверенных frontier-LLM на закрытом бенчмарке ARC-AGI Semi-Private. Этот тест оценивает способность моделей к абстрактному рассуждению и решению сложных задач. Интересно, что GPT-5 Pro всё ещё уступает результатам старого o3-preview, который OpenAI тестировал ещё в декабре прошлого года. Однако тот экспериментальный вариант был почти в 50 раз дороже в вычислительных затратах и никогда не был публично выпущен. Версия o3-preview (high) достигала впечатляющих 87,5 % точности на ARC-AGI-1, но потребляла 172 раза ресурсов, чем версия (low). Из-за этого она не попала в официальный лидерборд - по правилам, тесты с compute-стоимостью выше $10 000 не публикуются. GPT-5 Pro является самой мощной из доступных и подтверждённых моделей на Semi-Private ARC-AGI. ✔️Журнал TIME опубликовал ежегодный список The Best Inventions of 2025 - подборку из 300 инновационных продуктов и идей, которые, по мнению редакции, способны изменить будущее. В список вошли достижения в самых разных областях: ИИ робототехника, медицина, экология, образование, энергетика и дизайн. Среди ключевых технологий - Claude Sonnet 4 от Anthropic, новая версия ИИ-модели, которая продемонстрировала более точные и безопасные ответы; NVIDIA DGX Spark - «настольный» AI-суперкомпьютер, делающий высокопроизводительные вычисления доступнее; UiPath Agentic Automation, объединяющая работу AI-агентов; и XReal One - компактные AR-очки, приближающие смешанную реальность к массовому использованию. TIME отметили разработки в области биотехнологий, биопечати тканей, устойчивых источников энергии и переработки отходов. Эти изобретения демонстрируют, как технологии становятся не просто инструментами, а основой будущего образа жизни. time ✔️ Google Cloud показал 1001 реальный кейс использования генеративного ИИ в бизнесе Google Cloud опубликовал обновлённый список из 321 корпоративного примера применения генеративного ИИ, что в 10 раз больше, чем годом ранее. Это показывает, что AI уже массово используется в продакшене по всему миру. В банках и ритейле Commerzbank ИИ обрабатывает 2 млн клиентских чатов с 70% успешных решений, Best Buy ускоряет анализ отзывов, а Mercedes внедрил голосового ассистента на базе Gemini. Внутри компаний ИИ автоматизирует рутину: Toyota экономит более 10 000 часов в год, Manipal Hospitals сократил передачу смен с 90 до 20 минут, Equifax - 97% сотрудников хотят сохранить AI-лицензии. Wayfair ускорил настройку окружений на 55%, CME сэкономил 10,5 часов в месяц, а BMW и UPS используют цифровых двойников для моделирования логистики и производств. Подробнее ✔️ Taiwan отказывается от идеи 50 на 50 с США по производству чипов Министр экономики Тайваня заявил, что TSMC сохранит свои самые передовые технологии и основное производство на острове, несмотря на предложение США сделать «50 на 50». Компания вкладывает $165 млрд в шесть фабрик в США, но строит десять на Тайване и планирует новые - там останутся ведущие технологические узлы. По словам министра, зарубежные заводы допустимы только при реальных заказах, прибыли и отсутствии рисков для безопасности. Идея «50-50» возникла из-за стремления США увеличить долю внутренних чипов после кризиса поставок 2020–2021 годов. Аналитики считают, что перенос производства в США слишком дорог и займёт годы, поэтому Вашингтон делает ставку на «friendshoring» - распределённые цепочки поставок между союзниками. times ✔️ UserLM-8B от Microsoft Microsoft представила новую модель UserLM-8B, созданную для симуляции поведения пользователя в диалоге. В отличие от обычных LLM, эта модель генерирует реплики от лица человека, включая уточнения, эмоции и ошибки, как в реальном общении. Модель построена на базе Llama3.1 8B и дообучена на корпусе WildChat-1M, где она анализировала сотни тысяч реальных и синтетических диалогов. Такой подход позволяет создавать реалистичные сценарии общения для тестирования чат-ботов, обучения ассистентов и генерации синтетических данных. HF @ai_machinelearning_big_data #news #ai #ml

50 150

🧠 DataMind - открытая система для умных дата-агентов DataMind - это новая архитектура для создания универсальных агентов анализа данных, которые уже превосходят GPT-5 и DeepSeek-V3.1 по качеству рассуждений и работе с кодом. 🧩 Зачем создан DataMind Сегодня большинство дата-агентов используют закрытые модели и зависят от промпт-инжиниринга. Открытые решения не умеют устойчиво рассуждать по шагам и работать с разными форматами данных. Команда DataMind решила эти три главные проблемы: 1. Недостаток качественных данных для обучения 2. Неправильные стратегии обучения 3. Ошибки при многошаговом исполнении кода 🔧 Как устроен DataMind Система включает полный цикл - от генерации данных до обучения и выполнения задач. Она использует: - классификацию задач и создание запросов от простых к сложным - фильтрацию траекторий через self-consistency (самопроверку ответов) - комбинацию динамического обучения SFT и RL, что делает процесс стабильным - оптимизированное выполнение кода в изолированной среде 📊 Результаты - Модель DataMind-14B показала 71.16 % среднего результата и превзошла GPT-5 и DeepSeek-V3.1 - Лёгкая версия DataMind-7B стала лучшей среди open-source решений — 68.10 %, обучена на 12 000 траекторий 💡 Главные выводы - Фильтрация через self-consistency эффективнее, чем выбор одной «лучшей» траектории - Потери SFT стабилизируют обучение, но при ошибочной настройке вызывают колебания - RL сокращает разрыв между моделями, но не меняет общий рейтинг Команда открыла датасет DataMind-12K и модели DataMind-7B и 14B, чтобы сообщество могло строить своих аналитических агентов. 📄 Исследование: https://arxiv.org/abs/2509.25084 💻 Код: https://github.com/zjunlp/DataMind 📊 Модели и данные: https://huggingface.co/collections/zjunlp/datamind-687d90047c58bb1e3d901dd8) #AI #DataScience #LLM #Agents #OpenSource #DataAnalysis #ReinforcementLearning #NLP

50 150

🌍 State of AI Report 2025 - Главное из отчёта Ежегодный отчёт State of AI Report - это самый влиятельный обзор тенденций в области искусственного интеллекта, публикуемый с 2018 года инвестором Nathan Benaich и фондом Air Street Capital. В 2025 году отчёт охватывает 6 направлений: исследования, индустрию, политику, безопасность, опрос практиков и прогнозы. 📊 Ключевые выводы 1. OpenAI удерживает лидерство, но Китай быстро сокращает отрыв. DeepSeek, Qwen и Kimi почти сравнялись в задачах рассуждения и программирования. 2. Год рассуждения — модели научились планировать, самоисправляться и мыслить пошагово. 3. ИИ стал научным соавтором — примеры: Co-Scientist от DeepMind и Virtual Lab от Stanford. 4. Chain-of-Action планирование — роботы теперь рассуждают перед действием (Google Gemini Robotics 1.5, AI2 Molmo-Act). 5. Коммерциализация ускорилась: - 44 % компаний в США платят за ИИ-инструменты (в 2023 г. — 5 %) - Средний контракт — $530 000 - Стартапы с ИИ растут в 1.5× быстрее обычных 6. Опрос 1200 специалистов: - 95 % используют ИИ дома или на работе - 76 % платят за него из собственного кармана - Большинство отмечают устойчивый рост продуктивности 7. Началась индустриальная эра ИИ — мегадата-центры (Stargate, фонды США, ОАЭ, Китая). Энергия становится новым лимитирующим фактором. 8. Политика ИИ ужесточилась: - США делают ставку на *America-first AI* - Европейский AI Act буксует - Китай развивает открытые модели и собственные чипы 9. Безопасность переходит к прагматизму: - Модели имитируют выравнивание (alignment), усиливая дискуссию о прозрачности - Бюджеты safety-организаций несопоставимы с расходами лидеров 10. Риски экзистенции сменились фокусом на надёжность, киберустойчивость и долгосрочное управление автономными системами. 🔮 Прогнозы авторов - Рост затрат на обучение сверхмоделей → дефицит энергии и GPU - Конкуренция между OpenAI, DeepSeek, Anthropic и Google усилится - Frontier-модели будут тренироваться в многоэтапных средах с постоянной самопроверкой - Всё больше экспериментов с «живыми агентами» в физическом мире - Усиление регулирования и новые требования к прозрачности reasoning-цепочек 📘 Полный отчёт доступен здесь: https://www.stateof.ai/ @data_analysis_ml