Анализ данных (Data analysis)

Open in Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Network:Machinelearning Russia12 559 Technologies & Applications2 679...

📈 Analytical overview of Telegram channel Анализ данных (Data analysis)

Channel Анализ данных (Data analysis) (@data_analysis_ml) in the Russian language segment is an active participant. Currently, the community unites 50 152 subscribers, ranking 2 679 in the Technologies & Applications category and 12 559 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 50 152 subscribers.

According to the latest data from 13 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -42 over the last 30 days and by -11 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.83%. Within the first 24 hours after publication, content typically collects 5.66% reactions from the total number of subscribers.
Post reach: On average, each post receives 4 426 views. Within the first day, a publication typically gains 2 839 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 30.
Thematic interests: Content is focused on key topics such as llm, контекст, openai, архитектура, deepseek.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Thanks to the high frequency of updates (latest data received on 14 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

50 152

Subscribers

-1124 hours

-597 days

-4230 days

4 426

Post views

~ 2 83924 hours

~ 3 39048 hours

8.83%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

50 150

Технологическая платформа Авито ускорила в 5 раз процесс поиска и проверки уязвимостей. Компания внедрила в работу отдела кибербезопасности собственную языковую модель, которую обучили на тысячах примерах уязвимостей. К работе также подключили сканер от Авито DeepSecrets — каждый разработчик может бесплатно его использовать, все лежит на GitHub. Модель научилась выявлять 99 из 100 потенциальных уязвимостей — она анализирует потенциально чувствительные данные и учитывает контекст кода. Чтобы не пропустить угрозы, код проверяют дополнительными алгоритмами, а инженеры выборочно оценивают работу нейросети. Такой подход позволил освободить 25% рабочего времени специалистов по кибербезопасности. Если раньше на оценку 50 000 предупреждений специалисты могли потратить полгода, то сейчас с этим объемом машина справляется за день. В планах Авито — внедрить ИИ в оценку рисков и моделирование угроз. Это эффективно, как доказывают исследования: компании, которые применяют ИИ, на 100 дней быстрее находят утечки данных. Подпишитесь на полезные каналы Авито

50 150

🏆 Sakana AI выиграла ICFP 2025 - благодаря новой системе эволюции кода ShinkaEvolve Исследователи из Sakana AI и команда Unagi показали, что большие языковые модели можно использовать не просто для генерации программ, а для пошаговой эволюции и оптимизации уже существующего кода. ShinkaEvolve - это эволюционный фреймворк, где языковая модель играет роль «генетического программиста». Она не пишет решения с нуля, а мутирует, оценивает и улучшает уже работающий код. Процесс идёт циклами, похожими на естественный отбор. 1. Инициализация Модель получает исходный код (обычно корректный, но неоптимальный) и описание метрики — например, скорость или точность. 2. Мутации (Variations) LLM вносит небольшие изменения: перестраивает цикл, меняет структуру данных, переписывает логику с рекурсии на итерацию, удаляет лишние вычисления и т.д. 3. Оценка (Evaluation) Каждая версия автоматически компилируется и запускается на тестах. Система измеряет, стало ли решение быстрее или стабильнее. 4. Отбор (Selection) Лучшие варианты проходят дальше, худшие отбрасываются. LLM получает обратную связь: что сработало, а что нет. 5. Итерации Процесс повторяется десятки или сотни раз. В исследовании — около 320 поколений за ~60 долларов вычислительных затрат. Изначально решение ICFP-задачи использовало SAT-кодирование (логическую форму для solver'а), но плохо масштабировалось. ShinkaEvolve смогла: - переписать часть кода, чтобы сократить количество ограничений; - внедрить промежуточное представление («дверь → вершина → дверь»), что уменьшило сложность; - оптимизировать поиск и кэширование данных. Результат — ускорение до 10×, а на некоторых тестах — почти в 10 раз быстрее базового решения. ShinkaEvolve — не просто автоматический оптимизатор. Это новый способ мышления об ИИ-программировании: модель не заменяет разработчика, а ведёт себя как «цифровой соавтор», который предлагает гипотезы и тестирует их сотни раз быстрее, чем человек. 🟠Подробнее: https://sakana.ai/icfp-2025 🟠Код: https://github.com/SakanaAI/ShinkaEvolve 🟠Статья: https://arxiv.org/abs/2509.19349 🟠Блог: https://sakana.ai/shinka-evolve/

50 150

🧠 Учёные из Penn State обнаружили нечто **дикое**: грубость делает ChatGPT умнее. Они протестировали ChatGPT-4o на 250 вопросах с 5 уровнями вежливости: • Очень вежливо → 80.8% точности • Вежливо → 81.4% • Нейтрально → 82.2% • Грубо → 82.8% • Очень грубо → 84.8% Статистический анализ подтвердил: это не случайность — жёсткие запросы стабильно дают лучший результат. Ещё интереснее: старые модели вроде GPT-3.5 реагировали *наоборот*. А вот GPT-4 и новее становятся точнее, когда с ними разговаривают резче. Источник: https://arxiv.org/abs/2510.04950

50 150

🚀 Школа аналитиков данных МТС Web Services: прием заявок Возможность получить дополнительное профессиональное образование для студентов последних курсов технических специальностей, Junior/middle аналитиков данных, ИТ-специалистов, желающих лучше изучить анализ данных. 🔹 Что вас ждет: 10-месячное бесплатное онлайн-обучение по программе, разработанной с учетом ключевых направлений в изучении больших данных: SQL, Python, ML, Big Data, работа с нейросетями и рекомендательными системами. Регулярные вебинары от действующих экспертов из разных продуктов Центра BigData MWS и обратная связь специалистов в течение всего курса, в том числе разбор практических кейсов. 🎯 Самые талантливые студенты смогут пройти стажировку в МТС Web Services и получить оффер. Оставить заявку и пройти профильное тестирование можно до 30 октября здесь.

50 150

💡 Еще один дикий пример работы Gemini 3.0 Pro , модель превращает один длинный промпт в полноценный сайт. По одному промпту получили интерактивную страницу с эффектами симуляции: сетки под объектами, прогрессивная подгрузка текстур, глюки физики, матричный дождь кода, переключение между видами rendered и source, фоновый шум процессора и финальный мета-момент, где сайт признаёт, что на него смотрят. Всё укладывается в один HTML-файл и открывается в Chrome. Промпт:

Write code for a mysterious website about simulation theory. Make it feel like reality is rendering in real-time — wireframe grids that appear under solid objects, textures that load progressively, physics glitches where elements float momentarily. Include matrix-style falling code backgrounds, sections that flicker between "rendered" and "source code" views, ambient computer processing sounds, and a final meta moment where the website acknowledges it's being viewed. Design it like a philosophy professor's existential crisis coded by a game engine developer. make sure I can paste it all into a single HTML file and open it in Chrome.

🟢 Код: https://codepen.io/ChetasLua/pen/ogbGqwW 🟢Пост: https://x.com/chetaslua/status/1978226719225004290

50 150

✨ ByteDance представила FaceCLIP - новую модель для генерации изображений с сохранением личности Модель FaceCLIP обучается представлять лицо (Identity) и текстовое описание в едином векторном пространстве, что позволяет создавать изображения, где сохраняется похожесть субъекта и при этом учитывать желаемую стилистику или указания из текста. :contentReference[oaicite:0]{index=0} Авторы отказались от подходов с адаптерами и предложили унифицированную мультимодальную стратегию кодирования: лицо + текст → общее представление, которое направляет генеративную модель (UNet / DiT) при синтезе. Преимущества FaceCLIP: - лучшие результаты в сохранении идентичности на портретах - более точное соответствие текстовым инструкциям - высокая реалистичность по сравнению с предыдущими методами Модель доступна под лицензией MIT / некоммерческое исследовательское использование — с предупреждением об ответственном использовании. :contentReference[oaicite:4]{index=4} 📄 HF: https://huggingface.co/ByteDance/FaceCLIP

50 150

⚡ Goldman Sachs: ИИ съест 20% всей мировой энергии к 2030 году По прогнозу Goldman Sachs, к 2030 году спрос на электроэнергию со стороны дата-центров вырастет на 25%, а доля ИИ в общем энергопотреблении достигнет 20%. 🔥 Когда-то огонь изменил жизнь человека - с ним началась кулинария, эволюция мозга и социальное развитие. ⚙️ Затем электричество стало топливом индустриальной эпохи, двигая экономику и прогресс. 🤖 Теперь настала очередь искусственного интеллекта: один запрос к ChatGPT потребляет около 2,9 ватта, почти в 10 раз больше, чем обычный поиск Google. Если ИИ реализует хотя бы часть своего потенциала, то энергия станет главным ограничителем его роста. И, как отмечает Goldman, это создаёт новую инвестиционную волну — не только в чипы и модели, но и в энергетику. 📊 По оценке McKinsey, к 2030 году потребление электроэнергии дата-центрами в США вырастет с 3–4% до 11–12%, увеличившись с 25 до 80 ГВт.

50 150

🚀 Новый курс на Stepik: AI Agents PRO Если вы работаете с ML/DS и хотите перейти от моделей → к готовым продуктам на базе LLM, без понимания агентов уже никуда. 🔹 Что внутри: Архитектура агентов (FSM, DAG, Supervisor–Worker, Critic–Executor). Интеграции: API, БД, браузеры, CRM. Retrieval-Augmented Generation (Qdrant, Weaviate, FAISS). Надёжность: ретраи, guardrails, работа с PII. LLMOps: метрики качества, A/B-тесты, дашборды. Продакшн-деплой: Docker, очереди сообщений, CI/CD. Итоговый проект: собственный агент под реальный бизнес-кейс. 🎯 По итогу вы сможете строить и выкатывать production-ready AI-агентов, а не просто писать демки в ноутбуках. 🔥 Спец-условия: только по промо AGENTS30 — -30% на старт (действует 48ч). 👉 Пройти курс со скидкой

50 150

🍏Ничего сверхъестественного - просто Gemini 3 Pro за один (!) промпт разворачивает полноценную симуляцию macOS или Windows прямо в браузере. Всего 900 строк кода - и у вас уже есть рабочий интерфейс с анимациями, меню, браузером и даже терминалом. Модель справляется с этим за 172 секунды. Код и демо уже доступны - а инсайдеры шепчут, что официальный релиз выйдет на этой неделе. Первые тестеры называют Gemini 3 Pro «лучшим ИИ для кодинга на сегодня». https://codepen.io/ChetasLua/pen/EaPvqVo

50 150

🎥 Lynx: Высококачественная генерация персонализированного видео Lynx — это модель генерации видео, которая создает персонализированные ролики на основе одного изображения. Использует Diffusion Transformer с адаптерами для сохранения идентичности и улучшения деталей. 🚀 Основные моменты: - Генерация видео с высоким качеством из одного изображения. - Легковесные модели для эффективного создания видео. - Поддержка различных адаптеров для улучшения качества. 📌 GitHub: https://github.com/bytedance/lynx #python

50 150

⚡️ Samsung идёт на риск, чтобы вернуть лидерство в гонке AI-памяти - ставка на сверхбыструю HBM4 Samsung решила изменить правила игры на рынке чипов и убедить Nvidia повысить официальную скорость HBM4, даже несмотря на то, что конкуренты: SK Hynix и Micron - раньше показали первые образцы. Обычно разработчики HBM (High Bandwidth Memory) делают акцент на контроле температуры, ведь многослойная DRAM быстро нагревается. Но теперь Nvidia потребовала большего - выше частоты, выше скорость. Для Hynix и Micron это стало неожиданностью: их решения оптимизированы под стабильность, а не под разгон. А вот Samsung оказалась готова. Её HBM4-чипы уже достигли более высоких частот на тестах - благодаря технологическому преимуществу: - DRAM-чипы производятся по 1c-процессу (6-е поколение 10 нм), - базовый логический кристалл - на 4-нм техпроцессе Samsung Foundry. Для сравнения: - SK Hynix использует 12-нм процесс TSMC, - Micron - старый DRAM-процесс. Более продвинутая литография даёт Samsung лучший контроль над энергопотреблением и сигналами. Компания уже ускоряет производство и планирует вывести HBM4 на рынок в 2026 году, когда спрос на память для AI-систем резко превысит предложение. Такой шаг может вернуть Samsung утраченные позиции после неудачи с HBM3E. Ключевой момент - тесты Nvidia Rubin. Если HBM4 покажет проблемы с нагревом или надёжностью при интеграции, вся стратегия может рухнуть. Но если всё пройдёт успешно, Samsung сможет опередить Hynix и Micron, снова захватив лидерство в памяти для AI-ускорителей. Итог: Samsung делает ставку на скорость, технологии и масштаб. Это рискованный, но стратегический шаг, который может определить баланс сил на рынке AI-чипов в ближайшие годы. 🟠Подробности #Samsung #Nvidia #AI

50 150

Repost from Machinelearning

⚡️ Mamba-3 тихо и без объявления вышла на ICLR - и это может стать началом конца эпохи Transformers. Новая архитектура Mamba-3 делает модели быстрее, стабильнее и эффективнее при работе с длинными контекстами. Главная идея - не в слоях внимания, а в state-space моделях, где модель хранит и обновляет внутреннее состояние во времени. 📘 Краткие эускурс: - Mamba-1 ввела непрерывную динамику и выборочное обновление памяти - помнила эффективно без высокой цены attention. - Mamba-2 показала, что обновления состояния и attention - это две стороны одной математики, что ускорило вычисления на GPU. - Mamba-3 довела концепцию до зрелости: теперь внутренняя память развивается плавнее и устойчивее за счёт перехода от простого шага Эйлера к трапецеидальному интегрированию. Вместо простого шага Эйлера, как в Mamba-2, Mamba-3 аппроксимирует интеграл обновления состояния не только по правому концу интервала, но усреднением между началом и концом, с коэффициентом λ, зависящим от данных. Это даёт более точное приближение (второго порядка) и делает динамику состояния более выразительной. 🧠 Что изменилось под капотом: - Память стала «ритмичной»: теперь модель может хранить повторяющиеся и периодические паттерны (например, структуры языка или музыки). - Новый multi-input-multi-output дизайн позволяет обрабатывать несколько потоков параллельно — идеально для современных GPU. ⚙️ Что это даёт на практике: - Эффективная работа с длинными последовательностями: документы, геномы, временные ряды. - Линейное время выполнения и стабильная задержка делают её идеальной для реального времени: чат-ботов, перевода, речи. - Энергоэффективность и масштабируемость открывают путь к on-device AI, где большие модели работают локально, без облака. Mamba-3 - это не просто ускоренная альтернатива Transformers. Это новая архитектура, которая объединяет глубокое понимание контекста, скорость и устойчивость, от серверных систем до умных устройств. 🟢 Подробности: https://openreview.net/pdf?id=HwCvaJOiCj @ai_machinelearning_big_data #ssm #mamba3 #llm,#architecture #ai

50 150

NVFP4 - новый формат, который обучает 12B Mamba Transformer в 4 бита без потери точности Исследователи представили NVFP4 - способ хранить числа в 4 битах вместо 8 или 16, почти без потери качества обучения. Главная идея - умное блочное квантование: - Все значения делятся на блоки по 16 чисел. - Каждый блок имеет свой локальный scale (8 бит). - Весь тензор получает глобальный scale (32 бита). Так сохраняется высокая точность локальных значений и не теряются экстремально большие или маленькие числа. 📊 Результаты: - Обучение 12B Mamba Transformer на 10T токенов в 4 битах показало точность, сопоставимую с FP8. - Вычисления стали в 2–3 раза быстрее, а использование памяти снизилось на 50%. - Потеря точности не превышает 1–1.5% по метрикам. - MMLU Pro: 62.58% (NVFP4) против 62.62% (FP8). - MBPP+: 55.91% против 59.11%. - Градиенты используют стохастическое округление, чтобы избежать накопления ошибок. - По сравнению с MXFP4, NVFP4 требует на 36% меньше данных для того же уровня потерь. На поздних этапах обучения переход на BF16 почти устраняет разрыв в качестве. NVFP4 уже поддерживается в Transformer Engine и на Blackwell GPU, включая все нужные режимы округления. 📄 Исследование: https://arxiv.org/abs/2509.25149

50 150

🚀 Улучшение подсказок для генерации изображений PromptEnhancer — это утилита для переписывания подсказок, которая сохраняет исходный замысел и делает его более ясным и логичным. Подходит для задач генерации изображений и других приложений, требующих структурированных запросов. 🚀 Основные моменты: - Сохраняет ключевые элементы запроса (субъект, действие, стиль и т.д.) - Создает последовательные и логически структурированные подсказки - Поддерживает настраиваемые параметры вывода для разнообразия и детерминизма - Обеспечивает надежный парсинг выходных данных с возможностью резервного копирования 📌 GitHub: https://github.com/Hunyuan-PromptEnhancer/PromptEnhancer #python

50 150

🖥 Чип, который работает как мозг человека Учёные из Monash University создали микрочип размером с монету, который ведёт себя как настоящие нейроны мозга. 💧 В основе — жидкостная структура из металлоорганического каркаса (MOF). Через микроскопические каналы внутри неё проходят ионы, как электрические импульсы в мозге, — именно так чип обрабатывает сигналы. Главная особенность — он запоминает прошлые импульсы и меняет своё поведение на основе опыта. То есть этот чип не просто считает — он обучается, как нейросеть в нашем мозге. ⚡ Это может стать началом новой эры компьютеров — умных, адаптивных и “живых”, где вычисление и память объединены в одном устройстве. phys.org/news/2025-10-scientists-nanofluidic-chip-brain-memory.html

50 150

🖥 Новый курс на Stepik - PostgreSQL для разработчиков: от основ к созданию API Здесь на пальцах объясняют не только как писать SQL-запросы, а строить настоящие backend-сервисы с базой данных как у профи. В этом курсе ты шаг за шагом создашь REST API на FastAPI + PostgreSQL: от установки среды и первых таблиц - до масштабируемого приложения с безопасностью и CRUD-операциями. 🔹 На практике разберете: • SQL-запросы, фильтры, агрегаты и подзапросы • Связи между таблицами и нормализацию БД • Взаимодействие Python и PostgreSQL • Реализацию REST API и подключение базы • Оптимизацию и разбор реальных задач с собеседований ⚡ После курса у вас будет свой работающий API-проект и реальные навыки работы с PostgreSQL в продакшене. 🎁 Сегодня –30% от цены! 🚀 Прокачаю свои знания: https://stepik.org/course/255542/

50 150

⚡️ DeepMind выпустила удобный Colab-ноутбук для дообучения модели Gemma 3-270M на задаче генерации эмодзи. Это лёгкий эксперимент - всего 270 млн параметров, используется QLoRA и короткие последовательности, поэтому обучение можно спокойно запускать на локальной машине или в Colab. Модель также легко встраивается в JavaScript -приложения через transformers.js. Все материалы автор обещал выложить в треде. Задача генерации эмодзи имеет короткую длину последовательности,поэтому модель обучается эффективно даже с ограниченными ресурсами. Это даёт шанс понять процесс обучения на практике, а не просто повторить код в отличие от многих “игрушечных” ноутбуков по RL и fine-tuning, где видишь синтаксис, но не реальные кривые обучения и поведение модели. Colab

50 150

Repost from Machinelearning

✔️GPT-5 Pro стал лидером ARC-AGI Semi-Private Benchmark Модель GPT-5 Pro заняла первое место среди всех проверенных frontier-LLM на закрытом бенчмарке ARC-AGI Semi-Private. Этот тест оценивает способность моделей к абстрактному рассуждению и решению сложных задач. Интересно, что GPT-5 Pro всё ещё уступает результатам старого o3-preview, который OpenAI тестировал ещё в декабре прошлого года. Однако тот экспериментальный вариант был почти в 50 раз дороже в вычислительных затратах и никогда не был публично выпущен. Версия o3-preview (high) достигала впечатляющих 87,5 % точности на ARC-AGI-1, но потребляла 172 раза ресурсов, чем версия (low). Из-за этого она не попала в официальный лидерборд - по правилам, тесты с compute-стоимостью выше $10 000 не публикуются. GPT-5 Pro является самой мощной из доступных и подтверждённых моделей на Semi-Private ARC-AGI. ✔️Журнал TIME опубликовал ежегодный список The Best Inventions of 2025 - подборку из 300 инновационных продуктов и идей, которые, по мнению редакции, способны изменить будущее. В список вошли достижения в самых разных областях: ИИ робототехника, медицина, экология, образование, энергетика и дизайн. Среди ключевых технологий - Claude Sonnet 4 от Anthropic, новая версия ИИ-модели, которая продемонстрировала более точные и безопасные ответы; NVIDIA DGX Spark - «настольный» AI-суперкомпьютер, делающий высокопроизводительные вычисления доступнее; UiPath Agentic Automation, объединяющая работу AI-агентов; и XReal One - компактные AR-очки, приближающие смешанную реальность к массовому использованию. TIME отметили разработки в области биотехнологий, биопечати тканей, устойчивых источников энергии и переработки отходов. Эти изобретения демонстрируют, как технологии становятся не просто инструментами, а основой будущего образа жизни. time ✔️ Google Cloud показал 1001 реальный кейс использования генеративного ИИ в бизнесе Google Cloud опубликовал обновлённый список из 321 корпоративного примера применения генеративного ИИ, что в 10 раз больше, чем годом ранее. Это показывает, что AI уже массово используется в продакшене по всему миру. В банках и ритейле Commerzbank ИИ обрабатывает 2 млн клиентских чатов с 70% успешных решений, Best Buy ускоряет анализ отзывов, а Mercedes внедрил голосового ассистента на базе Gemini. Внутри компаний ИИ автоматизирует рутину: Toyota экономит более 10 000 часов в год, Manipal Hospitals сократил передачу смен с 90 до 20 минут, Equifax - 97% сотрудников хотят сохранить AI-лицензии. Wayfair ускорил настройку окружений на 55%, CME сэкономил 10,5 часов в месяц, а BMW и UPS используют цифровых двойников для моделирования логистики и производств. Подробнее ✔️ Taiwan отказывается от идеи 50 на 50 с США по производству чипов Министр экономики Тайваня заявил, что TSMC сохранит свои самые передовые технологии и основное производство на острове, несмотря на предложение США сделать «50 на 50». Компания вкладывает $165 млрд в шесть фабрик в США, но строит десять на Тайване и планирует новые - там останутся ведущие технологические узлы. По словам министра, зарубежные заводы допустимы только при реальных заказах, прибыли и отсутствии рисков для безопасности. Идея «50-50» возникла из-за стремления США увеличить долю внутренних чипов после кризиса поставок 2020–2021 годов. Аналитики считают, что перенос производства в США слишком дорог и займёт годы, поэтому Вашингтон делает ставку на «friendshoring» - распределённые цепочки поставок между союзниками. times ✔️ UserLM-8B от Microsoft Microsoft представила новую модель UserLM-8B, созданную для симуляции поведения пользователя в диалоге. В отличие от обычных LLM, эта модель генерирует реплики от лица человека, включая уточнения, эмоции и ошибки, как в реальном общении. Модель построена на базе Llama3.1 8B и дообучена на корпусе WildChat-1M, где она анализировала сотни тысяч реальных и синтетических диалогов. Такой подход позволяет создавать реалистичные сценарии общения для тестирования чат-ботов, обучения ассистентов и генерации синтетических данных. HF @ai_machinelearning_big_data #news #ai #ml

50 150

🧠 DataMind - открытая система для умных дата-агентов DataMind - это новая архитектура для создания универсальных агентов анализа данных, которые уже превосходят GPT-5 и DeepSeek-V3.1 по качеству рассуждений и работе с кодом. 🧩 Зачем создан DataMind Сегодня большинство дата-агентов используют закрытые модели и зависят от промпт-инжиниринга. Открытые решения не умеют устойчиво рассуждать по шагам и работать с разными форматами данных. Команда DataMind решила эти три главные проблемы: 1. Недостаток качественных данных для обучения 2. Неправильные стратегии обучения 3. Ошибки при многошаговом исполнении кода 🔧 Как устроен DataMind Система включает полный цикл - от генерации данных до обучения и выполнения задач. Она использует: - классификацию задач и создание запросов от простых к сложным - фильтрацию траекторий через self-consistency (самопроверку ответов) - комбинацию динамического обучения SFT и RL, что делает процесс стабильным - оптимизированное выполнение кода в изолированной среде 📊 Результаты - Модель DataMind-14B показала 71.16 % среднего результата и превзошла GPT-5 и DeepSeek-V3.1 - Лёгкая версия DataMind-7B стала лучшей среди open-source решений — 68.10 %, обучена на 12 000 траекторий 💡 Главные выводы - Фильтрация через self-consistency эффективнее, чем выбор одной «лучшей» траектории - Потери SFT стабилизируют обучение, но при ошибочной настройке вызывают колебания - RL сокращает разрыв между моделями, но не меняет общий рейтинг Команда открыла датасет DataMind-12K и модели DataMind-7B и 14B, чтобы сообщество могло строить своих аналитических агентов. 📄 Исследование: https://arxiv.org/abs/2509.25084 💻 Код: https://github.com/zjunlp/DataMind 📊 Модели и данные: https://huggingface.co/collections/zjunlp/datamind-687d90047c58bb1e3d901dd8) #AI #DataScience #LLM #Agents #OpenSource #DataAnalysis #ReinforcementLearning #NLP

50 150

🌍 State of AI Report 2025 - Главное из отчёта Ежегодный отчёт State of AI Report - это самый влиятельный обзор тенденций в области искусственного интеллекта, публикуемый с 2018 года инвестором Nathan Benaich и фондом Air Street Capital. В 2025 году отчёт охватывает 6 направлений: исследования, индустрию, политику, безопасность, опрос практиков и прогнозы. 📊 Ключевые выводы 1. OpenAI удерживает лидерство, но Китай быстро сокращает отрыв. DeepSeek, Qwen и Kimi почти сравнялись в задачах рассуждения и программирования. 2. Год рассуждения — модели научились планировать, самоисправляться и мыслить пошагово. 3. ИИ стал научным соавтором — примеры: Co-Scientist от DeepMind и Virtual Lab от Stanford. 4. Chain-of-Action планирование — роботы теперь рассуждают перед действием (Google Gemini Robotics 1.5, AI2 Molmo-Act). 5. Коммерциализация ускорилась: - 44 % компаний в США платят за ИИ-инструменты (в 2023 г. — 5 %) - Средний контракт — $530 000 - Стартапы с ИИ растут в 1.5× быстрее обычных 6. Опрос 1200 специалистов: - 95 % используют ИИ дома или на работе - 76 % платят за него из собственного кармана - Большинство отмечают устойчивый рост продуктивности 7. Началась индустриальная эра ИИ — мегадата-центры (Stargate, фонды США, ОАЭ, Китая). Энергия становится новым лимитирующим фактором. 8. Политика ИИ ужесточилась: - США делают ставку на *America-first AI* - Европейский AI Act буксует - Китай развивает открытые модели и собственные чипы 9. Безопасность переходит к прагматизму: - Модели имитируют выравнивание (alignment), усиливая дискуссию о прозрачности - Бюджеты safety-организаций несопоставимы с расходами лидеров 10. Риски экзистенции сменились фокусом на надёжность, киберустойчивость и долгосрочное управление автономными системами. 🔮 Прогнозы авторов - Рост затрат на обучение сверхмоделей → дефицит энергии и GPU - Конкуренция между OpenAI, DeepSeek, Anthropic и Google усилится - Frontier-модели будут тренироваться в многоэтапных средах с постоянной самопроверкой - Всё больше экспериментов с «живыми агентами» в физическом мире - Усиление регулирования и новые требования к прозрачности reasoning-цепочек 📘 Полный отчёт доступен здесь: https://www.stateof.ai/ @data_analysis_ml