Анализ данных (Data analysis)

Open in Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Network:Machinelearning Russia12 559 Technologies & Applications2 679...

📈 Analytical overview of Telegram channel Анализ данных (Data analysis)

Channel Анализ данных (Data analysis) (@data_analysis_ml) in the Russian language segment is an active participant. Currently, the community unites 50 152 subscribers, ranking 2 679 in the Technologies & Applications category and 12 559 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 50 152 subscribers.

According to the latest data from 13 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -42 over the last 30 days and by -11 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.83%. Within the first 24 hours after publication, content typically collects 5.66% reactions from the total number of subscribers.
Post reach: On average, each post receives 4 426 views. Within the first day, a publication typically gains 2 839 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 30.
Thematic interests: Content is focused on key topics such as llm, контекст, openai, архитектура, deepseek.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Thanks to the high frequency of updates (latest data received on 14 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

50 152

Subscribers

-1124 hours

-597 days

-4230 days

4 426

Post views

~ 2 83924 hours

~ 3 39048 hours

8.83%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

50 150

Alibaba Group представила Memp — новый фреймворк, который даёт LLM-агентам обучаемую и обновляемую процедурную память. 📈 Результат — более высокая успешность и эффективность при сложных задачах. 🧠 Memp превращает прошлый опыт агентов в детальные инструкции и абстрактные стратегии, постоянно совершенствуясь по мере накопления данных. 🔄 Память можно даже передавать более слабым моделям, повышая их возможности. https://huggingface.co/papers/2508.06433

50 150

🆕 Hugging Face представили **AI Sheets** — no-code инструмент для создания и обработки таблиц с помощью ИИ. - Выглядит как обычная таблица, но вместо формул — тысячи моделей - Поддержка OpenAI-совместимых и локальных LLM - Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки - Запуск онлайн или локально (Docker / pnpm) - Полностью опенсорс (Apache-2.0), легко встроить в пайплайны - Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей ⚡️ Попробовать #AI #NoCode #datasets #HuggingFace #LLM

50 150

⚡️ Новые модели для Кодина от Kwaipilot: KAT-Dev-32B и KAT-Coder - KAT-Dev-32B — 62.4% на SWE-Bench Verified, входит в топ-5 среди open-source моделей - KAT-Coder — 73.4% на SWE-Bench Verified, результат на уровне лучших проприетарных решений 🔗 Попробовать: https://huggingface.co/Kwaipilot/KAT-Dev

50 150

🎛️ Claude Squad Инструмент ориентирован на управление несколькими терминальными агентами искусственного интеллекта (Claude Code, Aider, Codex, OpenCode и Amp). Проект помогает организовывать взаимодействие разных ИИ и командных инструментов и привлёк более 3,6 тыс. звёзд. 🟠 Ссылка @data_analysis_ml

50 150

IT_ONE Cup. Code & Analyst — хакатон для аналитиков и разработчиков, где ты узнаешь, как работает IT-команда, и получишь сильный кейс в портфолио. Выбери трек и реши одну из задач: → Проанализируй BPMN-модель кредитного процесса и подготовь ТЗ на систему мониторинга эффективности. → Разработай сервис, который в реальном времени следит за переводами и оповещает о подозрительных операциях. 🏆 Призовой фонд: 900 000 рублей 💻 Формат: онлайн 🗓 Регистрация до 16 октября: https://cnrlink.com/itonecupmsudataanml Приглашаем системных аналитиков, разработчиков и менеджеров проектов. Размер команды — от 1 до 5 человек. Что тебя ждёт: • Применишь навыки системного анализа, построения архитектуры и работы с потоковыми данными. • Получишь готовый проект в портфолио. • Для участников ТОП-5 команд в каждом треке — фирменный мерч. Задачи соревнования: Трек 1. Навигатор оптимизации. Проанализируй кредитный процесс банка, выяви узкие места и создай ТЗ для системы мониторинга производительности. Решение поможет оптимизировать критически важные процессы. Трек 2. Финансовый радар. Разработай сервис для анализа транзакций в реальном времени. Архитектура должна включать правила обнаружения мошенничества и поддержку различных алгоритмов обработки. Ждём тебя на IT_ONE Cup. Code & Analyst — старт 17 октября на Codenrock: https://cnrlink.com/itonecupmsudataanml

50 150

⚡️ Tencent представила Hunyuan3D-Part, первую в своём роде open-source модель генерации 3D-объектов на уровне деталей, которая обгоняет все существующие открытые и закрытые решения. Главное: 🔹 P3-SAM — первая нативная 3D-модель сегментации деталей 🔹 X-Part — генератор деталей с SOTA-результатами по управляемости и качеству Ключевые особенности: 1️⃣ Обучение на 3.7 млн форм с чистыми аннотациями без использования 2D SAM 2️⃣ Новый автоматический пайплайн сегментации в 3D — полностью без участия пользователя 3️⃣ Диффузионный пайплайн для разбиения на части с учётом геометрии и семантики Код доступен на GitHub, веса выложены на Hugging Face, а протестировать модель можно как в облегчённой версии на Hugging Face, так и в полном формате через Hunyuan3D Studio. →Code: https://github.com/Tencent-Hunyuan/Hunyuan3D-Part → Веса: https://huggingface.co/tencent/Hunyuan3D-Part → Paper: https://arxiv.org/abs/2509.06784 → Project page: https://murcherful.github.io/P3-SAM/ Попробовать： → (Light version) Hugging Face demo: https://huggingface.co/spaces/tencent/Hunyuan3D-Part → (Full version) Hunyuan3D Studio: https://3d.hunyuan.tencent.com/studio

50 150

🚀 Новое исследование Hunyuan: Reinforcement Learning on Pre-training Data (RLPT) Этот метод решает главную проблему масштабирования LLM - ограниченность размеченного текста. 🌟 RLPT даёт моделям возможность учиться рассуждениям напрямую на данных предобучения, без дорогой ручной разметки. Как это работает: 1️⃣ Модель во время обучения сама исследует данные и учится более общим стратегиям рассуждений. 2️⃣ Никакой дополнительной разметки — награды извлекаются прямо из предобучающих данных. 3️⃣ Награды за предсказание следующего сегмента позволяют масштабировать RL на этапе предобучения. Результаты: ✅ На Qwen3-4B-Base прирост: +3.0 (MMLU), +5.1 (MMLU-Pro), +8.1 (GPQA-Diamond), +6.0 (KOR-Bench), +6.6 (AIME24), +5.3 (AIME25). ✅ Чем больше вычислений, тем сильнее рост. ✅ Технология создаёт базу для дальнейших улучшений в RLVR. 📄 Подробнее: https://arxiv.org/pdf/2509.19249 #AI #RLPT #LLM #MachineLearning #NLP @data_analysis_ml

50 150

🚀 GitHub запустил публичное превью GPT-5-Codex для Copilot OpenAI представила новую модель GPT-5-Codex, оптимизированную под программирование и агентные задачи. Она доступна пользователям GitHub Copilot в публичном превью. Модель можно выбрать прямо в VS Code в режимах Ask, Edit и Agent, но только начиная с версии Copilot v1.104.1. Доступ распространяется на тарифы Pro, Pro+, Business и Enterprise, при этом в бизнес- и корпоративных планах администратор должен включить поддержку GPT-5-Codex в настройках. https://github.blog/changelog/2025-09-23-openai-gpt-5-codex-is-rolling-out-in-public-preview-for-github-copilot/

50 150

📰 На Yandex Neuro Scale 2025 представили обновлённую AI Studio Платформа позволяет собирать ИИ-агентов без навыков разработки: от голосовых ассистентов на базе realtime API до мультиагентных систем и инструментов вроде AI Search. При желании на платформе можно запустить и самостоятельно написанного агента. Встроены готовые решения — Нейроюрист, SpeechSense, инструмент для протоколирования встреч. Для агентов доступны быстрые интеграции по шаблону через MCP Hub – там уже доступны Контур.Фокус и amoCRM, вскоре появятся и сервисы Яндекса.

50 150

🧠 Сэм Альтман о будущем ИИ-инфраструктуры Глава OpenAI объяснил, почему компания делает ставку на строительство гигантских дата-центров для ИИ. По его словам, через год-два масштабные модели могут требовать 10 ГВт вычислений. В такой ситуации придётся выбирать: использовать эти мощности для исследований по лечению рака или, например, для создания бесплатного образования для всего мира. Чтобы не стоять перед выбором «или-или», OpenAI инвестирует в ещё большую инфраструктуру - так, чтобы человечество могло позволить себе и медицинские прорывы, и доступное обучение для всех.

50 150

⚡️ Сэм Альтман опубликовал новый блог-пост «Abundant Intelligence». Главная мысль: при доступе к 10 гигаваттам вычислений ИИ может приблизиться к решению величайших задач, например, поиску лекарства от рака. OpenAI видит будущее как «фабрику» ИИ-инфраструктуры, способную выпускать по 1 ГВт новых мощностей каждую неделю. Альтман сравнивает это с космической программой Apollo, только теперь цель не космос, а создание избыточного интеллекта. https://blog.samaltman.com/abundant-intelligence

50 150

📢 NVIDIA представила nvmath-python — библиотеку для Python, которая открывает доступ к возможностям фирменных математических библиотек (например, cuBLASLt) через удобный API. Что умеет: - работает с массивами из NumPy, CuPy, PyTorch и других экосистем; - поддерживает тонкую настройку вычислений (precision, режимы умножений, epilog-операции); - позволяет использовать расширенные оптимизации NVIDIA для ускоренной математики и ML-задач. Проект пока в бета-версии, но уже можно попробовать: https://github.com/NVIDIA/nvmath-python

50 150

🔥 Ваши данные стоят слишком дорого, чтобы ими рисковать Positive Technologies 8 октября запустит новый продукт — PT Data Security. Он создан, чтобы вовремя выявлять угрозы и предотвращать утечки, пока они не привели к кризису. На онлайн-трансляции вы первыми узнаете: — Какие задачи и риски сегодня определяют настоящее и будущее рынка защиты данных. — Какие вызовы стоят перед компаниями на рынке защиты данных. — Почему Positive Technologies выходит на рынок защиты данных с новым подходом. 🕒 15:00 мск 📍 Онлайн 👉 Регистрация

50 150

🤖 Почему роботы Unitree так быстро стали одними из лучших? На самом деле - не «вдруг». Секрет в том, что компания не закрылась в себе: - они продают железо и открывают SDK, - сами роботы «из коробки» почти бесполезны, но дают полный контроль разработчикам. Благодаря этому Unitree стала популярной платформой для исследований и разработок, вокруг которой выросло активное сообщество. Результат - G1 сегодня на порядок лучше, чем мог бы быть, если бы компания развивала всё только внутри себя. Многие хардварные компании с амбициями на «комьюнити-продукты» (роботы, AR-очки и др.) выбирают путь закрытых экосистем. Но такая жадность оборачивается тем, что их решения быстро уступают открытым платформам вроде Unitree G1.

50 150

🚀 Хотите ускорить обучение в PyTorch в несколько раз? У DataLoader есть два плохих дефолта, которые тормозят процесс. Исправив их, я получил почти 5x ускорение. ❌ Проблема - .to(device) переносит данные на GPU. - Пока GPU считает - CPU ничего не делает. - Пока CPU готовит данные — GPU простаивает. ⚡ Решение Нужно заставить CPU и GPU работать параллельно: - В DataLoader укажи pin_memory=True - При переносе данных используй .to(device, non_blocking=True) - Добавь num_workers в DataLoader для фоновой загрузки. ✅ В итоге CPU готовит следующий батч, пока GPU занят текущим. Так исчезают простои, и обучение идёт заметно быстрее.

50 150

🐐 В 2009 году Дженсен Хуанг объяснял, что такое CUDA, и прикидывал её рынок. Тогда акции NVIDIA стоили всего около $0.20 за штуку (с учётом сплитов). 💰 Если бы ты вложил $10,000 тогда, сегодня это было бы около $8.8 млн. Вот почему Дженсена называют GOAT.

50 150

🚀 LongCat-Flash-Thinking от Meituan ⚡ Главное - Размер: 560 миллиардов параметров, но работает только часть (~27B), поэтому инференс быстрее и дешевле. - Технология ScMoE (Shortcut-Connected MoE) позволяет совмещать вычисления и обмен данными, уменьшая задержку. - Поддерживает контекст до 128k токенов — можно обрабатывать очень длинные документы. - Обучалась на 20+ триллионах токенов всего за месяц. - Скорость инференса: 100+ токенов в секунду. - Лицензия: MIT. - Поддерживает работу с агентами (agentic tasks). - Модель хороша в программировании и рассуждениях. - На бенчмарке результаты на уровне топовых моделей. LongCat-Flash доказывает, что даже модель на сотни миллиардов параметров может быть быстрой и практичной. 🔗 Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking

50 150

⚡️Мы часто говорим об AGI так, будто это просто технологическая гонка. Но что произойдет, когда машины смогут делать всё, что сегодня считается работой? Новый доклад NBER показывает: в мире с AGI человеческий труд перестаёт быть узким местом для роста — им становится лишь вычислительная мощность. Это значит, что профессии, на которых строится наше нынешнее благосостояние, могут потерять экономический смысл. Те, кто владеет компьютерами, будут определять, кому достанется процветание. Главный вопрос: что будет значить работа, когда её экономическая необходимость исчезнет? И речь идёт не о далёком будущем, а о сдвиге, который формируется уже сейчас. Сильные стороны и ограничения + Полезная теоретическая работа, позволяющая формализовать идеи о будущем с AGI: что именно может стать автоматизированным, каковы условия, при которых автоматизация происходит, и как меняются распределение доходов и роль труда. + Привязка к росту compute (вычислительных ресурсов) как ключевого фактора — отражает реальные технологические тенденции. − Очень абстрактная модель: многие параметры и допущения (темп роста compute, стоимость автоматизации, «ценность» человеческого труда, предпочтения) остаются неопределёнными. − Не учитываются многие реальные ограничения: политические, социальные, институционные; также проблемы безопасности, этики, доступности технологий. − Не фокусируется на трансформации распределения внутри стран, регионов, между группами — реальная динамика может быть более сложной. 🟠 Подробнее

50 150

📘 Introduction to Machine Learning* (Laurent Younes) Что внутри: - 📐 Математический фундамент: анализ, линейная алгебра, теория вероятностей - ⚡ Оптимизация: SGD, проксимальные методы и др. - 🤖 Алгоритмы с учителем: линейные модели, SVM, деревья, бустинг, нейросети - 🎲 Генеративные модели: MCMC, графические модели, вариационные подходы, GAN - 🔎 Без учителя: кластеризация, PCA, факторный анализ, обучение на многообразиях - 📊 Теория: неравения концентрации, обобщающая способность моделей Фундаментальный учебник, который соединяет математику и практику ML. 👉 https://arxiv.org/abs/2409.02668 #MachineLearning #DeepLearning #Mathematics #DataScience #DataScientist