Анализ данных (Data analysis)

رفتن به کانال در Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

نمایش بیشتر

شبکه:Machinelearning روسيا12 559 فناوری و برنامه‌ها2 679...

📈 تحلیل کانال تلگرام Анализ данных (Data analysis)

کانال Анализ данных (Data analysis) (@data_analysis_ml) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 50 152 مشترک است و جایگاه 2 679 را در دسته فناوری و برنامه‌ها و رتبه 12 559 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 50 152 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 13 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -42 و در ۲۴ ساعت گذشته برابر -11 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 8.83% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.66% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 4 426 بازدید دریافت می‌کند. در اولین روز معمولاً 2 839 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 30 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند llm, контекст, openai, архитектура, deepseek تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 14 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

50 152

مشترکین

-1124 ساعت

-597 روز

-4230 روز

4 426

نمایش های پست

~ 2 83924 ساعت

~ 3 39048 ساعت

8.83%

نرخ مشارکت

~ 5

پست های در روز

Ads index

beta

آرشیو پست ها

50 150

Alibaba Group представила Memp — новый фреймворк, который даёт LLM-агентам обучаемую и обновляемую процедурную память. 📈 Результат — более высокая успешность и эффективность при сложных задачах. 🧠 Memp превращает прошлый опыт агентов в детальные инструкции и абстрактные стратегии, постоянно совершенствуясь по мере накопления данных. 🔄 Память можно даже передавать более слабым моделям, повышая их возможности. https://huggingface.co/papers/2508.06433

50 150

🆕 Hugging Face представили **AI Sheets** — no-code инструмент для создания и обработки таблиц с помощью ИИ. - Выглядит как обычная таблица, но вместо формул — тысячи моделей - Поддержка OpenAI-совместимых и локальных LLM - Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки - Запуск онлайн или локально (Docker / pnpm) - Полностью опенсорс (Apache-2.0), легко встроить в пайплайны - Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей ⚡️ Попробовать #AI #NoCode #datasets #HuggingFace #LLM

50 150

⚡️ Новые модели для Кодина от Kwaipilot: KAT-Dev-32B и KAT-Coder - KAT-Dev-32B — 62.4% на SWE-Bench Verified, входит в топ-5 среди open-source моделей - KAT-Coder — 73.4% на SWE-Bench Verified, результат на уровне лучших проприетарных решений 🔗 Попробовать: https://huggingface.co/Kwaipilot/KAT-Dev

50 150

🎛️ Claude Squad Инструмент ориентирован на управление несколькими терминальными агентами искусственного интеллекта (Claude Code, Aider, Codex, OpenCode и Amp). Проект помогает организовывать взаимодействие разных ИИ и командных инструментов и привлёк более 3,6 тыс. звёзд. 🟠 Ссылка @data_analysis_ml

50 150

IT_ONE Cup. Code & Analyst — хакатон для аналитиков и разработчиков, где ты узнаешь, как работает IT-команда, и получишь сильный кейс в портфолио. Выбери трек и реши одну из задач: → Проанализируй BPMN-модель кредитного процесса и подготовь ТЗ на систему мониторинга эффективности. → Разработай сервис, который в реальном времени следит за переводами и оповещает о подозрительных операциях. 🏆 Призовой фонд: 900 000 рублей 💻 Формат: онлайн 🗓 Регистрация до 16 октября: https://cnrlink.com/itonecupmsudataanml Приглашаем системных аналитиков, разработчиков и менеджеров проектов. Размер команды — от 1 до 5 человек. Что тебя ждёт: • Применишь навыки системного анализа, построения архитектуры и работы с потоковыми данными. • Получишь готовый проект в портфолио. • Для участников ТОП-5 команд в каждом треке — фирменный мерч. Задачи соревнования: Трек 1. Навигатор оптимизации. Проанализируй кредитный процесс банка, выяви узкие места и создай ТЗ для системы мониторинга производительности. Решение поможет оптимизировать критически важные процессы. Трек 2. Финансовый радар. Разработай сервис для анализа транзакций в реальном времени. Архитектура должна включать правила обнаружения мошенничества и поддержку различных алгоритмов обработки. Ждём тебя на IT_ONE Cup. Code & Analyst — старт 17 октября на Codenrock: https://cnrlink.com/itonecupmsudataanml

50 150

⚡️ Tencent представила Hunyuan3D-Part, первую в своём роде open-source модель генерации 3D-объектов на уровне деталей, которая обгоняет все существующие открытые и закрытые решения. Главное: 🔹 P3-SAM — первая нативная 3D-модель сегментации деталей 🔹 X-Part — генератор деталей с SOTA-результатами по управляемости и качеству Ключевые особенности: 1️⃣ Обучение на 3.7 млн форм с чистыми аннотациями без использования 2D SAM 2️⃣ Новый автоматический пайплайн сегментации в 3D — полностью без участия пользователя 3️⃣ Диффузионный пайплайн для разбиения на части с учётом геометрии и семантики Код доступен на GitHub, веса выложены на Hugging Face, а протестировать модель можно как в облегчённой версии на Hugging Face, так и в полном формате через Hunyuan3D Studio. →Code: https://github.com/Tencent-Hunyuan/Hunyuan3D-Part → Веса: https://huggingface.co/tencent/Hunyuan3D-Part → Paper: https://arxiv.org/abs/2509.06784 → Project page: https://murcherful.github.io/P3-SAM/ Попробовать： → (Light version) Hugging Face demo: https://huggingface.co/spaces/tencent/Hunyuan3D-Part → (Full version) Hunyuan3D Studio: https://3d.hunyuan.tencent.com/studio

50 150

🚀 Новое исследование Hunyuan: Reinforcement Learning on Pre-training Data (RLPT) Этот метод решает главную проблему масштабирования LLM - ограниченность размеченного текста. 🌟 RLPT даёт моделям возможность учиться рассуждениям напрямую на данных предобучения, без дорогой ручной разметки. Как это работает: 1️⃣ Модель во время обучения сама исследует данные и учится более общим стратегиям рассуждений. 2️⃣ Никакой дополнительной разметки — награды извлекаются прямо из предобучающих данных. 3️⃣ Награды за предсказание следующего сегмента позволяют масштабировать RL на этапе предобучения. Результаты: ✅ На Qwen3-4B-Base прирост: +3.0 (MMLU), +5.1 (MMLU-Pro), +8.1 (GPQA-Diamond), +6.0 (KOR-Bench), +6.6 (AIME24), +5.3 (AIME25). ✅ Чем больше вычислений, тем сильнее рост. ✅ Технология создаёт базу для дальнейших улучшений в RLVR. 📄 Подробнее: https://arxiv.org/pdf/2509.19249 #AI #RLPT #LLM #MachineLearning #NLP @data_analysis_ml

50 150

🚀 GitHub запустил публичное превью GPT-5-Codex для Copilot OpenAI представила новую модель GPT-5-Codex, оптимизированную под программирование и агентные задачи. Она доступна пользователям GitHub Copilot в публичном превью. Модель можно выбрать прямо в VS Code в режимах Ask, Edit и Agent, но только начиная с версии Copilot v1.104.1. Доступ распространяется на тарифы Pro, Pro+, Business и Enterprise, при этом в бизнес- и корпоративных планах администратор должен включить поддержку GPT-5-Codex в настройках. https://github.blog/changelog/2025-09-23-openai-gpt-5-codex-is-rolling-out-in-public-preview-for-github-copilot/

50 150

📰 На Yandex Neuro Scale 2025 представили обновлённую AI Studio Платформа позволяет собирать ИИ-агентов без навыков разработки: от голосовых ассистентов на базе realtime API до мультиагентных систем и инструментов вроде AI Search. При желании на платформе можно запустить и самостоятельно написанного агента. Встроены готовые решения — Нейроюрист, SpeechSense, инструмент для протоколирования встреч. Для агентов доступны быстрые интеграции по шаблону через MCP Hub – там уже доступны Контур.Фокус и amoCRM, вскоре появятся и сервисы Яндекса.

50 150

🧠 Сэм Альтман о будущем ИИ-инфраструктуры Глава OpenAI объяснил, почему компания делает ставку на строительство гигантских дата-центров для ИИ. По его словам, через год-два масштабные модели могут требовать 10 ГВт вычислений. В такой ситуации придётся выбирать: использовать эти мощности для исследований по лечению рака или, например, для создания бесплатного образования для всего мира. Чтобы не стоять перед выбором «или-или», OpenAI инвестирует в ещё большую инфраструктуру - так, чтобы человечество могло позволить себе и медицинские прорывы, и доступное обучение для всех.

50 150

⚡️ Сэм Альтман опубликовал новый блог-пост «Abundant Intelligence». Главная мысль: при доступе к 10 гигаваттам вычислений ИИ может приблизиться к решению величайших задач, например, поиску лекарства от рака. OpenAI видит будущее как «фабрику» ИИ-инфраструктуры, способную выпускать по 1 ГВт новых мощностей каждую неделю. Альтман сравнивает это с космической программой Apollo, только теперь цель не космос, а создание избыточного интеллекта. https://blog.samaltman.com/abundant-intelligence

50 150

📢 NVIDIA представила nvmath-python — библиотеку для Python, которая открывает доступ к возможностям фирменных математических библиотек (например, cuBLASLt) через удобный API. Что умеет: - работает с массивами из NumPy, CuPy, PyTorch и других экосистем; - поддерживает тонкую настройку вычислений (precision, режимы умножений, epilog-операции); - позволяет использовать расширенные оптимизации NVIDIA для ускоренной математики и ML-задач. Проект пока в бета-версии, но уже можно попробовать: https://github.com/NVIDIA/nvmath-python

50 150

🔥 Ваши данные стоят слишком дорого, чтобы ими рисковать Positive Technologies 8 октября запустит новый продукт — PT Data Security. Он создан, чтобы вовремя выявлять угрозы и предотвращать утечки, пока они не привели к кризису. На онлайн-трансляции вы первыми узнаете: — Какие задачи и риски сегодня определяют настоящее и будущее рынка защиты данных. — Какие вызовы стоят перед компаниями на рынке защиты данных. — Почему Positive Technologies выходит на рынок защиты данных с новым подходом. 🕒 15:00 мск 📍 Онлайн 👉 Регистрация

50 150

🤖 Почему роботы Unitree так быстро стали одними из лучших? На самом деле - не «вдруг». Секрет в том, что компания не закрылась в себе: - они продают железо и открывают SDK, - сами роботы «из коробки» почти бесполезны, но дают полный контроль разработчикам. Благодаря этому Unitree стала популярной платформой для исследований и разработок, вокруг которой выросло активное сообщество. Результат - G1 сегодня на порядок лучше, чем мог бы быть, если бы компания развивала всё только внутри себя. Многие хардварные компании с амбициями на «комьюнити-продукты» (роботы, AR-очки и др.) выбирают путь закрытых экосистем. Но такая жадность оборачивается тем, что их решения быстро уступают открытым платформам вроде Unitree G1.

50 150

🚀 Хотите ускорить обучение в PyTorch в несколько раз? У DataLoader есть два плохих дефолта, которые тормозят процесс. Исправив их, я получил почти 5x ускорение. ❌ Проблема - .to(device) переносит данные на GPU. - Пока GPU считает - CPU ничего не делает. - Пока CPU готовит данные — GPU простаивает. ⚡ Решение Нужно заставить CPU и GPU работать параллельно: - В DataLoader укажи pin_memory=True - При переносе данных используй .to(device, non_blocking=True) - Добавь num_workers в DataLoader для фоновой загрузки. ✅ В итоге CPU готовит следующий батч, пока GPU занят текущим. Так исчезают простои, и обучение идёт заметно быстрее.

50 150

🐐 В 2009 году Дженсен Хуанг объяснял, что такое CUDA, и прикидывал её рынок. Тогда акции NVIDIA стоили всего около $0.20 за штуку (с учётом сплитов). 💰 Если бы ты вложил $10,000 тогда, сегодня это было бы около $8.8 млн. Вот почему Дженсена называют GOAT.

50 150

🚀 LongCat-Flash-Thinking от Meituan ⚡ Главное - Размер: 560 миллиардов параметров, но работает только часть (~27B), поэтому инференс быстрее и дешевле. - Технология ScMoE (Shortcut-Connected MoE) позволяет совмещать вычисления и обмен данными, уменьшая задержку. - Поддерживает контекст до 128k токенов — можно обрабатывать очень длинные документы. - Обучалась на 20+ триллионах токенов всего за месяц. - Скорость инференса: 100+ токенов в секунду. - Лицензия: MIT. - Поддерживает работу с агентами (agentic tasks). - Модель хороша в программировании и рассуждениях. - На бенчмарке результаты на уровне топовых моделей. LongCat-Flash доказывает, что даже модель на сотни миллиардов параметров может быть быстрой и практичной. 🔗 Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking

50 150

⚡️Мы часто говорим об AGI так, будто это просто технологическая гонка. Но что произойдет, когда машины смогут делать всё, что сегодня считается работой? Новый доклад NBER показывает: в мире с AGI человеческий труд перестаёт быть узким местом для роста — им становится лишь вычислительная мощность. Это значит, что профессии, на которых строится наше нынешнее благосостояние, могут потерять экономический смысл. Те, кто владеет компьютерами, будут определять, кому достанется процветание. Главный вопрос: что будет значить работа, когда её экономическая необходимость исчезнет? И речь идёт не о далёком будущем, а о сдвиге, который формируется уже сейчас. Сильные стороны и ограничения + Полезная теоретическая работа, позволяющая формализовать идеи о будущем с AGI: что именно может стать автоматизированным, каковы условия, при которых автоматизация происходит, и как меняются распределение доходов и роль труда. + Привязка к росту compute (вычислительных ресурсов) как ключевого фактора — отражает реальные технологические тенденции. − Очень абстрактная модель: многие параметры и допущения (темп роста compute, стоимость автоматизации, «ценность» человеческого труда, предпочтения) остаются неопределёнными. − Не учитываются многие реальные ограничения: политические, социальные, институционные; также проблемы безопасности, этики, доступности технологий. − Не фокусируется на трансформации распределения внутри стран, регионов, между группами — реальная динамика может быть более сложной. 🟠 Подробнее

50 150

📘 Introduction to Machine Learning* (Laurent Younes) Что внутри: - 📐 Математический фундамент: анализ, линейная алгебра, теория вероятностей - ⚡ Оптимизация: SGD, проксимальные методы и др. - 🤖 Алгоритмы с учителем: линейные модели, SVM, деревья, бустинг, нейросети - 🎲 Генеративные модели: MCMC, графические модели, вариационные подходы, GAN - 🔎 Без учителя: кластеризация, PCA, факторный анализ, обучение на многообразиях - 📊 Теория: неравения концентрации, обобщающая способность моделей Фундаментальный учебник, который соединяет математику и практику ML. 👉 https://arxiv.org/abs/2409.02668 #MachineLearning #DeepLearning #Mathematics #DataScience #DataScientist