Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 559 Texnologiyalar & Aralashmalar2 679...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 152 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 679-o'rinni va Rossiya mintaqasida 12 559-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 152 obunachiga ega bo‘ldi.

13 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -42 ga, so‘nggi 24 soatda esa -11 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.83% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.66% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 426 marta ko‘riladi; birinchi sutkada odatda 2 839 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 30 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 14 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 152

Obunachilar

-1124 soatlar

-597 kunlar

-4230 kunlar

4 426

Post ko'rishlar

~ 2 83924 soatlar

~ 3 39048 soatlar

8.83%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 150

Alibaba Group представила Memp — новый фреймворк, который даёт LLM-агентам обучаемую и обновляемую процедурную память. 📈 Результат — более высокая успешность и эффективность при сложных задачах. 🧠 Memp превращает прошлый опыт агентов в детальные инструкции и абстрактные стратегии, постоянно совершенствуясь по мере накопления данных. 🔄 Память можно даже передавать более слабым моделям, повышая их возможности. https://huggingface.co/papers/2508.06433

50 150

🆕 Hugging Face представили **AI Sheets** — no-code инструмент для создания и обработки таблиц с помощью ИИ. - Выглядит как обычная таблица, но вместо формул — тысячи моделей - Поддержка OpenAI-совместимых и локальных LLM - Можно добавлять столбцы с промптами, редактировать данные вручную или через лайки - Запуск онлайн или локально (Docker / pnpm) - Полностью опенсорс (Apache-2.0), легко встроить в пайплайны - Подходит для классификации, трансформации данных, синтетики и «vibe-тестов» моделей ⚡️ Попробовать #AI #NoCode #datasets #HuggingFace #LLM

50 150

⚡️ Новые модели для Кодина от Kwaipilot: KAT-Dev-32B и KAT-Coder - KAT-Dev-32B — 62.4% на SWE-Bench Verified, входит в топ-5 среди open-source моделей - KAT-Coder — 73.4% на SWE-Bench Verified, результат на уровне лучших проприетарных решений 🔗 Попробовать: https://huggingface.co/Kwaipilot/KAT-Dev

50 150

🎛️ Claude Squad Инструмент ориентирован на управление несколькими терминальными агентами искусственного интеллекта (Claude Code, Aider, Codex, OpenCode и Amp). Проект помогает организовывать взаимодействие разных ИИ и командных инструментов и привлёк более 3,6 тыс. звёзд. 🟠 Ссылка @data_analysis_ml

50 150

IT_ONE Cup. Code & Analyst — хакатон для аналитиков и разработчиков, где ты узнаешь, как работает IT-команда, и получишь сильный кейс в портфолио. Выбери трек и реши одну из задач: → Проанализируй BPMN-модель кредитного процесса и подготовь ТЗ на систему мониторинга эффективности. → Разработай сервис, который в реальном времени следит за переводами и оповещает о подозрительных операциях. 🏆 Призовой фонд: 900 000 рублей 💻 Формат: онлайн 🗓 Регистрация до 16 октября: https://cnrlink.com/itonecupmsudataanml Приглашаем системных аналитиков, разработчиков и менеджеров проектов. Размер команды — от 1 до 5 человек. Что тебя ждёт: • Применишь навыки системного анализа, построения архитектуры и работы с потоковыми данными. • Получишь готовый проект в портфолио. • Для участников ТОП-5 команд в каждом треке — фирменный мерч. Задачи соревнования: Трек 1. Навигатор оптимизации. Проанализируй кредитный процесс банка, выяви узкие места и создай ТЗ для системы мониторинга производительности. Решение поможет оптимизировать критически важные процессы. Трек 2. Финансовый радар. Разработай сервис для анализа транзакций в реальном времени. Архитектура должна включать правила обнаружения мошенничества и поддержку различных алгоритмов обработки. Ждём тебя на IT_ONE Cup. Code & Analyst — старт 17 октября на Codenrock: https://cnrlink.com/itonecupmsudataanml

50 150

⚡️ Tencent представила Hunyuan3D-Part, первую в своём роде open-source модель генерации 3D-объектов на уровне деталей, которая обгоняет все существующие открытые и закрытые решения. Главное: 🔹 P3-SAM — первая нативная 3D-модель сегментации деталей 🔹 X-Part — генератор деталей с SOTA-результатами по управляемости и качеству Ключевые особенности: 1️⃣ Обучение на 3.7 млн форм с чистыми аннотациями без использования 2D SAM 2️⃣ Новый автоматический пайплайн сегментации в 3D — полностью без участия пользователя 3️⃣ Диффузионный пайплайн для разбиения на части с учётом геометрии и семантики Код доступен на GitHub, веса выложены на Hugging Face, а протестировать модель можно как в облегчённой версии на Hugging Face, так и в полном формате через Hunyuan3D Studio. →Code: https://github.com/Tencent-Hunyuan/Hunyuan3D-Part → Веса: https://huggingface.co/tencent/Hunyuan3D-Part → Paper: https://arxiv.org/abs/2509.06784 → Project page: https://murcherful.github.io/P3-SAM/ Попробовать： → (Light version) Hugging Face demo: https://huggingface.co/spaces/tencent/Hunyuan3D-Part → (Full version) Hunyuan3D Studio: https://3d.hunyuan.tencent.com/studio

50 150

🚀 Новое исследование Hunyuan: Reinforcement Learning on Pre-training Data (RLPT) Этот метод решает главную проблему масштабирования LLM - ограниченность размеченного текста. 🌟 RLPT даёт моделям возможность учиться рассуждениям напрямую на данных предобучения, без дорогой ручной разметки. Как это работает: 1️⃣ Модель во время обучения сама исследует данные и учится более общим стратегиям рассуждений. 2️⃣ Никакой дополнительной разметки — награды извлекаются прямо из предобучающих данных. 3️⃣ Награды за предсказание следующего сегмента позволяют масштабировать RL на этапе предобучения. Результаты: ✅ На Qwen3-4B-Base прирост: +3.0 (MMLU), +5.1 (MMLU-Pro), +8.1 (GPQA-Diamond), +6.0 (KOR-Bench), +6.6 (AIME24), +5.3 (AIME25). ✅ Чем больше вычислений, тем сильнее рост. ✅ Технология создаёт базу для дальнейших улучшений в RLVR. 📄 Подробнее: https://arxiv.org/pdf/2509.19249 #AI #RLPT #LLM #MachineLearning #NLP @data_analysis_ml

50 150

🚀 GitHub запустил публичное превью GPT-5-Codex для Copilot OpenAI представила новую модель GPT-5-Codex, оптимизированную под программирование и агентные задачи. Она доступна пользователям GitHub Copilot в публичном превью. Модель можно выбрать прямо в VS Code в режимах Ask, Edit и Agent, но только начиная с версии Copilot v1.104.1. Доступ распространяется на тарифы Pro, Pro+, Business и Enterprise, при этом в бизнес- и корпоративных планах администратор должен включить поддержку GPT-5-Codex в настройках. https://github.blog/changelog/2025-09-23-openai-gpt-5-codex-is-rolling-out-in-public-preview-for-github-copilot/

50 150

📰 На Yandex Neuro Scale 2025 представили обновлённую AI Studio Платформа позволяет собирать ИИ-агентов без навыков разработки: от голосовых ассистентов на базе realtime API до мультиагентных систем и инструментов вроде AI Search. При желании на платформе можно запустить и самостоятельно написанного агента. Встроены готовые решения — Нейроюрист, SpeechSense, инструмент для протоколирования встреч. Для агентов доступны быстрые интеграции по шаблону через MCP Hub – там уже доступны Контур.Фокус и amoCRM, вскоре появятся и сервисы Яндекса.

50 150

🧠 Сэм Альтман о будущем ИИ-инфраструктуры Глава OpenAI объяснил, почему компания делает ставку на строительство гигантских дата-центров для ИИ. По его словам, через год-два масштабные модели могут требовать 10 ГВт вычислений. В такой ситуации придётся выбирать: использовать эти мощности для исследований по лечению рака или, например, для создания бесплатного образования для всего мира. Чтобы не стоять перед выбором «или-или», OpenAI инвестирует в ещё большую инфраструктуру - так, чтобы человечество могло позволить себе и медицинские прорывы, и доступное обучение для всех.

50 150

⚡️ Сэм Альтман опубликовал новый блог-пост «Abundant Intelligence». Главная мысль: при доступе к 10 гигаваттам вычислений ИИ может приблизиться к решению величайших задач, например, поиску лекарства от рака. OpenAI видит будущее как «фабрику» ИИ-инфраструктуры, способную выпускать по 1 ГВт новых мощностей каждую неделю. Альтман сравнивает это с космической программой Apollo, только теперь цель не космос, а создание избыточного интеллекта. https://blog.samaltman.com/abundant-intelligence

50 150

📢 NVIDIA представила nvmath-python — библиотеку для Python, которая открывает доступ к возможностям фирменных математических библиотек (например, cuBLASLt) через удобный API. Что умеет: - работает с массивами из NumPy, CuPy, PyTorch и других экосистем; - поддерживает тонкую настройку вычислений (precision, режимы умножений, epilog-операции); - позволяет использовать расширенные оптимизации NVIDIA для ускоренной математики и ML-задач. Проект пока в бета-версии, но уже можно попробовать: https://github.com/NVIDIA/nvmath-python

50 150

🔥 Ваши данные стоят слишком дорого, чтобы ими рисковать Positive Technologies 8 октября запустит новый продукт — PT Data Security. Он создан, чтобы вовремя выявлять угрозы и предотвращать утечки, пока они не привели к кризису. На онлайн-трансляции вы первыми узнаете: — Какие задачи и риски сегодня определяют настоящее и будущее рынка защиты данных. — Какие вызовы стоят перед компаниями на рынке защиты данных. — Почему Positive Technologies выходит на рынок защиты данных с новым подходом. 🕒 15:00 мск 📍 Онлайн 👉 Регистрация

50 150

🤖 Почему роботы Unitree так быстро стали одними из лучших? На самом деле - не «вдруг». Секрет в том, что компания не закрылась в себе: - они продают железо и открывают SDK, - сами роботы «из коробки» почти бесполезны, но дают полный контроль разработчикам. Благодаря этому Unitree стала популярной платформой для исследований и разработок, вокруг которой выросло активное сообщество. Результат - G1 сегодня на порядок лучше, чем мог бы быть, если бы компания развивала всё только внутри себя. Многие хардварные компании с амбициями на «комьюнити-продукты» (роботы, AR-очки и др.) выбирают путь закрытых экосистем. Но такая жадность оборачивается тем, что их решения быстро уступают открытым платформам вроде Unitree G1.

50 150

🚀 Хотите ускорить обучение в PyTorch в несколько раз? У DataLoader есть два плохих дефолта, которые тормозят процесс. Исправив их, я получил почти 5x ускорение. ❌ Проблема - .to(device) переносит данные на GPU. - Пока GPU считает - CPU ничего не делает. - Пока CPU готовит данные — GPU простаивает. ⚡ Решение Нужно заставить CPU и GPU работать параллельно: - В DataLoader укажи pin_memory=True - При переносе данных используй .to(device, non_blocking=True) - Добавь num_workers в DataLoader для фоновой загрузки. ✅ В итоге CPU готовит следующий батч, пока GPU занят текущим. Так исчезают простои, и обучение идёт заметно быстрее.

50 150

🐐 В 2009 году Дженсен Хуанг объяснял, что такое CUDA, и прикидывал её рынок. Тогда акции NVIDIA стоили всего около $0.20 за штуку (с учётом сплитов). 💰 Если бы ты вложил $10,000 тогда, сегодня это было бы около $8.8 млн. Вот почему Дженсена называют GOAT.

50 150

🚀 LongCat-Flash-Thinking от Meituan ⚡ Главное - Размер: 560 миллиардов параметров, но работает только часть (~27B), поэтому инференс быстрее и дешевле. - Технология ScMoE (Shortcut-Connected MoE) позволяет совмещать вычисления и обмен данными, уменьшая задержку. - Поддерживает контекст до 128k токенов — можно обрабатывать очень длинные документы. - Обучалась на 20+ триллионах токенов всего за месяц. - Скорость инференса: 100+ токенов в секунду. - Лицензия: MIT. - Поддерживает работу с агентами (agentic tasks). - Модель хороша в программировании и рассуждениях. - На бенчмарке результаты на уровне топовых моделей. LongCat-Flash доказывает, что даже модель на сотни миллиардов параметров может быть быстрой и практичной. 🔗 Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking

50 150

⚡️Мы часто говорим об AGI так, будто это просто технологическая гонка. Но что произойдет, когда машины смогут делать всё, что сегодня считается работой? Новый доклад NBER показывает: в мире с AGI человеческий труд перестаёт быть узким местом для роста — им становится лишь вычислительная мощность. Это значит, что профессии, на которых строится наше нынешнее благосостояние, могут потерять экономический смысл. Те, кто владеет компьютерами, будут определять, кому достанется процветание. Главный вопрос: что будет значить работа, когда её экономическая необходимость исчезнет? И речь идёт не о далёком будущем, а о сдвиге, который формируется уже сейчас. Сильные стороны и ограничения + Полезная теоретическая работа, позволяющая формализовать идеи о будущем с AGI: что именно может стать автоматизированным, каковы условия, при которых автоматизация происходит, и как меняются распределение доходов и роль труда. + Привязка к росту compute (вычислительных ресурсов) как ключевого фактора — отражает реальные технологические тенденции. − Очень абстрактная модель: многие параметры и допущения (темп роста compute, стоимость автоматизации, «ценность» человеческого труда, предпочтения) остаются неопределёнными. − Не учитываются многие реальные ограничения: политические, социальные, институционные; также проблемы безопасности, этики, доступности технологий. − Не фокусируется на трансформации распределения внутри стран, регионов, между группами — реальная динамика может быть более сложной. 🟠 Подробнее

50 150

📘 Introduction to Machine Learning* (Laurent Younes) Что внутри: - 📐 Математический фундамент: анализ, линейная алгебра, теория вероятностей - ⚡ Оптимизация: SGD, проксимальные методы и др. - 🤖 Алгоритмы с учителем: линейные модели, SVM, деревья, бустинг, нейросети - 🎲 Генеративные модели: MCMC, графические модели, вариационные подходы, GAN - 🔎 Без учителя: кластеризация, PCA, факторный анализ, обучение на многообразиях - 📊 Теория: неравения концентрации, обобщающая способность моделей Фундаментальный учебник, который соединяет математику и практику ML. 👉 https://arxiv.org/abs/2409.02668 #MachineLearning #DeepLearning #Mathematics #DataScience #DataScientist