Анализ данных (Data analysis)

الذهاب إلى القناة على Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

إظهار المزيد

الشبكة:Machinelearning روسيا12 559 التكنولوجيات والتطبيقات2 679...

📈 نظرة تحليلية على قناة تيليجرام Анализ данных (Data analysis)

تُعد قناة Анализ данных (Data analysis) (@data_analysis_ml) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 50 152 مشتركاً، محتلاً المرتبة 2 679 في فئة التكنولوجيات والتطبيقات والمرتبة 12 559 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 50 152 مشتركاً.

بحسب آخر البيانات بتاريخ 13 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -42، وفي آخر 24 ساعة بمقدار -11، مع بقاء الوصول العام مرتفعاً.

حالة التحقق: غير موثّقة
معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 8.83‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 5.66‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
وصول المنشورات: يحصل كل منشور على متوسط 4 426 مشاهدة. وخلال اليوم الأول يجمع عادةً 2 839 مشاهدة.
التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 30.
الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, контекст, openai, архитектура, deepseek.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 14 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

50 152

المشتركون

-1124 ساعات

-597 أيام

-4230 أيام

4 426

عرض المشاهدات

~ 2 83924 ساعات

~ 3 39048 ساعات

8.83%

معدل المشاركة

~ 5

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

50 153

✂️ НОВОСТЬ: Вышел Grok 4 Fast (ранний доступ, бета) И название себя оправдывает — молниеносно быстрый. Бету можно включить прямо сейчас: Настройки → Подписка → Включить ранний доступ к моделям ⚡️ Главный апдейт — скорость, которая делает Grok 4 отличеным выбором для задач с большим количеством вычислений. @data_analysis_ml

50 153

Эра 1-битных LLM наступила 🫥 🔹 DeepSeek-V3.1, квантованный всего до 1-бита или 3-бит, обошёл Claude Opus 4 и GPT-4.5. 🔹 Unsloth GGUF смог сжать DeepSeek-V3.1 на 75%, при этом модель превзошла топовых конкурентов в бенчмарке Aider Polyglot. 🟠Подробности: https://docs.unsloth.ai/new/unsloth-dynamic-ggufs-on-aider-polyglot @data_analysis_ml

50 153

🚀 MobileLLM-R1 на Hugging Face Это новая компактная модель для reasoning-задач (рассуждений), которая весит меньше 1B параметров и оптимизирована для запуска на edge-устройствах. Почему это важно: - Производительность: • Решает задачи MATH почти в 5 раз точнее, чем Olmo-1.24B • В 2 раза точнее, чем SmolLM2-1.7B - Эффективность обучения: • Модель обучалась всего на 4.2 триллионах токенов (это примерно 1/10 от Qwen3) • Несмотря на это, показывает такие же или лучшие результаты, чем Qwen3, на ряде тестов по рассуждениям MobileLLM-R1 показывает, что даже очень маленькая модель может быть умной и эффективной, если её правильно обучить. https://huggingface.co/facebook/MobileLLM-R1-950M

50 153

Если Ctrl+Z не помогает… Значит, пора искать команду, где гипотезы проверяются на реальных данных, а результаты влияют на миллионы пользователей. В Сбере именно так — и это видно даже в поздравительном видео, которое подготовили будущие коллеги. Вакансии ждут вас здесь. А кодовый бонус прилагается: team.congratulate("С Днём программиста! 💚")

50 153

🔥 Новинка от S-Lab, Nanyang Technological University и SenseTime Research: Next Visual Granularity Generation (NVG)! 🖼️ Новый фреймворк поэтапно улучшает изображение — от общего макета до мельчайших деталей, позволяя получить тонкий контроль над процессом генерации. 📊 Результаты впечатляют: NVG превзошёл серию VAR по метрикам FID! huggingface.co/papers/2508.12811

50 153

Поздравляем, вы на 1 шаг ближе к работе мечты 🥳 Осталось только прочитать этот пост, подписаться на канал и откликнуться на вакансию 😉 Avito Career — место, где Авито делится актуальными вакансиями и стажировками для Go-разработчиков. Подписывайтесь, чтобы найти ту самую работу ✨

50 153

🚀 Новый релиз: Smart Turn v3 🎙️ Это модель, которая понимает, когда человек закончил говорить и ждёт ответа от голосового ассистента. ⚡ Особенности: - Работает супербыстро: <60мс на обычном CPU, <10мс на GPU - Поддержка 23 языков (можно добавлять новые через сообщество) - Полностью открытая: данные, код, обучение - Бесплатно использовать даже на CPU 🛠️ Уже доступна в @pipecat_ai 0.0.85 и на Pipecat Cloud. 🔥 Голосовой AI становится всё умнее — теперь ассистенты будут отвечать ещё естественнее! 🟢Blog: https://daily.co/blog/announcing-smart-turn-v3-with-cpu-inference-in-just-12ms/ 🟢GitHub: https://github.com/pipecat-ai/smart-turn/

50 153

🚀 Оптимизация обновления весов моделей в LLM Checkpoint Engine — это легковесное промежуточное ПО для обновления весов в LLM во время инференса, критически важное для обучения с подкреплением. Оно обеспечивает быстрые и эффективные методы обновления весов, позволяя обрабатывать модели с триллионом параметров за считанные секунды. 🚀 Основные моменты: - Поддержка двух методов обновления: Broadcast и P2P. - Эффективная передача данных с использованием CUDA IPC. - Оптимизированный процесс передачи с учетом шардирования. - Подходит для работы с большими моделями на множестве GPU. 📌 GitHub: https://github.com/MoonshotAI/checkpoint-engine

50 153

🚨 Китай выкатил мощнейшую новинку в AI-редактировании изображений — и она обошла Google Nanobanana, став №1! 🔥 Bytedance Seedream 4 впечатляет: - ⚡️ Генерация в 2K за <2 секунд, поддержка 4K (🍌 ограничен низким разрешением) - 🎨 Более свободная политика генераций - 🖼️ Можно создавать сразу несколько картинок в одном сете - 🎯 Намного стабильнее: 🍌 часто просто возвращает исходное изображение 💰 Цена — всего $0.03 за генерацию. Идеально подходит для сторибордов к фильмам и фотореалистичных сцен. Гонка в AI-генерации картинок выходит на новый уровень! 🚀 https://fal.ai/models/fal-ai/bytedance/seedream/v4/edit

50 153

⚡️ На чистом SQL запустили легендарный DOOM — прямо внутри базы данных CedarDB! Игра не просто работает, а поддерживает многопользовательский режим, отрисовывая всё с помощью ASCII-графики. Каждый компонент — от рендера до синхронизации игроков — написан исключительно на SQL-запросах. 🎮 GitHub для настоящих ценителей извращённого кода: https://github.com/cedardb/DOOMQL

50 153

💰Perplexity привлекла $200M при оценке в $20B. Это произошло всего через два месяца после предыдущего раунда в $100M при оценке $18B. Общий объём инвестиций приближается к $1.5B. 📊 Выручка (ARR) уже почти $200M (месяц назад была $150M). 💡 Оценка в $20B при $200M ARR даёт мультипликатор ~100x - это возможно только при очень быстром росте и низком уровне оттока пользователей. Perplexity выделяется тем, что отвечает на запросы с источниками и краткими сводками, заменяя «охоту за ссылками» на результат, сгенерированный моделью. Но такой дизайн требует больших вычислительных мощностей: каждый запрос запускает веб-поиск, инференс LLM и генерацию ответа в реальном времени. Источник: https://techcrunch.com/2025/09/10/perplexity-reportedly-raised-200m-at-20b-valuation/ #AI #Perplexity #Funding #Startups #LLM #Investments

50 153

😄 12 сентября смотрите онлайн-студию первой «Ночи музеев» в мире IT В Яндексе придумали «Ночь музеев» в мире IT, а Сбер, Т-банк, Х5 и Lamoda поддержали идею и присоединились. Если вы не успели зарегистрироваться как офлайн-участник – подключайтесь онлайн. 🙌 Студия big tech night online будет работать 12 сентября с 18:00 до 21:00 по московскому времени. Можно переключаться между двумя треками. 😛😝В софт-треке вас ждут: – шоу для разработчиков со стендап-комиком Севой Ловкачёвым; – обсуждение pet-проектов и изобретательства среди инженеров; – юмор в борьбе со стрессами: мемы как способ выжить в бигтехе. 😋😛 В хард-треке: – разберём, чем отличается бигтех в России и за рубежом: каких специалистов ищут компании, есть ли культурные отличия? – поговорим с Маратом Мавлютовым – руководителем подразделения из Яндекса, разрабатывающего роботов-доставщиков; – обсудим, как AI помогает разработчикам сейчас и как будет помогать в будущем. 😌 Регистрируйтесь и подключайтесь. Реклама. ООО "Яндекс". ИНН 7736207543

50 153

🤖 Прорыв в наноботах Учёные из Penn State сделали важный шаг к созданию настоящих наноботов. 🔬 С помощью нового микро-флюидного устройства они создали крошечные частицы, которые могут обмениваться сигналами и действовать вместе — как муравьи, оставляющие следы для других. - Одна группа частиц двигалась по химическому градиенту и оставляла «след». - Другая группа улавливала этот след и шла за ним. 👉 Это выглядит просто, но именно так закладывается основа программируемых роёв наноботов. 💡 Возможные применения: - наночастицы находят опухоль и зовут другие с лекарством, - мини-системы доставляют груз в нужную клетку, - наноботы очищают организм от токсинов или восстанавливают повреждённые ткани. Раньше учёные могли наблюдать за таким процессом всего несколько секунд. Теперь, с новым инструментом Penn State, поведение можно изучать минутами, что позволяет проводить более сложные эксперименты. 🌱 Вдохновение пришло из природы — у пчёл и муравьёв есть распределение ролей и совместная работа. Если частицы смогут делать то же самое, это приблизит нас к самоорганизующимся автономным наносистемам, которые могут изменить медицину и материалы. Это пока ранняя стадия, но именно такие шаги строят фундамент для будущих роёв наноботов. https://www.psu.edu/news/eberly-college-science/story/can-nanobots-play-follow-leader

50 153

⚡ Ускорение PyTorch-инференса на Apple-устройствах на 87% с помощью AI-сгенерированных Metal-ядр В новом исследовании показано, как AI-модели автоматически генерируют оптимизированные GPU-ядра под Metal, которые ускоряют работу PyTorch на устройствах Apple. 📊 Результаты: - В среднем прирост скорости - 87% на 215 модулях. - Некоторые ядра работают в сотни раз быстрее базового уровня. 🟢 Как это работает: - Используется agentic swarm-подход - несколько агентов генерируют и тестируют варианты ядер. - В контекст добавляются CUDA-референсы и данные профилирования, что помогает создавать более эффективные ядра. - Такой метод превосходит одиночные модели, генерирующие код без дополнительного контекста. Fвтоматическая генерация GPU-ядер AI-моделями открывает путь к более быстрому и доступному инференсу прямо «из коробки» на Mac и iOS. 🔗 Подробности: https://gimletlabs.ai/blog/ai-generated-metal-kernels

50 153

📖 Новая работа ByteDance + Harvard: *Mycroft: Tracing Dependencies in Collective Communication Towards Reliable LLM Training* Mycroft - система, которая помогает понять, почему обучение LLM на кластере GPU тормозит или падает. 🚧 Проблема При распределённом обучении сотни GPU постоянно обмениваются данными через библиотеку NCCL. Она работает как «чёрный ящик»: при сбое видно только таймауты или падение скорости, но непонятно, где именно сбой. 🛠 Решение — Mycroft - «Подглядывает» внутрь процесса обмена данными - Каждые 100 мс пишет лёгкие статусы: сколько данных подготовлено, отправлено и завершено - Если прогресс застопорился → сразу сигнал - Отслеживает зависимости между GPU и определяет: проблема в конкретной карте, сетевой карте или шине ⚡ Результаты - В тестах на 32 GPU и в проде у ByteDance - Находит сбой за ~**15 секунд** - Указывает точный компонент за <**20 секунд** - Нагрузка на обучение почти нулевая 🔗 https://arxiv.org/abs/2509.03018 #AI #LLM #GPU #DistributedTraining #ByteDance #Harvard

50 153

Ты: «Эх, вот бы кто-то научил анализировать данные, чтобы у меня было больше шансов поступить в вуз и начать карьеру…» Яндекс Лицей: «Ок» Запускаем новый набор для учащихся школ и колледжей на инстивный, трёхмесячный курс по анализу данных. Научим работать с Python не в теории, а на практике: верно анализировать, точно делать выводы и красиво показывать результаты. Сделали такой онлайн-курс, чтобы мог пригодиться и в обучении, и в карьере. Поэтому: 1. Сделали упор на практику и только нужную теорию 2. Только те задачи, которые действительно решают в компаниях 3. Ввели командную разработку Ну и финальное: после обучения получите именной сертификат. Он может помочь получить дополнительные баллы при поступлении в некоторых вузах. Обучение в Яндекс Лицее бесплатно, но есть отбор. Он открыт до 23 сентября. Вся программа, подробности и регистрация на новый поток по ссылке.

50 153

🚀 NVIDIA представила Rubin CPX — новый класс GPU для inference с огромным контекстом 🔑 Что интересно - Rubin CPX — специализированный GPU для обработки контекста размером до миллиона токенов (код, видео, длинные последовательности). - Интеграция в платформу Vera Rubin NVL144 CPX: - До 8 экзафлопс вычислений ИИ - 100 ТБ быстрой памяти - 1,7 ПБ/с пропускной способности - Превосходит GB300 NVL72 по производительности на 7,5×. - Характеристики: - 30 PFLOPS вычислений в NVFP4 - 128 ГБ GDDR7 памяти - 3× ускоренные attention-механизмы для длинного контекста - Поддержка всего AI-стека NVIDIA: Dynamo, Nemotron, CUDA-X, AI Enterprise. - Выход ожидается в конце 2026 года. 📌 Зачем это важно - Масштаб контекста до миллиона токенов открывает новые горизонты в кодогенерации и видео-ИИ. - Уникальная комбинация памяти и вычислений делает возможным реальный SOTA-инференс для задач с длинной «памятью». - Уже интерес вызывает у таких игроков, как Cursor (AI-редактор кода), Runway (видео-генерация) и Magic (модели-агенты). 🧭 Итог Rubin CPX задаёт новый стандарт для аппаратной архитектуры в AI. Это фундамент для моделей, которые смогут полноценно работать с огромными контекстами, не теряя деталей и качества. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference

50 153

💾 Зачем нужен Delta Lake, если есть Parquet Обычный Parquet хранит только одно состояние таблицы. Если вы сохранили отфильтрованный DataFrame, то старые данные исчезли навсегда. ❌ Отката (rollback) нет → потеряли 10 000 строк, осталось только 3 500. ⚡ Delta Lake работает иначе: - каждый раз создаётся новая версия данных - можно вернуться к любой версии в прошлом - данные всегда под контролем и без потерь 📌 Пример: - Parquet → фильтр → оригинал стёрт - Delta Lake → версия 0 (10 000 строк) + версия 1 (3 500 строк) → всегда можно вернуться к версии 0 ✅ Итог: с Delta Lake данные становятся версионируемыми и надёжными. #datalake #parquet #bigdata #delta

50 153

⚡️ DeepCode — открытая AI-платформу для автоматической генерации кода. DeepCode превращает научные статьи и технические документы в готовые проекты, включая фронтенд, бэкенд и полноценные репозитории. 🔹 Основные возможности: • Paper2Code — реализация идей из исследований в рабочий код • Text2Web — генерация интерфейсов по описанию • Text2Backend — автоматическое создание масштабируемых серверов • Поддержка длинных документов и многофайловых проектов 🔜 В ближайшее время разработчики обещают: • Автоматическую проверку и валидацию кода • Повышение скорости генерации • Улучшенную работу с требованиями • Бенчмарки воспроизведения научных статей (PaperBench) Проект полностью open source: https://github.com/HKUDS/DeepCode #deepcode #AI #coding

50 153

🛢 В мире, где данные — новая нефть, растёт спрос на дата-инженеров. Ведь именно они знают, как такую нефть добывать, обрабатывать и хранить. И пока компании осознают потребность в этих специалистах, конкуренция на рынке низкая, а зарплаты — высокие. Освоить ключевые компетенции дата-инженера поможет онлайн-магистратура Нетологии и НИУ ВШЭ «Инженерия данных». За 2 года вы на практике изучите Python, Java, Scala, Kotlin и SQL, научитесь проектировать пайплайны и обрабатывать данные, работать с системами хранения данных и базами данных в облаке. Программа даёт широкий простор для переквалификации, поэтому после учёбы сможете перейти в MLOps, DevOps или менеджмент. Онлайн-формат позволяет учиться без отрыва от привычной жизни и совмещать занятия с работой. При этом у вас будет отсрочка от армии, льготы на проезд и все остальные бонусы очного обучения. Станьте магистром программной инженерии с дипломом одного из лучших вузов страны и получите веское преимущество при приёме на работу: https://netolo.gy 🎁 В этом году при поступлении на программу вы получаете курс по ещё одной IT-профессии в подарок — отличная возможность расширить свой профиль и усилить CV. Реклама. ООО "Нетология". ИНН 7726464125. Erid: 2VSb5wgUXnq