Анализ данных (Data analysis)

Open in Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Network:Machinelearning Russia12 514 Technologies & Applications2 668...

📈 Analytical overview of Telegram channel Анализ данных (Data analysis)

Channel Анализ данных (Data analysis) (@data_analysis_ml) in the Russian language segment is an active participant. Currently, the community unites 50 260 subscribers, ranking 2 668 in the Technologies & Applications category and 12 514 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 50 260 subscribers.

According to the latest data from 20 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 46 over the last 30 days and by 34 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.91%. Within the first 24 hours after publication, content typically collects 6.23% reactions from the total number of subscribers.
Post reach: On average, each post receives 4 477 views. Within the first day, a publication typically gains 3 132 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 32.
Thematic interests: Content is focused on key topics such as llm, контекст, openai, архитектура, deepseek.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Thanks to the high frequency of updates (latest data received on 21 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

50 260

Subscribers

+3424 hours

+1087 days

+4630 days

4 477

Post views

~ 3 13224 hours

~ 4 04348 hours

8.91%

Engagement rate

~ 5

Posts per day

Ads index

beta

Posts Archive

50 261

Профессия аналитика данных — одна из самых высокооплачиваемых и перспективных в сфере IT. На курсе «Аналитик данных» от Нетологии вы с нуля освоите необходимые навыки за 7 месяцев под руководством опытных наставников-практиков. Вы изучите SQL, Python, Power BI — ключевые инструменты для работы с данными. Научитесь использовать статистические методы, строить и проверять гипотезы. Создадите 4 полноценных проекта для своего портфолио и выполните более 20 практических заданий. А по окончании курса получите диплом о профпереподготовке и сможете претендовать на должность junior-аналитика. Начните свой путь в сфере аналитики данных — присоединяйтесь к программе. Промокод АНАЛИТИК-10 даст дополнительную скидку 10% от цены курса. Записаться: https://netolo.gy/dj9s Реклама. ООО "Нетология". Erid 2VSb5yvacac

50 261

🌟 Реализация диффузионной модели с архитектурой UNet на чистом CUDA В этом репозитории приведена реализация модели UNet на чистом CUDA с подробным описанием всех шагов. Цель этого проекта — создать диффузионную модель на CUDA и достичь производительности PyTorch; выбрана архитектура UNet как ключевая архитектура для диффузионных моделей В итоге, готовая модель была обучена на изображениях слонов из ImageNet 64x64 и теперь вполне успешно их генерирует. 🖥 GitHub @data_analysis_ml

50 261

ML: с чего начинается Data Science? Приглашаем на открытый урок, где вы узнаете про область ML, которая лежит в основе Data Science и AI сегодня. 🔹Расскажем, чем оно отличается от классического программирования и какие в ML существуют типы задач. ✅ Практика: Решите первую задачу ML на языке Python В результате урока вы обучите свою первую модель машинного обучения для решения задачи классификации рукописных цифр Урок приурочен курсу «Специализация Machine Learning» от Otus. 👉 Регистрация и подробности: https://otus.pw/krTC/?erid=LjN8JwL3N

50 261

📌Skforecast — библиотека для прогнозирования временных рядов — pip install skforecast Skforecast — это библиотека Python, которая облегчает использование моделей регрессии от scikit-learn для прогнозирования временных рядов. Skforecast также работает с любыми моделями регрессии, совместимыми с API scikit-learn (LightGBM, XGBoost, CatBoost...) 🖥 GitHub 🟡 Доки 🟡 Примеры использования @data_analysis_ml

50 261

🔥В OTUS стартует курс "Machine Learning. Professional", обучение на котором позволит последовательно освоить современные инструменты анализа данных и на профессиональном уровне создавать модели машинного обучения. Студенты курса выбирают самостоятельно темы выпускных работ, поэтому все выпускные проекты на курсе–это ценные исследования для ML. ⚡24 июля в 18.00 мск приглашаем на открытый урок курса "Популярные ML-методы для поиска выбросов в данных". На занятии: - разберем задачу поиска аномалий; - изучим как с помощью методов ML можно очищать данные от выбросов; - в теории разберем несколько алгоритмов и применим их на практике. 👉Регистрация https://otus.pw/GGwO/?erid=LjN8KHDLN При поступлении в группу обучения возможны разные способы оплаты и рассрочка платежа

50 261

🌟 Xorbits — масштабируемый Python фреймворк для задач ML и DS, ориентированный на скорость Xorbits позволяет, к примеру, легко использовать данные для обучения генеративных моделей а также разворачивать обученные модели в своей инфраструктуре. Xorbits может использовать несколько ядер/GPU, может работать на 1 машине или масштабироваться до тысяч машин для поддержки обработки терабайтов данных. Xorbits предоставляет набор полезных библиотек для анализа данных и ML. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 261

🌟 Metarank — open-source сервис ранжирования для создания персонализированного семантического поиска и рекомендательных систем Metarank позволяет реализовать персонализированное ранжирование статей, объявлений, результатов поиска — в общем отлично подходит для создания рекомендательных систем Быстрый старт с Docker:

docker run -i -t -p 8080:8080 -v $(pwd):/opt/metarank metarank/metarank:latest standalone --config /opt/metarank/config.yml --data /opt/metarank/events.jsonl.gz

🖥 GitHub 🟡 Доки 🟡 Пример использования Metarank @data_analysis_ml

50 261

🖥 Geomstats — библиотека Python, позволяющая использовать нелинейные многообразия для обучения ML-моделей — pip install geomstats Данные из многих прикладных областей тесно связаны с нелинейными многообразиями. Например, многообразие трехмерных вращений SO(3) естественным образом возникает при проведении статистического обучения на сочлененных объектах, таких как человеческий позвоночник или руки роботов. Аналогично, другие многообразия возникают при моделировании сложных биологических объектов 🖥 GitHub 🟡 Доки @data_analysis_ml

50 261

Стоит ли вам начинать карьеру в аналитике и Date Science? Онлайн-встреча, которая поможет понять Вокруг работы с данными много мифов: сложно начать карьеру — просто начать карьеру — нужно начинать с бизнес-аналитики — всем надо в системные аналитики. День открытых дверей «Как начать карьеру в аналитике и Data Science» поможет разобраться, что из этого правда, а что нет. Продюсеры Нетологии ответят на волнующие вопросы: — По-прежнему ли высок спрос на аналитиков? — В какие компании устраиваться на работу в сфере данных, чтобы хорошо зарабатывать? — С чего стартовать в аналитике и Data Science и сложно ли это? Участники встречи получат в подарок гайд «Как войти в сферу данных и найти своё направление». Он поможет принять взвешенное решение о старте карьеры в новой для вас профессии. Приоткройте для себя двери в аналитику: https://netolo.gy/djxG Реклама. ООО "Нетология". Erid: 2VSb5wuZdui

50 261

🌟 NeuralForecast — большая коллекция ML-моделей для прогнозирования — pip install neuralforecast NeuralForecast предлагает множество моделей прогнозирования: от классических MLP и RNN, до новых моделей, таких как NBEATS, NHITS, TFT и других. 🖥 GitHub 🟡 Быстрый старт @data_analysis_ml

50 261

Яндекс Практикум и Томский государственный университет открывают набор на онлайн-программу «Дата-аналитика для бизнеса». На этой программе вас ждут: — очная форма обучения с занятиями и экзаменами в онлайн-формате; — опыт преподавателей ТГУ и наставников Яндекса; — диплом гособразца по итогам обучения. Обучение можно оплатить целиком или вносить сумму частями перед началом каждого семестра. Вы сможете оформить госкредит — с его помощью государство погасит часть кредита за вас, а ежемесячный платёж составит от 500 ₽. — Узнать подробнее Реклама. ООО «Яндекс». ИНН 7736207543

50 261

Repost from Machinelearning

⚡️ DeepSeek-V2-Chat-0628: обновленная версия Deepseek-V2 DeepSeek выложила в открытый доступ веса модели V2-Chat-0628. Это обновление флагманской Deepseek-V2, одной из лучших моделей в открытом доступе. Согласно чартам LMSYS Chatbot Arena - эта модель №11 среди open-source моделей на сегодняшний день. Детальные достижения: 🟢Hard Prompts 3-я позиция чарта; 🟢Coding 3-я позиция чарта; 🟢Longer Query 4-я позиция чарта; 🟢Math 7-я позиция чарта. Основная особенность обновления - была оптимизирована возможность следования инструкциям в области "система", что значительно повышает удобство работы с иммерсивным переводом, RAG и другими задачами. Одновременно с обновлением в репозитории на Huggingface, модель доступна по API в сервисе https://platform.deepseek.com. 💵 Стоимость API DeepSeek-V2-Chat-0628 (128K Context length): Input - $0.14 / 1M tokens Output - $0.28 / 1M tokens ⚠️ Размер модели ~ 480 Gb, для локального запуска формата BF16 потребуется 8х80GB GPU`s. ⚖️ Лицензирование кода: MIT ⚖️ Лицензирование модели: Своя лицензия семейства DeepSeek-v2 🟡Страница проекта 🟡Arxiv 🟡Модель на HF @ai_machinelearning_big_data #LLM #DeepSeekV2 #ML

50 261

🌟 Kedro — набор готовых к продакшену инструментов для Data Science и ML — pip install kedro Kedro — фреймворк, который добавляет модульность, удобную для работы с данными. С помощью Kedro можно создавать проекты по шаблону, настраивать пайплайн в YAML, делить его на части, документировать проект — и это далеко не всё. Kedro позволяет сохранять и загружать данные в различные хранилища, такие как S3, GCP, Azure, sFTP, DBFS и локальные файловые системы. Поддерживаются такие форматы файлов, как Pandas, Spark, Dask, NetworkX, Pickle, Plotly, Matplotlib и многие другие. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 261

Привет! Это команда Концепт-Разработка. Мы занимаемся развитием и внедрением продуктов в сфере больших данных, корпоративных хранилищ данных, BI и систем управления данными. У себя в канале развиваем сообщество бизнес и системных аналитиков, разработчиков и data-инженеров. + Актуальные вакансии; + Интересные разработки; + Проекты федеральных заказчиков; + Новости индустрии и многое другое. Подписывайся на канал, мы будем рады и экспертам, и начинающим специалистам. Реклама. ООО "КОНЦЕПТ РАЗРАБОТКА". ИНН 7703471165. erid: LjN8KWK3G

50 261

⚡️ Polyaxon — open-source MLOps-платформа установка CLI:

pip install -U polyaxon

Polyaxon — это платформа для создания, обучения и мониторинга крупномасштабных ML-приложений, призванная решить проблемы воспроизводимости, автоматизации и масштабируемости. Polyaxon можно развернуть в любом ЦОДе или облачном провайдере; платформа поддерживает все необходимые фреймворки, такие как Tensorflow, MXNet, Caffe, Torch и т. д. 🖥 GitHub 🟡 Доки @data_analysis_ml

50 261

Какой путь к работе мечты самый короткий? Конечно, One Day Offer от Сбера! 😉 Если ты Data Analyst или Data Engineer, мы ждём тебя 27 июля. Получи возможность пройти fast-интервью, познакомиться с командой и забрать долгожданный оффер всего за один день. Наша команда разрабатывает и внедряет DS-решения в точки касания клиента со Сбером: отделения, мобильное приложение, банкоматную сеть и т.д. Мы работаем с технологиями Python, Spark, SQL, Hadoop, GreenPlum и за год внедряем более 200 моделей. Тебя ждут интересные и разноплановые задачи 👇 ▪️ Обучение всех типов моделей искусственного интеллекта: от классического ML до глубоких нейронных сетей. ▪️ Создание высокотехнологичных сервисов: от систем принятия решений до компьютерного зрения и обработки естественного языка. ▪️ Развитие хранилища на Teradata и DataLake на Hadoop. Отправляй заявку уже сейчас и присоединяйся к команде!💚

50 261

🌟 Llama Recipes — набор готовых метод для файнтюнинга Llama3 — pip install llama-recipes Llama Recipes предоставляет набор методов для файнтюнинга Llama3 с использованием FSDP и PEFT для работы на одном/нескольких GPU. 🖥 GitHub @data_analysis_ml

50 261

🌍 Новая реальность: посетить концерт, не выходя из дома, увидеть друзей, находясь за тысячи километров, получить высшее образование по Data Science удалённо. Когда виртуальные границы стираются, самое время применить технологии с пользой. Онлайн-бакалавриат Нетологии и ТюмГУ «Аналитика и Data Science» — способ получить диплом о высшем образовании из любой точки мира. За 4 года вы освоите навыки работы с данными и станете бакалавром в области математики, который умеет работать с Big Data, компьютерным зрением и искусственным интеллектом. Будете закреплять знания на практике, создадите портфолио и сможете строить карьеру аналитика данных или Data Scientist. Во время учёбы у вас будут все студенческие льготы и скидки, а в конце вы получите диплом очного бакалавриата ― такой же, как у студентов офлайн-обучения. Узнать подробности о программе 👉https://netolo.gy/dgU1 Реклама ООО “Нетология” 2VSb5yj8Z4U

50 261

🌟 LongVA: VLM для больших видео на основе Qwen-2-7B LongVA – техника визуальной обработки длинных видео, которая может обрабатывать более 1000 кадров и 200К визуальных токенов с помощью концепции Long Context Transfer. Принцип Long Context Transfer состоит в изменении метода обучения: сначала обучают языковую модель только на данных "изображение-текст", а затем используют краткие данные изображений для согласования модальностей. Модель, обученная таким образом, может напрямую понимать мультикадровые видео, исключая необходимость в обучении на датасетах длинных видео. В независимом тестировании на Video-MME, предложенном USTC, LongVA заняла седьмое место и достигла уровня SoTA для модели 7B. В тестировании MLVU - второе место после GPT-4o и была признана самой мощной открытой моделью. Для лабораторного тестирования метода был разработан специальный тест Visual Needle-In-A-Haystack (V-NIAH), состоящий из пяти вопросов с ответами на основе изображений. Каждый из пяти изображений были вставлены в качестве отдельного кадра в тестовое многочасовое видео. Проверка на тестовых пяти вопросах (с подсказкой по локализации в формулировке вопроса) показала, что LongVA проходит этот тест пределах 2000 кадров при плотности 144 токена на кадр. Этот тест доступен в репозитории проекта наряду с инструкциями по запуску LongVA в локальных средах и инструментами для самостоятельной тонкой настройки (тренировки) модели. 👉 Весь набор предлагаемых инструментов репозитория прошел проверку на выполнение с CUDA 11.8 на 1хA100-SXM-80G ⚖️ Лицензирование кода: Apache-2.0 license ⚖️ Лицензирование моделей: Qwen2 license 🟡Страница проекта 🟡Demo 🟡Модели на HF 🟡Arxiv 🖥Github [Stars: 221 | Issues: 9 | Forks: 11] @ai_machinelearning_big_data #ML #VLM #VQA

50 261

🌟 whylogs — библиотека Python для конвейеров обработки данных и для ML-приложений — pip install whylogs whylogs позволяет эффективно собирать данные для: — отслеживания любых изменений в наборе данных — быстрой визуализации основных статистических параметров данных — обнаружения дрейфа данных — выявления проблем в процессе обучения, причин снижения производительности ML-модели 🖥 GitHub 🟡 Доки @data_analysis_ml