Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 251 名订阅者,在 技术与应用 类别中位列第 2 653,并在 俄罗斯 地区排名第 12 492 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 251 名订阅者。
根据 24 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 38,过去 24 小时变化为 -6,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 9.10%。内容发布后 24 小时内通常能获得 6.25% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 571 次浏览,首日通常累积 3 142 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 29。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 25 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 251
订阅者
-624 小时
+447 天
+3830 天
帖子存档
⚡️ Nvidia и Suno анонсировали модели Parakeet RNNT.
Parakeet превосходит Open AI Whisper и занимает первое место в таблице лидеров Open ASR
Demo: https://huggingface.co/spaces/nvidia/parakeet-rnnt-1.1b
https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
@data_analysis_ml
Как аналитику сделать новый шаг в своей карьере?
Специально для вашего быстрого роста karpovꓸcourses подготовили новогоднее комбо из симуляторов
▪️В Симуляторе аналитика вы получите практику на реальных задачах в формате настоящей рабочей стажировки.
— Вы разберете решения senior-специалистов, получите индивидуальный фидбек на свои решения и сможете пополнить портфолио проектами по BI-аналитике, статистике, A/B-тестам и автоматизации.
▪️В Симуляторе А/В-тестов освоите весь пайплайн проведения А/В-тестов, разберёте тонкости и подводные камни.
— Прохождение Симулятора даст вам уверенность в знаниях A/B-тестирования и поможет на собеседовании или в работе.
Приобретайте комбо до 9 января, а если интересен только один из Симуляторов — используйте скидку 7%
[Забронировать скидку]
🚕 Как Uber вычисляет время прибытия со скоростью полмиллиона запросов в секунду
📌 Читать
@data_analysis_ml
💻 Чтобы расширить возможности вашего терминала за счет автозаполнения кода, подобного IDE, используйте Fig.
Это позволит ускорить рабочий процесс и сократить количество опечаток и ошибок, особенно при работе с длинными или сложными командами.
https://fig.io/
@data_analysis_ml
📊 Facets
Проект Facets предоставляет инструменты визуализации для понимания и анализа наборов данных машинного обучения:
Facets Overview и Facets Dive.
Визуализации реализованы в виде веб-компонентов Polymer и могут быть легко встроены в блокноты Jupyter или веб-страницы.
Прмеры визуализаций можно найти на странице описания проекта Facets: pair-code.github.io/facets/
▪Github
@data_analysis_ml🌟 Что ждет ИИ в 2024 году? В последнем выпуске The Batch на deeplearning.ai, множество ИИ-экспертов рассказывают о своих надеждах и прогнозах на ИИ в наступившем году.
В их обширных статьях рассматриваются новые инструменты ИИ, рассуждения о последующем экспоненциальном росте ИИ и многое другое.
https://deeplearning.ai/the-batch/issue-229/
@data_analysis_ml
💻 Создайте ИИ-клон из своих чатов вWhatsApp
Этот репозиторий поможет вам создать чатбота с ИИ, используя ваши чаты
WhatsApp в качестве обучающих данных.
По умолчанию используется модель Mistral-7B-Instruct-v0.2.
Код в этом репозитории в значительной степени опирается на llama-recipes (https://github.com/facebookresearch/llama-recipes), где вы можете найти больше примеров того, что можно делать с моделями llama.
▪Github
@data_analysis_ml🎓 Бесплатный курс от Weights & Biases: Валидация данных в конвейерах ML.
Научитесь поддерживать качество данных и использовать
TensorFlow Data Validation,получите практический опыт проверки данных для создания надежных конвейеров ML.
https://www.wandb.courses/courses/data-validation-for-machine-learning
@data_analysis_ml🔥 Дайджест полезных материалов из мира Data Science за неделю
Почитать:
— 100 вопросов для подготовки к собесу Data Science
— Сколько ядер CPU можно использовать параллельно в Python?
— PLC Allen Bradley подключение с помощью Python
— Ortools — библиотека для решения задачи VRP
— 4 миллиарда операторов if
— Python без типов: таким он когда-то был
— Вы точно хотите быть Data Scientist-ом?
— Введение в SQL & СУБД на примере доступа к данным через Python
— Plotting and Data Visualization with Matplotlib
— Applications of Data Science
— Semantic Search Over Satellite Images Using Qdrant
— Introduction to Data Science
— A Comprehensive Guide: How Deepchecks Evaluate the Large Language Model
— Appreciating the "Learning Problem" - Why AI will never replace your job
— Best JavaScript Chart Libraries 2024: Finding the Right Fit for Your JS Applications
— NumPy Arrays: An Introduction
— Hungarian GP 2022 Qualifying, and see what we can
— I built Hippotable for in-browser data analysis
Посмотреть:
🌐 100 вопросов с собеседований Data Science — часть 1 (⏱ 36:48)
🌐 💡 Задача: Ряд клавиатуры #Python #yotube #код #алгоритмы #программирование #собеседование #кодинг (⏱ 00:40)
🌐 💡задача #Python: Бинарный поиск #python #программирование #код #yotube #питон #собеседование (⏱ 00:41)
🌐 💡 Задача: Ряд клавиатуры #Python #yotube #код #алгоритмы #программирование #собеседование #кодинг (⏱ 01:00)
🌐 Evaluating Recommendation Algorithms at Delivery Hero - Manchit Madan (⏱ 23:01)
🌐 ODSC Webinar | Open source Data Lake Management, Curation, Governance for New & Growing Companies (⏱ 46:07)
🌐 Stable Diffusion AI: 100 Cats Per Second…For Free! (⏱ 08:21)
Хорошего дня!
@data_analysis_ml
⚡️ OneFormer: Один трансформера для управления универсальной сегментацией изображений.
Модель позволяет решать три разных задачи сегментации:
semantic, instance и panoptic segmentation.
🦒colab: https://github.com/camenduru/OneFormer-colab
🌐page: https://praeclarumjj3.github.io/oneformer
📄paper: https://arxiv.org/abs/2211.06220
🧬code: https://github.com/SHI-Labs/OneFormer
@data_analysis_ml🚀 Window ops
Эта библиотека для анализа данных, которая содержит функции альтернативы
pd.Series.rolling и pd.Series.expanding,которые позволяют получить ускорение за счет использования оптимизированных под numba функций, работающих с массивами numpy.
pip install window-ops
▪Github
▪Документация
@data_analysis_mlХотите начать увлекательный путь в мир машинного обучения и искусственного интеллекта?
Газпромбанк.Тех совместно с Финтех Хабом Банка России запускает прием заявок на программу «Машинное обучение LITE: базовый уровень» — для тех, кто только начинает осваивать машинное обучение.
Что предстоит изучать?
Основы и методы ML, математику, Python и нейронные сети.
Программа состоит из двух модулей:
- Теоретический модуль пройдет с 21 января по 16 февраля 2024 года
- Практический модуль пройдет с 26 февраля по 10 марта 2024 года для тех, кто показал высокие результаты по итогу первого модуля
Чтобы стать участником, подайте заявку на сайте программы до 17 января 2024 года — https://vk.cc/ctBG1D
Реклама Банк ГПБ (АО), ИНН: 7744001497
🖥 Ruptures
Пакет предоставляет методы для анализа и сегментации нестационарных сигналов. Алгоритмы включают точное и приближенное обнаружение для различных параметрических и непараметрических моделей.
С помощью точек изменения можно обнаружить аномалии или отклонения от ожидаемого поведения в данных и получить представление о том, когда происходят эти переходы.
▪Github
▪Документация
@data_analysis_ml
⚡️ Инструменты визуализации графов/сетей
- Geph
- VOSviewer
- Cytoscape
- Kumu
- GraphInsight
- NodeXL
- Orange
- Graphia
- Graphistry
- SocNetV
- Tulip
- Gephisto
🖥 Библиотеки Python
- networkx
- graphviz
- pydot
- python-igraph
- pyvis
- ipycytoscape
- pygsp
- graph-tool
- nxviz
- py2cytoscape
- ipydagred3
- ipysigma
- Py3Plex
- net wulf
@data_analysis_ml
🖥 По сравнению с pandas, Polars предоставляет более продвинутый синтаксис для создания сложных пайплайнов преобразования данных.
Каждая функция в Polars генерирует новую функцию, и эти функции можно объединять в конвейер.
@data_analysis_ml
Тренды киберзла: похищают деньги, контролируют оборудование, нарушают работу
По данным @solar_security «Солара», из-за кибератак компании теряют от 7 млн рублей за раз, а в год — не менее 20 млн рублей. Злоумышленники похищают деньги со счетов компании, берут под контроль сетевое оборудование, компрометируют изолированные сегменты, нарушают работу сайтов и приложений.
Обеспечить реальную защиту от киберзла поможет @solar_security «Солар». Как это сделать, рассказывают наши эксперты на канале. Подпишитесь, чтобы ничего не пропустить.
Реклама. ООО "РТК ИБ". ИНН 7704356648. erid: LjN8Jx2yE
🖥 Реальный вопрос c собеседования Microsoft SQL:
"Какой клиент Azure из базы покупателей, приоьретает хотя бы 1 продукт Azure из каждой категории продуктов?"
❕ Подсказки:
- Объединить таблицы с помощью LEFT JOIN
- Подсчитайть разные категории продуктов с помощью COUNT и DISTINCT.
Доп задание: напишие код с использованием Pandas для решения задачи.
Протестировать свой SQL-запрос и посмотреть таблицы можно здесь: https://datalemur.com/questions/supercloud-customer
Пишите свое решение в комментариях👇
@data_analysis_mlНужно больше золота подарков🎁
Ispmanager решил пуститься во все тяжкие 😱 Мало того, что они для всех пользователей каждый день раздают подарки, так теперь еще и запустили розыгрыш!
Условия просты: подписаться на канал и нажать кнопку "Участвую". А 29 декабря выберут 3-х победителей, которые получат 3 суперприза!
Если пользуешься одной из самых популярных панелей управления для Linix-серверов, и даже, если нет — самое время испытать свою удачу и начать облегчать себе жизнь, автоматизируя рутину и ускоряя работу. Ведь ispmanager работает с сайтами на PHP и Python, создает и настраивает базы данных, DNS, бэкапы, почту, защиту и автоматически перевыпускает любые SSL 😎
Присоединяйтесь к веселью и расскажи друзьям 🎉
Реклама. АО "ИСПМЕНЕДЖЕР". ИНН 3810037036.
SQL: комплексный анализ оттока клиентов
Постановка задачи
В конкурентной телекоммуникационной сфере восприятие компании в целом формируется критической оценкой ее услуг клиентами. Сбои в работе чреваты ростом обеспокоенности, поэтому так важен анализ оттока.
Уровнем оттока характеризуется потеря клиентов, а это сказывается на доходах.
На выводы анализа опираются при разработке стратегий, сегментном таргетировании, совершенствовании обслуживания для роста доверия и удовлетворенности клиентов.
Что такое «отток клиентов»?
Отток, или оборот клиентов, называемый также оттоком покупателей, — это явление, при котором клиенты или подписчики прекращают сотрудничать с компанией или пользоваться ее продуктами/услугами. Оно случается, когда привлеченные ее деятельностью или предложениями клиенты решают отказаться от дальнейших отношений или покупок.
Возможные причины: предложения конкурентов, цена, неудовлетворенность продуктом или услугой, недостаточная их ценность в глазах покупателя, личные обстоятельства.
Очистка данных
Определение общего количества клиентов
SELECT DISTINCT COUNT(CUSTOMER_ID) AS TOTALCUSTOMERS FROM CHURNDATA;
То есть выбираем из churndata отдельный счетчик count(customer_id) по общему числу клиентов TotalCustomers:
📌Продолжение
@data_analysis_mlРазбираем тестовое задание в СБЕР на позицию junior-аналитика
📣 Всем привет! Команда Simulative и наш CEO – Андрон Алексанян приглашаем вас на интенсив, где мы в прямом эфире будем разбирать настоящее тестовое задание на позицию junior-аналитика в компанию СБЕР. Это будет последний обучающий интенсив в этом году.
Нам предстоит проанализировать историю договоров клиентов банка, провести аналитику и сформулировать бизнес-выводы.
📅 Дата: 26 декабря
🕘 Время: 19:00 по Мск
Что будем делать на интенсиве:
➖ Решать задания с помощью SQL
➖ Писать хитрые запросы на SCD, pivot table и другие
➖ Подробно разбирать каждый шаг
➖ Считать retention банка и проводить сегментацию
➖ Проводить аналитику и составлять бизнес-выводы
В прямом эфире мы также расскажем о частых ошибках новичков и поделимся лайфхаками — как достойно пройти собеседование и удивить ревьюера крутыми фишками 🤩
❗️ Записи интенсива не будет. Только один раз и только в live-формате.
А вы готовы бустануть свои знания и скиллы в аналитике?
🔗 Регистрируйтесь на интенсив
Реклама. ООО «АЙТИ РЕЗЮМЕ». ИНН 4025460134. Erid:LjN8KD6DY
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
