Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 250 名订阅者,在 技术与应用 类别中位列第 2 653,并在 俄罗斯 地区排名第 12 492 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 250 名订阅者。
根据 24 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 38,过去 24 小时变化为 -6,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 9.10%。内容发布后 24 小时内通常能获得 6.25% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 571 次浏览,首日通常累积 3 142 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 29。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 25 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 250
订阅者
-624 小时
+447 天
+3830 天
帖子存档
🔥 Дайджест полезных материалов из мира : Data Science за неделю
Почитать:
— Руководство по масштабированию MLOps
— Data больше не Big: как данные перестали быть большими и почему это полезно для бизнеса
— Что нового в Pandas 2.1
— Готовые скрипты Python
— Data Vendor Lock-In and Web3
— Mastering Data Preparation for Your Dream Data Job: Using Job Postings Data
— Matplotlib Tutorial #7: Plot Color Customization
— 10 NoSQL databases available as alternatives to MongoDB
— Data Science in Human Resources: Talent Acquisition and Retention
— Explain the Central Limit Theorem in Data Science with Python?
— Ultimate Guide: Best Books for Data Science with Ratings for All Levels
— Professional literature as a way to improve your analytics skills
— Top 10 Online Courses to Learn ChatGPT in 2023
— Matplotlib Tutorial #6: Plot Line Customization
Посмотреть:
🌐 Streamlit LLM Hackathon (⏱ 03:27)
🌐 Полный курс по библиотеке Numpy. Матрицы (⏱ 11:24)
🌐 Python+SQL работа с базами данных. (⏱ 11:10)
🌐 Полный курс по библиотеке Numpy. Полезные функции (⏱ 11:05)
🌐 Полный курс по библиотеке Numpy. Применение Numpy (⏱ 11:52)
🌐 Полный курс по библиотеке Numpy. Создание матриц из файла (⏱ 15:55)
🌐 Python Атоматизация отправки email с selenium (⏱ 04:59)
🌐 Полный курс по библиотеке Numpy. Продвинутые методы работы с матрицами (⏱ 07:28)
🌐 Python анализ данных с Pandas. (⏱ 17:04)
🌐 Lightning Interview “Beyond the Code: How AI Is Disrupting the Programmer's Role” (⏱ 58:40)
🌐 Уроки Golang с нуля /#26 - Обработка ошибок (⏱ 08:14)
🌐 Introduction to Generative Art with Stable Diffusion, presented by HP Inc - Hunter Kempf (⏱ 43:48)
🌐 Emerging Approaches to AI Governance: Tech-Led vs Policy-Led - Ilana Golbin (⏱ 44:36)
🌐 Wow, NVIDIA’s Rendering, But 10X Faster! (⏱ 06:58)
Хорошего дня!
🗺Leafmap - Python пакет для создания интерактивных карт для геопространственного анализа. Эта библиотека доступна в среде
Jupyter, Google Colab, Jupyter Notebook и JupyterLab, и позволяет анализировать и визуализировать геоданные без особого труда.
Leafmap теперь поддерживает загрузку и визуализацию данных из Google Solar API, включая аэроснимки, маску зданий, цифровую модель поверхности, годовой/месячный/часовой солнечный поток 🛰️☀️.
▪Github
▪Documentation
▪Лекции по работе с Leafmap
@data_analysis_mlRepost from Центр непрерывного образования ФКН НИУ ВШЭ
👩💻Как выглядит карьера специалиста по Data Science: где и чему учиться, какие soft skills нужно освоить и как не выгореть в профессии?
В новом выпуске «Уютного ФКНчика» обсуждаем, как попасть в анализ данных и куда двигаться.
⏺️Ведущий: Евгений Соколов, научный руководитель Центра непрерывного образования ФКН
Гости:
⏺Ян Пиле, руководитель группы аналитики VK и преподаватель Центра непрерывного образования ФКН НИУ ВШЭ
⏺Алексей Борисенко, инженер-разработчик по интерпретации данных в Schlumberger и выпускник программы профессиональной переподготовки «Специалист по Data Science» Центра непрерывного образования ФКН НИУ ВШЭ
Подкаст организован Центром непрерывного образования ФКН.
👩💻Как выглядит карьера специалиста по Data Science: где и чему учиться, какие soft skills нужно освоить и как не выгореть в профессии?
В новом выпуске «Уютного ФКНчика» обсуждаем, как попасть в анализ данных и куда двигаться.
⏺️Ведущий: Евгений Соколов, научный руководитель Центра непрерывного образования ФКН
Гости:
⏺Ян Пиле, руководитель группы аналитики VK и преподаватель Центра непрерывного образования ФКН НИУ ВШЭ
⏺Алексей Борисенко, инженер-разработчик по интерпретации данных в Schlumberger и выпускник программы профессиональной переподготовки «Специалист по Data Science» Центра непрерывного образования ФКН НИУ ВШЭ
Подкаст организован Центром непрерывного образования ФКН.
🖥 Полный курс по библиотеке Numpy. Урок 5: Продвинутые функции.
▪Видео
▪Код из видео
▪Часть 1
▪Часть 2
▪Часть 3
▪Часть4
@data_analysis_ml
9 сентября Сбер приглашает IT-специалистов поучаствовать в отборе: пройти все интервью, познакомиться с командой и, возможно, даже получить оффер.
Какими задачами занимаются DS-специалисты крупнейшего банка страны? 👇
✔️ Обучают все модели искусственного интеллекта: от классического ML до глубоких нейронных сетей.
✔️ Создают инновационные сервисы от систем принятия решений до компьютерного зрения и обработки естественного языка
✔️ Развивают блочное хранилище на Teradata и DataLake на Hadoop.
✔️ Работают на Python, Spark, SQL, Hadoop, GreenPlum.
За год команда разрабатывает и внедряет более 200 моделей для отделений банка, приложений, колл-центра, банкоматов и так далее, поэтому работа точно будет интересной и разнообразной.
Переходите по ссылке и регистрируйся на One Day Offer, чтобы получить оффер мечты! 💚
👆 Принципы SOLID в инженерии данных. Часть 1.
SOLID — это набор основных принципов процесса разработки ПО, направленных на упрощение чтения, тестирования и сопровождения кода.
Как расшифровывается SOLID
Акроним SOLID расшифровывается так:
• Single responsibility principle («Принцип единственной ответственности»).
• Open/close principle («Принцип открытости/закрытости»).
• Liskov substitution principle («Принцип подстановки Лисков»).
• Interface segregation principle («Принцип разделения интерфейса»).
• Dependency inversion principle («Принцип инверсии зависимостей).
1. Принцип единственной ответственности
Согласно этому принципу, класс должен меняться только по одной причине. То есть у каждого модуля должно быть только одно назначение, отчего код становится удобнее для восприятия и тестирования.
Примеры
Продемонстрируем нарушение и соблюдение принципа единственной ответственности, создав простой класс для банковского счета:
а) нарушение принципа:
class BankAccount:
def __init__(self, account_number: int, balance: float):
self.account_number = account_number
self.balance = balance
def deposit_money(self, amount: float):
self.balance += amount
def withdraw_money(self, amount: float):
if amount > self.balance:
raise ValueError("Unfortunately your balance is insufficient for any withdrawals right now ... ")
self.balance -= amount
def print_balance(self):
print(f'Account no: {self.account_number}, Balance: {self.balance} ')
def change_account_number(self, new_account_number: int):
self.account_number = new_account_number
print(f'Your account number has changed to "{self.account_number}" ')
Принцип нарушается, поскольку классом BankAccount контролируется больше одной задачи, связанной с банковскими счетами: управление профилями счетов и управление денежными средствами.
б) соблюдение принципа:
А вот пример соблюдения принципа:
class DepositManager:
def deposit_money(self, account, amount):
account.balance += amount
class WithdrawalManager:
def withdraw_money(self, account, amount):
if amount > account.balance:
raise ValueError("Unfortunately your balance is insufficient for any withdrawals right now ... ")
account.balance -= amount
class BalancePrinter:
def print_balance(self, account):
print(f'Account no: {account.account_number}, Balance: {account.balance} ')
class AccountNumberManager:
def change_account_number(self, account, new_account_number):
account.account_number = new_account_number
print(f'Your account number has changed to "{account.account_number}" ')
class BankAccount:
def __init__(self, account_number: int, balance: float):
self.account_number = account_number
self.balance = balance
self.deposit_manager = DepositManager()
self.withdrawal_manager = WithdrawalManager()
self.balance_printer = BalancePrinter()
self.account_number_manager = AccountNumberManager()
def deposit_money(self, amount: float):
self.deposit_manager.deposit_money(self, amount)
def withdraw_money(self, amount: float):
self.withdrawal_manager.withdraw_money(self, amount)
def print_balance(self):
self.balance_printer.print_balance(self)
def change_account_number(self, new_account_number: int):
self.account_number_manager.change_account_number(self, new_account_number)
Задачи, связанные с управлением банковским счетом, мы разделили на отдельные классы, упростив в случае необходимости изменение классов одинакового назначения.
в) пример расширения кодовой базы:
🔘 Продолжение части 1.
🔘 Часть 2.Анализ данных и машинное обучение в облаке
Если вам не хватает мощностей собственного компьютера для разработки модели машинного обучения, у вас краткосрочный проект, для которого нецелесообразно покупать мощные видеокарты, или вы хотели бы собрать небольшую платформу обработки данных, используйте Data Analytics Virtual Machine.
В чем преимущества Data Analytics Virtual Machine в @Selectel:
◽Это виртуальные серверы с предустановленным набором инструментов для анализа данных, BI и машинного обучения. Решение подойдет для небольших команд и стартапов и поможет с хранением, обработкой, анализом и визуализацией данных.
◽Вам не придется тратить время на установку драйверов для видеокарты, Python и библиотек для работы с ML. Все компоненты предустановлены, сервер разворачиватся из образа и сразу готов к работе.
◽ Отсутствие vendor lock-in. Решение построено на базе Open Source инструментов: Jupyter, Prefect, Apache Superset. Вы платите только ресурсы облака по модели pay-as-you-go.
Арендовать готовый сервер и узнать больше о решении можно по ссылке: https://slc.tl/f63rg
Реклама ООО «Селектел» 2VtzqwjSSDE
🖥 Полный курс по библиотеке Numpy. Урок 4: Создание матриц из файла.
▪Видео
▪Код из видео
▪Часть 1
▪Часть 2
▪Часть 3
@data_analysis_ml
💪 Data Scientist нужны бизнесу
Время стать востребованным специалистом — в этом поможет курс от Слёрм ✨
В руках Data Scientist находится будущее. Он может рассказать бизнесу:
✔️Когда произойдет отток клиентов
🕒 Как будет загружен персонал в ближайшее время
👥 На какие сегменты можно разделить аудиторию
❓ Что будет делать покупатель в магазине
И многое другое.
И специалисту для этих ответов не требуется хрустальный шар и умение видеть будущее. Достаточно знаний, которые Слёрм дает на курсе «Data Scientist».
Подробная программа и эксперты уже на сайте — можете посмотреть по ссылке ⚡️
На курсе вам дадут полноценное представление о профессии и практику с рабочими инструментами — комплект знаний и умений, с которым можно пойти работать junior Data Scientist.
Реклама. ООО «Слёрм» г. Лиски, ОГРН 1193668020545
🦅 Falcon 180B is here!
Falcon 180B устанавливает новый уровень для открытых моделей. Это самая большая открытая языковая модель со 180 миллиардами параметров, которая была обучена на огромном массиве данных TII RefinedWeb, насчитывающем 3,5 триллиона лексем. Это самый продолжительный период предварительного обучения открытой модели на одной эпохе.
По своим возможностям Falcon 180B достигает самых высоких результатов в задачах на естественном языке. Он занимает первое место в рейтинге предварительно обученных моделей открытого доступа и конкурирует с собственными моделями, такими как PaLM-2.
🤗 HF: https://huggingface.co/blog/falcon-180b
🖥 Github: https://github.com/huggingface/blog/blob/main/falcon-180b.md
📕 Demo: https://huggingface.co/spaces/tiiuae/falcon-180b-demo
@data_analysis_m
🖥 Полный курс по библиотеке Numpy. Урок 3: применение Numpy
▪Видео
▪Код из видео
▪Часть 1
▪Часть 2
▪Упражнения
@data_analysis_m
Станьте дипломированным экспертом по Data Science и развитию искусственного интеллекта
Первый университет Сибири – ТГУ запускает первую онлайн-магистратуру в России по программе «Анализ естественного языка (NLP) в лингвистике и IT».
На программе вы:
●Будете обучать нейросети, учить машины распознавать и анализировать человеческую речь и генерировать ответы;
●Узнаете как устроены виртуальные ассистенты, генеративные и нейронные сети (например, ChatGPT, Siri, Олег из Тинькофф);
●Получите доступ к суперкомпьютерному центру CYBERIA от ТГУ, с помощью которого вы сможете обучать нейросети и решать задачи NLP Data Science в режиме онлайн;
●Освоите инструменты: написание кода на Python, Data Mining, Feature Engineering;
●Получите знания от академического руководителя – тимлида направления Data Science в Сбере.
– Обучение очное, но в онлайн-режиме
- Студенческие льготы и отсрочка от армии
– Обучение с нуля, технический "бэкграунд" не обязателен
– Очный диплом ТГУ и готовое портфолио для дальнейшего трудоустройства.
Необходим любой диплом первого высшего образования!
А благодаря господдержке первый год обучения стоит всего от 280 р/мес!
Успейте записаться на бесплатный подготовительный курс: https://go.skillfactory.ru/nV2f3w
Прием документов до 13 сентября!
Реклама - ООО «Скиллфэктори»
Kra23UuFT
Овладейте основными навыками работы с искусственным интеллектом с помощью этих 10 бесплатных курсов:
1. Google - искусственный интеллект для всех
https://edx.org/learn/artificial-intelligence/google-google-ai-for-anyone
2. Microsoft - ИИ для начинающих
https://microsoft.github.io/AI-For-Beginners
3. IBM - AI for Everyone: Освоить основы
https://edx.org/learn/artificial-intelligence/ibm-ai-for-everyone-master-the-basics
4. Гарвард - Введение в искусственный интеллект с помощью Python
https://cs50.harvard.edu/ai/2023
5. Google - Введение в генеративный ИИ
https://cloudskillsboost.google/journeys/118
6. Deep Learning - Finetuning Large Language Models
https://deeplearning.ai/short-courses/finetuning-large-language-models/
7. Microsoft - Основы ИИ в Azure
https://learn.microsoft.com/en-us/training/paths/create-no-code-predictive-models-azure-machine-learning/
8. Linux Foundation - Основы работы с данными и искусственным интеллектом
https://edx.org/learn/computer-programming/the-linux-foundation-data-and-ai-fundamentals
9. Alison - 13 бесплатных курсов по ИИ
https://alison.com/tag/artificial-intelligence
10. Проекты по искусственному интеллекту
https://mygreatlearning.com/academy/learn-for-free/courses/artificial-intelligence-projects
@data_analysis_m
О нейросетях в кредитном скоринге на реальных примерах
Поговорить о применении нейросеток в деятельности кредитных организаций так, чтобы было не скучно, решили эксперты из управления моделирования КИБ и СМБ ВТБ, лаборатории машинного обучения Альфа-Банка и центра компетенций Data Science МТС. В новом эпизоде подкаста «Деньги любят техно» они обратились к ML с новой стороны и поделились собственным опытом его внедрения в больших проектах. Заодно дали много практических советов и рекомендаций.
Послушать:
https://podcast.ru/e/dTYEDjzyYj
🖥 Полный курс по библиотеке Numpy. Урок 2 Полезные функции.
▪Видео
▪Часть 1
▪Упражнения
@data_analysis_m
🔥История LLM с открытым исходным кодом: Ранние разработки (часть первая)
Понимание принципов работы GPT-Neo, GPT-J, GLM, OPT, BLOOM и других.
https://cameronrwolfe.substack.com/p/the-history-of-open-source-llms-early
@data_analysis_ml
🖥 Полный курс по библиотеке Numpy. Урок 1 Матрицы.
▪Видео
▪Код из видео
▪Упражнения по Numpy
@data_analysis_ml
🔥 Дайджест полезных материалов из мира : Data Science за неделю
Почитать:
— Таблица-справочник – генератор DAG? А что так можно было?
— Как создать привлекательные графики с рейтингами стран с помощью Python и Matplotlib
— Как полностью устранить дублирующие записи в ClickHouse
— Как подружить Spark и S3 для обработки файлов
— Первые шаги в ML на обучающем хакатоне: обнаружение птиц на фотографиях yolov8s + sahi
— Просто о Deep #1
— How AI models are transforming evidence-based predictions
— Auto-Synchronizing an Entire MySQL Database for Data Analysis
— "Which job sectors are witnessing a surge in demand for AI and Data Science professionals?"
— NumPy Tutorial #14: Random
— 5 Completely FREE Data Analytics Online Courses
— Innovative Smart Surfaces: Walls That Can Generate Energy and Data
— Python Cheat Sheet for Data Engineers and Data Scientists!
— Harnessing the Power of Accountability Buddies for Learning
— NumPy Tutorial #13: Array Filtering
— Exploring Connections: How Meeting People Enriched My Master's Journey
Посмотреть:
🌐 How to Use the Open-Source Hugging Chat API in Python (⏱ 07:38)
🌐 Продвинутый парсинг на Python со сменой прокси (⏱ 10:27)
🌐 Уроки Golang с нуля /#25 - Интерфейсы (⏱ 10:51)
🌐 Многопоточный парсер на Python. ООП подход (⏱ 08:24)
🌐 AI in a Minefield: Learning from Poisoned Data - Johnathan Roy Azaria (⏱ 37:07)
🌐 Orchestrating Data Assets instead of Tasks, with Dagster - Sandy Ryza (⏱ 31:06)
🌐 1,000,000,000 Parameter Super Resolution AI! (⏱ 04:59)
🌐 DeepMind-Like Gaming AI: Incredible Driving Skills! (⏱ 05:09)
Хороших выходных!
@data_analysis_ml
🖥 Бесплатные сертификационные курсы по изучению Git и GitHub в 2023 году
❯ Введение в управление версиями с помощью Git
https://learn.microsoft.com/en-us/training/paths/intro-to-vc-git
❯ Курс GitHub от Microsoft
https://learn.microsoft.com/en-us/training/github
❯ Начало работы с GitHub
https://udemy.com/course/git-started-with-github
❯ 5-дневное испытание The Ultimate GIT
https://udemy.com/course/the-ultimate-git-5-day-challenge
❯ Контроль версий с помощью Git от Atlassian
https://coursera.org/learn/version-control-with-git
❯ Интерактивное руководство по Git
https://learngitbranching.js.org
❯ Основы командной строки: Git Bash для Windows
https://udemy.com/course/git-bash
❯ Изучение Git с помощью Bitbucket Cloud
https://hackernoon.com/top-5-free-courses-to-learn-git-and-github-best-of-lot-2f394c6533b0
❯ Изучайте Git: Все, что нужно знать
https://udemy.com/course/learngit
@data_analysis_ml
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
