Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Network:Frontender's notes [ru]Russia33 739 Technologies & Applications6 738...

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 20 041 subscribers, ranking 6 738 in the Technologies & Applications category and 33 739 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 20 041 subscribers.

According to the latest data from 14 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -87 over the last 30 days and by -13 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 7.71%. Within the first 24 hours after publication, content typically collects 4.62% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 546 views. Within the first day, a publication typically gains 926 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 7.
Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Thanks to the high frequency of updates (latest data received on 15 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

20 041

Subscribers

-1324 hours

+257 days

-8730 days

1 546

Post views

~ 92624 hours

~ 1 11548 hours

7.71%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

20 041

🔥 Самые интересные статьи за последние дни: • Всё, что вы хотели знать о Django Channels • Сборка Python проекта с uv и Docker • DE-1. DIY ассистент на LLM • Ваши генераторные выражения сломаны: чиним и разбираемся • Всё, что вы хотели знать о Django Channels

20 041

👩‍💻 Построй визуализацию распределения признаков с автоматической категоризацией Создайте функцию plot_distributions, которая принимает DataFrame и автоматически определяет числовые и категориальные признаки. Затем строит гистограммы или bar-графики в зависимости от типа данных. Это удобно для EDA (исследовательского анализа данных). Решение задачи🔽

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns def plot_distributions(df, max_categories=10): for column in df.columns: plt.figure(figsize=(6, 4)) if pd.api.types.is_numeric_dtype(df[column]): sns.histplot(df[column].dropna(), kde=True) plt.title(f'Гистограмма: {column}') elif df[column].nunique() <= max_categories: df[column].value_counts().plot(kind='bar') plt.title(f'Категории: {column}') else: print(f'Пропущен {column}: слишком много уникальных категорий') continue plt.tight_layout() plt.show() # Пример использования df = pd.DataFrame({ 'age': [23, 45, 31, 35, 62, 44, 23], 'gender': ['male', 'female', 'female', 'male', 'male', 'female', 'female'], 'income': [40000, 50000, 45000, 52000, 61000, 48000, 46000] }) plot_distributions(df)

20 041

⚙️ Как мы создаём Visionatrix: упрощая ComfyUI В этой статье мы расскажем о нашем опыте работы с ComfyUI и разработке Visionatrix — надстройки, которая упрощает генерацию медиа. Мы обсудим ключевые проблемы, с которыми сталкиваются пользователи, наш подход к их решению, а также вкратце поделимся тем, как мы использовали ChatGPT и Claude для ускорения разработки в условиях ограниченного времени. Читать...

20 041

🤖 Как бизнес зарабатывает на ИИ в апреле 2025 • Artisan привлекла $25 млн для развития ИИ-агентов, автоматизирующих задачи в продажах и CRM. Первый агент Ava уже заменяет BDR в компаниях среднего звена . • Малый бизнес в Великобритании увеличивает продуктивность на 27–133% благодаря ИИ-инструментам для управления персоналом и запасами . • Microsoft Dynamics 365 внедряет цифровых двойников и генеративный ИИ для оптимизации цепочек поставок и логистики в производстве . • Google Workspace представляет агентные ИИ-инструменты для автоматизации рабочих процессов и повышения эффективности бизнеса . • OpenAI объявила о прекращении поддержки GPT-4.5 и рекомендует переход на более экономичный GPT-4.1 к июлю 2025 года . 📁 В этой папке: https://t.me/addlist/iVhUYbQyw-0yYThi — проверенные ИИ-инструменты — способы монетизации для ИИ- и IT-специалистов — тренды на 2025 год: что работает, а что устарело https://t.me/addlist/iVhUYbQyw-0yYThi 💬 Хочешь попасть в следующую подборку? Напиши: @RyabovaM

20 041

🔎 Подборка зарубежных вакансий Senior Data Analyst 🟢Python, SQL, Amplitude, Firebase, аналитические платформы, маркетинговые метрики 🟢до 3 000 $ | 3–6 лет Senior Data Engineer 🟢Python, SQL, Apache Airflow, Exasol, ClickHouse, StarRocks, Snowflake, BigQuery, Redshift, ETL/ELT, S3, Docker, Kubernetes 🟢Уровень дохода не указан | более 6 лет Team Lead Data Scientist 🟢Python, RecSys, Uplift modeling, Churn prediction, LTV prediction, Forecasting, MLOps, CI/CD 🟢от 5 000 до 7 250 $ | более 6 лет

20 041

🌌 Делай мини-проекты из собственных болей Бесит, что каждый день ищешь одну и ту же команду в истории? Или вручную обрезаешь скриншоты? Это подсказки. 👉 Совет: собирай такие мелкие «боли» и превращай их в свои pet-проекты или утилиты. Это не только помогает себе, но и тренирует навык быстрого решения задач и проектирования под реальную жизнь.

20 041

👩‍💻 Под капотом asyncio: принципы работы и ключевые концепции Библиотека asyncio предоставляет полный набор инструментов для организации параллельного выполнения кода в Python с использованием концепции асинхронности. Но как на самом деле работает asyncio? Давайте разберемся в ключевых принципах и понятиях. Читать...

20 041

Зачем платить за ресурсы, которые вы не используете? 👨‍💻 На вебинаре 22 апреля провайдер Cloud․ru расскажет про новый сервис Evolution ML Inference для быстрого запуска ML-моделей в облаке. Вы узнаете: 😶‍🌫️почему технология Shared GPU выгоднее выделенных ресурсов: расчет экономии на примере реальных проектов; 😶‍🌫️как запускать модели с Hugging Face за несколько кликов; 😶‍🌫️как избежать переплат: настройка лимитов GPU и мониторинг real-time; 😶‍🌫️про динамическое масштабирование: добавление ресурсов при пиковой нагрузке и отключение в простое. Будет особенно интересно дата-сайентистам, DevOps-инженерам и тем, кто планирует запускать свои ML-модели. Зарегистрироваться на вебинар 🧠

20 041

⚙️ Как обучить русскоязычную модель рассуждений — LRM? В статье разбор мультиязычных моделей рассуждений от Lightblue: как они научили DeepSeek "думать" на русском, откуда взяли датасет и зачем запускали LLM как фильтр рассудительности. Читать...

20 041

Премиальный квартал PRIDE: 1/5 квартиры в подарок Всего 15 минут от Цветного бульвара – и вы у себя дома. В семейном квартале PRIDE вас ждет идеальная среда для жизни: - Выбирайте свой стиль — 2 варианта дизайнерской отделки. - Простор и свет в каждом метре — панорамные окна и большие террасы. - Свой оазис — сад ароматов, пешеходный бульвар и приватные дворы для игр, отдыха и спорта. - Лобби как в 5*отеле от бюро Sundukovy Sisters. - Всё для счастья детей — собственный детский сад и школа. - Клубная инфраструктура - спортзал со спа, переговорная, коворкинг, детская и лаунж зоны. ⚡До 30.04 на выделенный пул квартир действуют специальные условия с выгодой до 12 млн рублей. Узнать больше Проектная декларация на сайте https://наш.дом.рф/. Застройщик: ООО "СЗ "ЛАЙФ САВЕЛОВСКАЯ" #реклама pride-home.ru О рекламодателе

20 041

⚙️ Что такое StandardScaler из scikit-learn и зачем он нужен? StandardScaler — это инструмент из библиотеки scikit-learn, который стандартизирует данные: приводит их к распределению со средним 0 и стандартным отклонением 1. Это важно перед обучением моделей, особенно для алгоритмов, чувствительных к масштабу (например, SVM, KNN, линейная регрессия). ➡️ Пример:

from sklearn.preprocessing import StandardScaler
import numpy as np

X = np.array([[10, 200], [15, 300], [14, 250]])

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

print(X_scaled)

➡️ После трансформации признаки будут нормализованы, что помогает улучшить сходимость и стабильность модели.

🗣️ StandardScaler — must-have шаг в пайплайне предварительной обработки данных для большинства классических ML-моделей

🖥 Подробнее тут

20 041

⚙️ Архитектура проекта автоматического обучения ML-моделей В статье ребята из Ингосстраха делятся, как автоматизировали запуск и внедрение моделей, чтобы быстрее закрывать запросы бизнеса, не утонув в бэклоге. Читать...

20 041

🚀 Data Engineer в Navio: получи оффер в компанию за 1 день! В команду BigData мы ищем специалистов уровней middle и senior, готовых решать нестандартные задачи и создавать проекты, которые меняют мир. Наши данные имеют физический смысл: победа над каждой ошибкой здесь — снижение риска ДТП в реальном мире. С нами ты будешь: собирать датасеты для нейросетей, обрабатывать данные для работы автономных машин, визуализировать 4D-траектории, строить системы для сквозной аналитики и не только. Готов проявить свои навыки? Заполняй заявку, оставляй резюме на сайте и получи приглашение от нашего рекрутера на One Day Offer 26 апреля. Приходи на онлайн-мероприятие, пообщайся с командой и, возможно, уже вечером ты станешь ее частью. ⚡️ One Day Offer — твой шанс изменить карьеру!

20 041

⚙️ Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта (ИИ). Читать...

20 041

📈 Подборка статей для вашей карьеры • Как продакт-менеджеру учить английский: план, сроки, советы • Иллюзия прогресса: почему мне не удалось дать студентам-айтишникам реальный опыт • Interview copilots: как кандидаты используют ChatGPT на интервью • Моя история входа в IT: как я ломал стены своих ограничений • Как мы разработали систему грейдинга для системных аналитиков

20 041

⚙️ Анализ данных: от EDA до Tinder-битвы графиков Расскажу, как мы в МТС учили студентов EDA не лекциями, а игрой по типу Tinder, только для графиков. Был фан, был хардкор и крутые визуализации. Читать...

20 041

⚙️ Рекомендательная система для вашего каталога научных работ (и не только!) Показано, как собрать рекомендательную систему на своём архиве документов, даже если там куча форматов. NLP + графы = машинный архивариус, который сам подсовывает нужные файлы. Читать...

20 041

👩‍💻 Постройте простую модель классификации с использованием scikit-learn Создайте модель на датасете Iris, обучите классификатор KNeighborsClassifier и сделайте предсказание. Это классическая задача для первых шагов в машинном обучении. Решение задачи🔽

from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score # Загружаем данные iris = load_iris() X, y = iris.data, iris.target # Делим на обучающую и тестовую выборки X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # Обучаем модель model = KNeighborsClassifier(n_neighbors=3) model.fit(X_train, y_train) # Предсказание y_pred = model.predict(X_test) # Оценка качества print(f"Точность: {accuracy_score(y_test, y_pred):.2f}")

20 041

🤖 Машинный перевод seq2seq: и как обучить модель понимать языки 🗓 21 апреля в 20:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing». На данном открытом уроке мы: ✔️Познакомимся с архитектурой seq2seq и ее применением в задачах машинного перевода ✔️Разберем архитектуру энкодер-декодер, её основные компоненты и как она используется для перевода текста. ✔️Изучим концепцию attention mechanism и его влияние на повышение качества машинного перевода. Данный вебинар будет особенно интересен: -Дата-сайентистам и аналитикам данных, которые хотят углубиться в задачи обработки естественного языка. -Специалистам по машинному обучению, заинтересованным в работе с текстовыми данными и моделями перевода. -Всем, кто изучает современные технологии искусственного интеллекта и их применение в реальных задачах. В результате вебинара слушатели: -Узнают, как работает архитектура seq2seq и как она решает задачи машинного перевода. -Поймут, как attention mechanism улучшает качество перевода и как его можно применить в своих проектах. 🔗 Ссылка на регистрацию: https://vk.cc/cKRM5a Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqv5X5vi

20 041

🔎 Подборка вакансий для мидлов Data Scientist (Middle) 🟢Python, SQL, Pandas, NumPy, Matplotlib 🟢Уровень дохода не указан | 3–6 лет Инженер данных / Data engineer (middle) 🟢Scala, Python, SQL, Apache Spark, Hadoop, NiFi 🟢Уровень дохода не указан | 1–3 года Аналитик данных/Data Analyst 🟢SQL (ClickHouse, Postgres, MS SQL), Python, Jupyter, Git, BI-системы (Datalens) 🟢от 200 000 до 300 000 ₽ | 1–3 года