Data Science | Machinelearning [ru]

Открыть в Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Больше

Сеть:Frontender's notes [ru]Россия33 739 Технологии и приложения6 738...

📈 Аналитический обзор Telegram-канала Data Science | Machinelearning [ru]

Канал Data Science | Machinelearning [ru] (@devsp) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 20 041 подписчиков, занимая 6 738 место в категории Технологии и приложения и 33 739 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 20 041 подписчиков.

Согласно последним данным от 14 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -87, а за последние 24 часа — -13, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.71%. В первые 24 часа после публикации контент обычно набирает 4.62% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 1 546 просмотров. В течение первых суток публикация набирает 926 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 7.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, nvidia, контекст, openai, архитектура.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Благодаря высокой частоте обновлений (последние данные получены 15 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

20 041

Подписчики

-1324 часа

+257 дней

-8730 день

1 546

Просмотры поста

~ 92624 часа

~ 1 11548 часов

7.71%

Коэффициент вовлеченности

~ 1

Постов в день

Ads index

beta

Архив постов

20 041

🔥 Самые интересные статьи за последние дни: • Всё, что вы хотели знать о Django Channels • Сборка Python проекта с uv и Docker • DE-1. DIY ассистент на LLM • Ваши генераторные выражения сломаны: чиним и разбираемся • Всё, что вы хотели знать о Django Channels

20 041

👩‍💻 Построй визуализацию распределения признаков с автоматической категоризацией Создайте функцию plot_distributions, которая принимает DataFrame и автоматически определяет числовые и категориальные признаки. Затем строит гистограммы или bar-графики в зависимости от типа данных. Это удобно для EDA (исследовательского анализа данных). Решение задачи🔽

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns def plot_distributions(df, max_categories=10): for column in df.columns: plt.figure(figsize=(6, 4)) if pd.api.types.is_numeric_dtype(df[column]): sns.histplot(df[column].dropna(), kde=True) plt.title(f'Гистограмма: {column}') elif df[column].nunique() <= max_categories: df[column].value_counts().plot(kind='bar') plt.title(f'Категории: {column}') else: print(f'Пропущен {column}: слишком много уникальных категорий') continue plt.tight_layout() plt.show() # Пример использования df = pd.DataFrame({ 'age': [23, 45, 31, 35, 62, 44, 23], 'gender': ['male', 'female', 'female', 'male', 'male', 'female', 'female'], 'income': [40000, 50000, 45000, 52000, 61000, 48000, 46000] }) plot_distributions(df)

20 041

⚙️ Как мы создаём Visionatrix: упрощая ComfyUI В этой статье мы расскажем о нашем опыте работы с ComfyUI и разработке Visionatrix — надстройки, которая упрощает генерацию медиа. Мы обсудим ключевые проблемы, с которыми сталкиваются пользователи, наш подход к их решению, а также вкратце поделимся тем, как мы использовали ChatGPT и Claude для ускорения разработки в условиях ограниченного времени. Читать...

20 041

🤖 Как бизнес зарабатывает на ИИ в апреле 2025 • Artisan привлекла $25 млн для развития ИИ-агентов, автоматизирующих задачи в продажах и CRM. Первый агент Ava уже заменяет BDR в компаниях среднего звена . • Малый бизнес в Великобритании увеличивает продуктивность на 27–133% благодаря ИИ-инструментам для управления персоналом и запасами . • Microsoft Dynamics 365 внедряет цифровых двойников и генеративный ИИ для оптимизации цепочек поставок и логистики в производстве . • Google Workspace представляет агентные ИИ-инструменты для автоматизации рабочих процессов и повышения эффективности бизнеса . • OpenAI объявила о прекращении поддержки GPT-4.5 и рекомендует переход на более экономичный GPT-4.1 к июлю 2025 года . 📁 В этой папке: https://t.me/addlist/iVhUYbQyw-0yYThi — проверенные ИИ-инструменты — способы монетизации для ИИ- и IT-специалистов — тренды на 2025 год: что работает, а что устарело https://t.me/addlist/iVhUYbQyw-0yYThi 💬 Хочешь попасть в следующую подборку? Напиши: @RyabovaM

20 041

🔎 Подборка зарубежных вакансий Senior Data Analyst 🟢Python, SQL, Amplitude, Firebase, аналитические платформы, маркетинговые метрики 🟢до 3 000 $ | 3–6 лет Senior Data Engineer 🟢Python, SQL, Apache Airflow, Exasol, ClickHouse, StarRocks, Snowflake, BigQuery, Redshift, ETL/ELT, S3, Docker, Kubernetes 🟢Уровень дохода не указан | более 6 лет Team Lead Data Scientist 🟢Python, RecSys, Uplift modeling, Churn prediction, LTV prediction, Forecasting, MLOps, CI/CD 🟢от 5 000 до 7 250 $ | более 6 лет

20 041

🌌 Делай мини-проекты из собственных болей Бесит, что каждый день ищешь одну и ту же команду в истории? Или вручную обрезаешь скриншоты? Это подсказки. 👉 Совет: собирай такие мелкие «боли» и превращай их в свои pet-проекты или утилиты. Это не только помогает себе, но и тренирует навык быстрого решения задач и проектирования под реальную жизнь.

20 041

👩‍💻 Под капотом asyncio: принципы работы и ключевые концепции Библиотека asyncio предоставляет полный набор инструментов для организации параллельного выполнения кода в Python с использованием концепции асинхронности. Но как на самом деле работает asyncio? Давайте разберемся в ключевых принципах и понятиях. Читать...

20 041

Зачем платить за ресурсы, которые вы не используете? 👨‍💻 На вебинаре 22 апреля провайдер Cloud․ru расскажет про новый сервис Evolution ML Inference для быстрого запуска ML-моделей в облаке. Вы узнаете: 😶‍🌫️почему технология Shared GPU выгоднее выделенных ресурсов: расчет экономии на примере реальных проектов; 😶‍🌫️как запускать модели с Hugging Face за несколько кликов; 😶‍🌫️как избежать переплат: настройка лимитов GPU и мониторинг real-time; 😶‍🌫️про динамическое масштабирование: добавление ресурсов при пиковой нагрузке и отключение в простое. Будет особенно интересно дата-сайентистам, DevOps-инженерам и тем, кто планирует запускать свои ML-модели. Зарегистрироваться на вебинар 🧠

20 041

⚙️ Как обучить русскоязычную модель рассуждений — LRM? В статье разбор мультиязычных моделей рассуждений от Lightblue: как они научили DeepSeek "думать" на русском, откуда взяли датасет и зачем запускали LLM как фильтр рассудительности. Читать...

20 041

Премиальный квартал PRIDE: 1/5 квартиры в подарок Всего 15 минут от Цветного бульвара – и вы у себя дома. В семейном квартале PRIDE вас ждет идеальная среда для жизни: - Выбирайте свой стиль — 2 варианта дизайнерской отделки. - Простор и свет в каждом метре — панорамные окна и большие террасы. - Свой оазис — сад ароматов, пешеходный бульвар и приватные дворы для игр, отдыха и спорта. - Лобби как в 5*отеле от бюро Sundukovy Sisters. - Всё для счастья детей — собственный детский сад и школа. - Клубная инфраструктура - спортзал со спа, переговорная, коворкинг, детская и лаунж зоны. ⚡До 30.04 на выделенный пул квартир действуют специальные условия с выгодой до 12 млн рублей. Узнать больше Проектная декларация на сайте https://наш.дом.рф/. Застройщик: ООО "СЗ "ЛАЙФ САВЕЛОВСКАЯ" #реклама pride-home.ru О рекламодателе

20 041

⚙️ Что такое StandardScaler из scikit-learn и зачем он нужен? StandardScaler — это инструмент из библиотеки scikit-learn, который стандартизирует данные: приводит их к распределению со средним 0 и стандартным отклонением 1. Это важно перед обучением моделей, особенно для алгоритмов, чувствительных к масштабу (например, SVM, KNN, линейная регрессия). ➡️ Пример:

from sklearn.preprocessing import StandardScaler
import numpy as np

X = np.array([[10, 200], [15, 300], [14, 250]])

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

print(X_scaled)

➡️ После трансформации признаки будут нормализованы, что помогает улучшить сходимость и стабильность модели.

🗣️ StandardScaler — must-have шаг в пайплайне предварительной обработки данных для большинства классических ML-моделей

🖥 Подробнее тут

20 041

⚙️ Архитектура проекта автоматического обучения ML-моделей В статье ребята из Ингосстраха делятся, как автоматизировали запуск и внедрение моделей, чтобы быстрее закрывать запросы бизнеса, не утонув в бэклоге. Читать...

20 041

🚀 Data Engineer в Navio: получи оффер в компанию за 1 день! В команду BigData мы ищем специалистов уровней middle и senior, готовых решать нестандартные задачи и создавать проекты, которые меняют мир. Наши данные имеют физический смысл: победа над каждой ошибкой здесь — снижение риска ДТП в реальном мире. С нами ты будешь: собирать датасеты для нейросетей, обрабатывать данные для работы автономных машин, визуализировать 4D-траектории, строить системы для сквозной аналитики и не только. Готов проявить свои навыки? Заполняй заявку, оставляй резюме на сайте и получи приглашение от нашего рекрутера на One Day Offer 26 апреля. Приходи на онлайн-мероприятие, пообщайся с командой и, возможно, уже вечером ты станешь ее частью. ⚡️ One Day Offer — твой шанс изменить карьеру!

20 041

⚙️ Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта (ИИ). Читать...

20 041

📈 Подборка статей для вашей карьеры • Как продакт-менеджеру учить английский: план, сроки, советы • Иллюзия прогресса: почему мне не удалось дать студентам-айтишникам реальный опыт • Interview copilots: как кандидаты используют ChatGPT на интервью • Моя история входа в IT: как я ломал стены своих ограничений • Как мы разработали систему грейдинга для системных аналитиков

20 041

⚙️ Анализ данных: от EDA до Tinder-битвы графиков Расскажу, как мы в МТС учили студентов EDA не лекциями, а игрой по типу Tinder, только для графиков. Был фан, был хардкор и крутые визуализации. Читать...

20 041

⚙️ Рекомендательная система для вашего каталога научных работ (и не только!) Показано, как собрать рекомендательную систему на своём архиве документов, даже если там куча форматов. NLP + графы = машинный архивариус, который сам подсовывает нужные файлы. Читать...

20 041

👩‍💻 Постройте простую модель классификации с использованием scikit-learn Создайте модель на датасете Iris, обучите классификатор KNeighborsClassifier и сделайте предсказание. Это классическая задача для первых шагов в машинном обучении. Решение задачи🔽

from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score # Загружаем данные iris = load_iris() X, y = iris.data, iris.target # Делим на обучающую и тестовую выборки X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # Обучаем модель model = KNeighborsClassifier(n_neighbors=3) model.fit(X_train, y_train) # Предсказание y_pred = model.predict(X_test) # Оценка качества print(f"Точность: {accuracy_score(y_test, y_pred):.2f}")

20 041

🤖 Машинный перевод seq2seq: и как обучить модель понимать языки 🗓 21 апреля в 20:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing». На данном открытом уроке мы: ✔️Познакомимся с архитектурой seq2seq и ее применением в задачах машинного перевода ✔️Разберем архитектуру энкодер-декодер, её основные компоненты и как она используется для перевода текста. ✔️Изучим концепцию attention mechanism и его влияние на повышение качества машинного перевода. Данный вебинар будет особенно интересен: -Дата-сайентистам и аналитикам данных, которые хотят углубиться в задачи обработки естественного языка. -Специалистам по машинному обучению, заинтересованным в работе с текстовыми данными и моделями перевода. -Всем, кто изучает современные технологии искусственного интеллекта и их применение в реальных задачах. В результате вебинара слушатели: -Узнают, как работает архитектура seq2seq и как она решает задачи машинного перевода. -Поймут, как attention mechanism улучшает качество перевода и как его можно применить в своих проектах. 🔗 Ссылка на регистрацию: https://vk.cc/cKRM5a Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqv5X5vi

20 041

🔎 Подборка вакансий для мидлов Data Scientist (Middle) 🟢Python, SQL, Pandas, NumPy, Matplotlib 🟢Уровень дохода не указан | 3–6 лет Инженер данных / Data engineer (middle) 🟢Scala, Python, SQL, Apache Spark, Hadoop, NiFi 🟢Уровень дохода не указан | 1–3 года Аналитик данных/Data Analyst 🟢SQL (ClickHouse, Postgres, MS SQL), Python, Jupyter, Git, BI-системы (Datalens) 🟢от 200 000 до 300 000 ₽ | 1–3 года