Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 739 技术与应用6 738...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 20 041 名订阅者，在 技术与应用 类别中位列第 6 738，并在 俄罗斯 地区排名第 33 739 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 20 041 名订阅者。

根据 14 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -87，过去 24 小时变化为 -13，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 7.71%。内容发布后 24 小时内通常能获得 4.62% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 546 次浏览，首日通常累积 926 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 7。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 15 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

20 041

订阅者

-1324 小时

+257 天

-8730 天

1 546

帖子浏览量

~ 92624 小时

~ 1 11548 小时

7.71%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

20 041

🔥 Самые интересные статьи за последние дни: • Всё, что вы хотели знать о Django Channels • Сборка Python проекта с uv и Docker • DE-1. DIY ассистент на LLM • Ваши генераторные выражения сломаны: чиним и разбираемся • Всё, что вы хотели знать о Django Channels

20 041

👩‍💻 Построй визуализацию распределения признаков с автоматической категоризацией Создайте функцию plot_distributions, которая принимает DataFrame и автоматически определяет числовые и категориальные признаки. Затем строит гистограммы или bar-графики в зависимости от типа данных. Это удобно для EDA (исследовательского анализа данных). Решение задачи🔽

import pandas as pd import matplotlib.pyplot as plt import seaborn as sns def plot_distributions(df, max_categories=10): for column in df.columns: plt.figure(figsize=(6, 4)) if pd.api.types.is_numeric_dtype(df[column]): sns.histplot(df[column].dropna(), kde=True) plt.title(f'Гистограмма: {column}') elif df[column].nunique() <= max_categories: df[column].value_counts().plot(kind='bar') plt.title(f'Категории: {column}') else: print(f'Пропущен {column}: слишком много уникальных категорий') continue plt.tight_layout() plt.show() # Пример использования df = pd.DataFrame({ 'age': [23, 45, 31, 35, 62, 44, 23], 'gender': ['male', 'female', 'female', 'male', 'male', 'female', 'female'], 'income': [40000, 50000, 45000, 52000, 61000, 48000, 46000] }) plot_distributions(df)

20 041

⚙️ Как мы создаём Visionatrix: упрощая ComfyUI В этой статье мы расскажем о нашем опыте работы с ComfyUI и разработке Visionatrix — надстройки, которая упрощает генерацию медиа. Мы обсудим ключевые проблемы, с которыми сталкиваются пользователи, наш подход к их решению, а также вкратце поделимся тем, как мы использовали ChatGPT и Claude для ускорения разработки в условиях ограниченного времени. Читать...

20 041

🤖 Как бизнес зарабатывает на ИИ в апреле 2025 • Artisan привлекла $25 млн для развития ИИ-агентов, автоматизирующих задачи в продажах и CRM. Первый агент Ava уже заменяет BDR в компаниях среднего звена . • Малый бизнес в Великобритании увеличивает продуктивность на 27–133% благодаря ИИ-инструментам для управления персоналом и запасами . • Microsoft Dynamics 365 внедряет цифровых двойников и генеративный ИИ для оптимизации цепочек поставок и логистики в производстве . • Google Workspace представляет агентные ИИ-инструменты для автоматизации рабочих процессов и повышения эффективности бизнеса . • OpenAI объявила о прекращении поддержки GPT-4.5 и рекомендует переход на более экономичный GPT-4.1 к июлю 2025 года . 📁 В этой папке: https://t.me/addlist/iVhUYbQyw-0yYThi — проверенные ИИ-инструменты — способы монетизации для ИИ- и IT-специалистов — тренды на 2025 год: что работает, а что устарело https://t.me/addlist/iVhUYbQyw-0yYThi 💬 Хочешь попасть в следующую подборку? Напиши: @RyabovaM

20 041

🔎 Подборка зарубежных вакансий Senior Data Analyst 🟢Python, SQL, Amplitude, Firebase, аналитические платформы, маркетинговые метрики 🟢до 3 000 $ | 3–6 лет Senior Data Engineer 🟢Python, SQL, Apache Airflow, Exasol, ClickHouse, StarRocks, Snowflake, BigQuery, Redshift, ETL/ELT, S3, Docker, Kubernetes 🟢Уровень дохода не указан | более 6 лет Team Lead Data Scientist 🟢Python, RecSys, Uplift modeling, Churn prediction, LTV prediction, Forecasting, MLOps, CI/CD 🟢от 5 000 до 7 250 $ | более 6 лет

20 041

🌌 Делай мини-проекты из собственных болей Бесит, что каждый день ищешь одну и ту же команду в истории? Или вручную обрезаешь скриншоты? Это подсказки. 👉 Совет: собирай такие мелкие «боли» и превращай их в свои pet-проекты или утилиты. Это не только помогает себе, но и тренирует навык быстрого решения задач и проектирования под реальную жизнь.

20 041

👩‍💻 Под капотом asyncio: принципы работы и ключевые концепции Библиотека asyncio предоставляет полный набор инструментов для организации параллельного выполнения кода в Python с использованием концепции асинхронности. Но как на самом деле работает asyncio? Давайте разберемся в ключевых принципах и понятиях. Читать...

20 041

Зачем платить за ресурсы, которые вы не используете? 👨‍💻 На вебинаре 22 апреля провайдер Cloud․ru расскажет про новый сервис Evolution ML Inference для быстрого запуска ML-моделей в облаке. Вы узнаете: 😶‍🌫️почему технология Shared GPU выгоднее выделенных ресурсов: расчет экономии на примере реальных проектов; 😶‍🌫️как запускать модели с Hugging Face за несколько кликов; 😶‍🌫️как избежать переплат: настройка лимитов GPU и мониторинг real-time; 😶‍🌫️про динамическое масштабирование: добавление ресурсов при пиковой нагрузке и отключение в простое. Будет особенно интересно дата-сайентистам, DevOps-инженерам и тем, кто планирует запускать свои ML-модели. Зарегистрироваться на вебинар 🧠

20 041

⚙️ Как обучить русскоязычную модель рассуждений — LRM? В статье разбор мультиязычных моделей рассуждений от Lightblue: как они научили DeepSeek "думать" на русском, откуда взяли датасет и зачем запускали LLM как фильтр рассудительности. Читать...

20 041

Премиальный квартал PRIDE: 1/5 квартиры в подарок Всего 15 минут от Цветного бульвара – и вы у себя дома. В семейном квартале PRIDE вас ждет идеальная среда для жизни: - Выбирайте свой стиль — 2 варианта дизайнерской отделки. - Простор и свет в каждом метре — панорамные окна и большие террасы. - Свой оазис — сад ароматов, пешеходный бульвар и приватные дворы для игр, отдыха и спорта. - Лобби как в 5*отеле от бюро Sundukovy Sisters. - Всё для счастья детей — собственный детский сад и школа. - Клубная инфраструктура - спортзал со спа, переговорная, коворкинг, детская и лаунж зоны. ⚡До 30.04 на выделенный пул квартир действуют специальные условия с выгодой до 12 млн рублей. Узнать больше Проектная декларация на сайте https://наш.дом.рф/. Застройщик: ООО "СЗ "ЛАЙФ САВЕЛОВСКАЯ" #реклама pride-home.ru О рекламодателе

20 041

⚙️ Что такое StandardScaler из scikit-learn и зачем он нужен? StandardScaler — это инструмент из библиотеки scikit-learn, который стандартизирует данные: приводит их к распределению со средним 0 и стандартным отклонением 1. Это важно перед обучением моделей, особенно для алгоритмов, чувствительных к масштабу (например, SVM, KNN, линейная регрессия). ➡️ Пример:

from sklearn.preprocessing import StandardScaler
import numpy as np

X = np.array([[10, 200], [15, 300], [14, 250]])

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

print(X_scaled)

➡️ После трансформации признаки будут нормализованы, что помогает улучшить сходимость и стабильность модели.

🗣️ StandardScaler — must-have шаг в пайплайне предварительной обработки данных для большинства классических ML-моделей

🖥 Подробнее тут

20 041

⚙️ Архитектура проекта автоматического обучения ML-моделей В статье ребята из Ингосстраха делятся, как автоматизировали запуск и внедрение моделей, чтобы быстрее закрывать запросы бизнеса, не утонув в бэклоге. Читать...

20 041

🚀 Data Engineer в Navio: получи оффер в компанию за 1 день! В команду BigData мы ищем специалистов уровней middle и senior, готовых решать нестандартные задачи и создавать проекты, которые меняют мир. Наши данные имеют физический смысл: победа над каждой ошибкой здесь — снижение риска ДТП в реальном мире. С нами ты будешь: собирать датасеты для нейросетей, обрабатывать данные для работы автономных машин, визуализировать 4D-траектории, строить системы для сквозной аналитики и не только. Готов проявить свои навыки? Заполняй заявку, оставляй резюме на сайте и получи приглашение от нашего рекрутера на One Day Offer 26 апреля. Приходи на онлайн-мероприятие, пообщайся с командой и, возможно, уже вечером ты станешь ее частью. ⚡️ One Day Offer — твой шанс изменить карьеру!

20 041

⚙️ Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта (ИИ). Читать...

20 041

📈 Подборка статей для вашей карьеры • Как продакт-менеджеру учить английский: план, сроки, советы • Иллюзия прогресса: почему мне не удалось дать студентам-айтишникам реальный опыт • Interview copilots: как кандидаты используют ChatGPT на интервью • Моя история входа в IT: как я ломал стены своих ограничений • Как мы разработали систему грейдинга для системных аналитиков

20 041

⚙️ Анализ данных: от EDA до Tinder-битвы графиков Расскажу, как мы в МТС учили студентов EDA не лекциями, а игрой по типу Tinder, только для графиков. Был фан, был хардкор и крутые визуализации. Читать...

20 041

⚙️ Рекомендательная система для вашего каталога научных работ (и не только!) Показано, как собрать рекомендательную систему на своём архиве документов, даже если там куча форматов. NLP + графы = машинный архивариус, который сам подсовывает нужные файлы. Читать...

20 041

👩‍💻 Постройте простую модель классификации с использованием scikit-learn Создайте модель на датасете Iris, обучите классификатор KNeighborsClassifier и сделайте предсказание. Это классическая задача для первых шагов в машинном обучении. Решение задачи🔽

from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score # Загружаем данные iris = load_iris() X, y = iris.data, iris.target # Делим на обучающую и тестовую выборки X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # Обучаем модель model = KNeighborsClassifier(n_neighbors=3) model.fit(X_train, y_train) # Предсказание y_pred = model.predict(X_test) # Оценка качества print(f"Точность: {accuracy_score(y_test, y_pred):.2f}")

20 041

🤖 Машинный перевод seq2seq: и как обучить модель понимать языки 🗓 21 апреля в 20:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing». На данном открытом уроке мы: ✔️Познакомимся с архитектурой seq2seq и ее применением в задачах машинного перевода ✔️Разберем архитектуру энкодер-декодер, её основные компоненты и как она используется для перевода текста. ✔️Изучим концепцию attention mechanism и его влияние на повышение качества машинного перевода. Данный вебинар будет особенно интересен: -Дата-сайентистам и аналитикам данных, которые хотят углубиться в задачи обработки естественного языка. -Специалистам по машинному обучению, заинтересованным в работе с текстовыми данными и моделями перевода. -Всем, кто изучает современные технологии искусственного интеллекта и их применение в реальных задачах. В результате вебинара слушатели: -Узнают, как работает архитектура seq2seq и как она решает задачи машинного перевода. -Поймут, как attention mechanism улучшает качество перевода и как его можно применить в своих проектах. 🔗 Ссылка на регистрацию: https://vk.cc/cKRM5a Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqv5X5vi

20 041

🔎 Подборка вакансий для мидлов Data Scientist (Middle) 🟢Python, SQL, Pandas, NumPy, Matplotlib 🟢Уровень дохода не указан | 3–6 лет Инженер данных / Data engineer (middle) 🟢Scala, Python, SQL, Apache Spark, Hadoop, NiFi 🟢Уровень дохода не указан | 1–3 года Аналитик данных/Data Analyst 🟢SQL (ClickHouse, Postgres, MS SQL), Python, Jupyter, Git, BI-системы (Datalens) 🟢от 200 000 до 300 000 ₽ | 1–3 года