Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Network:Frontender's notes [ru]Russia33 730 Technologies & Applications6 734...

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 20 042 subscribers, ranking 6 734 in the Technologies & Applications category and 33 730 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 20 042 subscribers.

According to the latest data from 15 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -82 over the last 30 days and by -1 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 7.88%. Within the first 24 hours after publication, content typically collects 4.47% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 580 views. Within the first day, a publication typically gains 896 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 7.
Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Thanks to the high frequency of updates (latest data received on 16 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

20 042

Subscribers

-124 hours

+307 days

-8230 days

1 580

Post views

~ 89624 hours

~ 1 08548 hours

7.88%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

20 042

👩‍💻 Задачка по Python Создайте Python-приложение, которое принимает путь к CSV-файлу с историческими данными о ценах акций (дата, цена закрытия) и предсказывает, будет ли цена акций расти или падать на следующий день, используя простую линейную регрессию. Программа должна выводить прогноз в консоль и сохранять модель в файл model.pkl. ➡️ Пример: • python app.py predict_stock prices.csv — предсказывает изменение цены акций на следующий день. Решение задачи ⬇️

import sys import pandas as pd from sklearn.linear_model import LinearRegression import pickle def predict_stock(file): data = pd.read_csv(file) X = data.index.values.reshape(-1, 1) y = data['Close'].values model = LinearRegression() model.fit(X, y) next_day = [[len(X)]] prediction = model.predict(next_day) with open('model.pkl', 'wb') as f: pickle.dump(model, f) print(f'Прогноз на следующий день: {"Рост" if prediction > y[-1] else "Падение"}') if __name__ == "__main__": if len(sys.argv) != 3 or sys.argv[1] != 'predict_stock': print('Использование: python app.py predict_stock <файл.csv>') else: predict_stock(sys.argv[2])

20 042

📨 Пример использования программы для парсинга e-mail адресов с сайтов, созданный ИИ Сегодня делимся программой для парсинга e-mail с сайтов, созданной за 30 минут с помощью ИИ от Rokitok. Это показывает, как ИИ ускоряет задачи, на которые раньше уходили дни или большие бюджеты. Читать...

20 042

➡️ Что такое технология TTS, как устроена и каких сферах используется синтез речи Вместе с Григорием Стерлингом, лидом команды TTS в SberDevices, разбираемся, как устроена технология, как разрабатывают синтезаторы речи и что нужно знать, чтобы работать в этой сфере. Читать...

20 042

💡 Пиши код так, чтобы не пришлось его объяснять Тебя уже дважды спрашивали, как работает твой код, а ты сам еле вспоминаешь? 👉 Совет: если код требует объяснения — значит, его можно улучшить. Улучши имена переменных, избавься от хитрых решений, добавь комментарии только там, где действительно нужно. Хороший код читается, как книга, а не как зашифрованное послание.

20 042

👩‍💻 Линейная регрессия и её регуляризация в Scikit-learn Линейная регрессия — это метод обучения с учителем, который предсказывает значение y на основе признаков X. Основное допущение — линейная зависимость y от Xi, что позволяет оценить y через математическое выражение. Читать...

20 042

❓ Кто такой разметчик данных и сколько он зарабатывает? Все, что вам нужно знать о профессии Как нейросети распознают лица и управляют авто? Всё это благодаря разметчикам данных, которые учат ИИ видеть и понимать мир. Узнайте, сколько они зарабатывают и какие навыки нужны для работы. Читать...

20 042

⚙️ Что такое logging в Python? logging — это встроенный модуль Python для создания логов, которые помогают отлаживать и мониторить работу приложений. ➡️ Пример:

import logging

# Настройка базового уровня логирования
logging.basicConfig(level=logging.INFO)

# Создание лога
logging.info("Приложение запущено")
logging.warning("Это предупреждение!")
logging.error("Произошла ошибка")

🗣️ В этом примере модуль logging создаёт сообщения разного уровня важности. Логирование позволяет отслеживать работу приложений и находить проблемы в коде.

🖥 Подробнее тут

20 042

🚀 Data Fusion Contest 2025: пришло время заявить о себе Что такое Data Fusion Contest 2025? Ежегодное онлайн-соревнование по анализу данных и машинному обучению для специалистов Data Science от Т1 и ВТБ. Общий призовой фонд — 3 000 000 рублей 🔥 В этом году участников ждут 2 основные задачи: «Label Craft» — про предсказание категории товаров. «4 Cast» — про предсказание динамики платежей на последующие 12 недель. И одна образовательная задача — «Distribution». А ещё будет специальная номинация Companion за лучшие публичные решения, в которой победителей определит жюри, учитывая поддержку со стороны других конкурсантов в чате соревнования. 📆 Даты проведения соревнования: с 13 февраля по 7 апреля 2025 года. ❗️Формат — онлайн: участвовать можно из любой точки мира. 🏆 Торжественная церемония награждения победителей состоится в Москве во время конференции по анализу данных и технологиям ИИ — DATA FUSION 2025. 👉 Регистрируйся на соревнование прямо сейчас. Информация о рекламодателе

20 042

🤔 Топология в нейросетях? Когда говорят о математике в ML, чаще всего вспоминают Байесовские методы и тензоры. Но математика в машинном обучении может затрагивать и фундаментальные направления, как топологический анализ данных (TDA) — ту самую науку про бублики и ленточки. Читать...

20 042

📈 Подборка статей для вашей карьеры • «Снова упала?» Как поднять самооценку и зачем мы сравниваем себя с другими, даже если от этого больно • Из учителя в QA: мой путь в IT • Рынок дата-инженеров и прогноз на 2025 • Как сделать резюме, которое дойдёт до работодателя. Фильтры ATS в 2025 году • Ошибайся смело: жизненные уроки из мира machine learning

20 042

На GitVerse стала доступна среда разработки GigaIDE Cloud со встроенным AI-ассистентом СберТех представил российскую облачную среду для разработки GigaIDE Cloud, встроенную в платформу для работы с исходным кодом GitVerse. Среда обеспечивает редактирование, отладку, проверку и совместную работу с кодом, а также постоянный и безопасный доступ к предварительно настроенным рабочим пространствам разработки. GigaIDE Cloud доступна из браузера и позволяет вести разработку в удобном режиме с различных устройств вне зависимости от их производительности. Также пользователи получили доступ к обновлённой версии интегрированной среды разработки GigaIDE Desktop, которую можно скачать на GitVerse. Десктопная версия стала стабильнее и производительнее, а еще добавились новые инструменты для анализа и навигации по элементам крупнейших фреймворков для Java. В обе версии среды разработки интегрирован AI-ассистент разработчика GigaCode, который автоматизирует рутинные процессы и помогает программистам в реальном времени. Начать пользоваться GigaIDE Cloud — по ссылке

20 042

📝 Подборка вакансий для сеньоров Data Engineer • Python, CI/CD, Apache Spark, Apache Hadoop • от 250 000 до 320 000 ₽ | от 2 лет опыта Data Scientist (E-com) • Python, SQL • Уровень дохода не указан | от 1 года опыта Data Scientist (middle) • Python, SQL, A/B тестирование, Математическая статистика • Уровень дохода не указан | от 1 года опыта

20 042

🧠 Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц Как машинное обучение помогает управлять ускорителями частиц? В статье раскрываются примеры применения нейронных сетей, обучения с подкреплением и байесовской оптимизации для стабилизации и настройки пучков частиц. Читать...

20 042

Как ML-инженеру пробиться из мидлов в сеньоры? Вы умеете делать fit() и predict(), но что-то не даёт покоя — застряли на уровне мидла и нет понимания, как пробиться в сеньоры. Сеньор — это не просто человек, который знает больше библиотек или пишет код быстрее. Это специалист, который видит картину целиком, способен самостоятельно взять на себя задачу или выбрать направление в развитии проекта и довести его до успешного завершения. Прокачайте свои навыки и получите level up своей карьеры на курсе Hard ML от karpov courses. Авторы курса — Валерий Бабушкин, из British Petroleum и другие топовые специалисты из Яндекса, X5 Retail Group и других крупных компаний. Вы получите максимально глубокое погружение в задачи, с которыми сталкивается современный бизнес. К концу каждого модуля у вас будет собственный ML-сервис, решающий сложную и важную задачу. Курс охватывает абсолютно все этапы работы ML-инженера. Вы научитесь самостоятельно собирать и размечать данные, строить пайплайны их поставки, деплоить приложения, настраивать мониторинги и оценивать эффективность алгоритмов. Присоединяйтесь к курсу со скидкой 5% по промокоду DEVSP: https://clc.to/ZocBWQ

20 042

👩‍💻 Парсинг и подсчёт количества слов в текстовом файле Напишите функцию на Python, которая принимает путь к текстовому файлу и возвращает словарь с подсчётом количества уникальных слов. Слова должны сравниваться без учёта регистра, а знаки препинания должны быть удалены. Пример:

# Содержимое файла example.txt:
# "Hello, world! This is a test. Hello again."

result = count_words_in_file("example.txt")
print(result)
# Ожидаемый результат:
# {'hello': 2, 'world': 1, 'this': 1, 'is': 1, 'a': 1, 'test': 1, 'again': 1}

Решение задачи🔽

import string from collections import Counter def count_words_in_file(file_path): with open(file_path, 'r', encoding='utf-8') as f: text = f.read().lower() text = text.translate(str.maketrans('', '', string.punctuation)) words = text.split() return dict(Counter(words)) # Пример использования result = count_words_in_file("example.txt") print(result)

20 042

📌Открытый вебинар «MLFlow — полный контроль над ML-экспериментами» 📚Вы узнаете: 1️⃣ Что такое MLFlow и какие компоненты он содержит; 2️⃣ Как отслеживать и управлять экспериментами с помощью MLFlow; 3️⃣ Как интегрировать MLFlow в ваш ML-пайплайн и ускорить вывод моделей в продакшн; 4️⃣ Возможности MLFlow: трекинг экспериментов, управление моделями и воспроизводимость; 5️⃣ Как эффективно работать с артефактами и версиями моделей. 🎁 Проведём живую демонстрацию, где шаг за шагом внедрим MLFlow в ML-проект! Спикер: Игорь Стурейко — PhD Physical and Mathematical Sciences и опытный руководитель команд. 📅 Дата: 27 февраля в 20:00 (мск) 🆓 Бесплатно. Вебинар в рамках курса «MLOps» 👉 Регистрация открыта: https://otus.pw/PQ87/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzquYCxq4

20 042

🔧 ТОП-10 опенсорсных инструментов для работы с ИИ в 2025 году Детальный разбор 10 самых перспективных инструментов для работы с ИИ в 2025 году. От создания умных ассистентов до построения мощных RAG-систем — разбираем возможности, сравниваем производительность, безопасность и простоту интеграции каждого решения. Читать...

20 042

У вас была ситуация, когда вы открываете новый проект или библиотеку и пытаетесь разобраться в коде? Если в этом проекте используются аннотации типов - вы справитесь с этой задачей намного быстрее. Также на уроке рассмотрим библиотеку pydantic, которая позволяет вывести на новый уровень работу с данными в Python. Узнайте, как эффективно реализовать интернационализацию и локализацию в Spring-приложениях. ⏺26 февраля в 20:00 МСК Бесплатно. Урок в рамках старта курса «Python для аналитики» от Otus. 💬 Ссылка на регистрацию: https://vk.cc/cIWYRy Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 042

📝 Подборка вакансий для мидлов Data Scientist • Python, BI • Уровень дохода не указан | 1–3 года Data Engineer • PostgreSQL, Apache Airflow, Greenplum, DWH, ETL • Уровень дохода не указан | 3–6 лет AI Data Analysis Specialist • Python, NLP, Power BI, Анализ данных, BI, Визуализация, Tableau, Английский язык • Уровень дохода не указан | 1–3 года

20 042

📌Открытый вебинар: «Алгоритмы SARSA и Q-learning — база для изучения Reinforcement Learning» 📚Вы узнаете: + Как работают SARSA и Q-learning и чем они отличаются + Как применить SARSA и Q-learning на практике с Python и OpenAI Gym + Где используют RL: робототехника, финансы, игры Спикер: Игорь Стурейко — кандидат физико-математических наук МГУ, опытный разработчик, руководитель и преподаватель. 📅Дата: 26 февраля в 20:00 (мск) 🆓Бесплатно. В рамках курса «Reinforcement Learning» 👉Регистрация открыта: https://otus.pw/f6Ai/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqw6QRyG