en
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Show more

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 19 992 subscribers, ranking 6 718 in the Technologies & Applications category and 33 709 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 19 992 subscribers.

According to the latest data from 23 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -85 over the last 30 days and by 0 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 7.98%. Within the first 24 hours after publication, content typically collects 3.64% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 1 596 views. Within the first day, a publication typically gains 728 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 8.
  • Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Thanks to the high frequency of updates (latest data received on 24 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

19 992
Subscribers
No data24 hours
-417 days
-8530 days
Posts Archive
​​👤Как я писал трекинг парковочных мест В этой статье автор расскажет, как обучить модель определять парковочные места, и как это можно применять в реальной жизни, а также вы узнаете как сделать код, который считает свободные парковочные места. Читать...

​​👤Практический опыт проектирования систем графового анализа В этой статье автор расскажет, почему ни одна система не обладает достойным функционалом пользовательского графического интерфейса из коробки, и почему в части GUI-интерфейса администрирования встречаются вполне интересные и зрелые решения, закрывающие большинство требований, а также вы узнаете почему некоторые популярные системы имеют сильно урезанный функционал в так называемой бесплатной community edition. Читать...

​​😮Применение Python для сбора и предобработки данных цифрового следа В этой статье автор расскажет, как можно выполнить отправку HTTP‑запроса веб‑серверу поисковика с упоминанием интересующего объекта с помощью библиотеки «Requests«, и как можно выполнить получение ссылки на страницу в интернете про интересующий объект из ответа веб‑сервера с помощью «Beautiful Soup», а также вы узнаете как собирать цифровой след программными инструментами. Читать...

​​🧑🏼‍💻Разработчики — налево, методологи — направо: четыре шага к оптимизации работы BI-аналитиков В этой статье автор расскажет, почему сбор информации о клиентах, услугах, потреблении и оплатах производиться разными системами, и почему данные агрегируются в таблицах с разными структурами, не связанными общими признаками и логикой, а также вы узнаете зачем нужны разные роли аналитиков, которые могли бы работать параллельно и иметь возможность фокусироваться на определенных задачах. Читать...

​​😎Шесть шагов для создания более качественных моделей Computer Vision В этой статье автор расскажет, какие есть способы применения моделей компьютерного зрения в реальном мире, и чем модели компьютерного зрения отличаются от моделей машинного обучения, а также вы узнаете как применять модели компьютерного зрения в реальном времени. Читать...

​​😵Как мы распараллелили CatBoost на Spark В этой статье автор расскажет, как можно сконфигурировать оператор, а на HDFS положить необходимые jars, и как поставить локальный CatBoost из скачанных джарников, а также вы узнаете как полностью снять нагрузку с Kubernetes-кластера и ускорить вычисления. Читать...

​​😮Кластеризация текста в PySpark В этой статье автор расскажет, почему вручную невозможно обработать огромное количество текстовой информации и понять какие данные они могут содержать, и как в таком случае нам поможет кластеризация текста, которая позволит получить представление о данных, а также вы узнаете как CountVectorizer заменит текст на разреженный вектор. Читать...

​​📊Pyspark. Анализ больших данных, когда Pandas не достаточно В этой статье автор расскажет, почему Pandas - одна из наиболее используемых библиотек Python с открытым исходным кодом для работы со структурированными табличными данными для анализа, и как как PySpark может выручать в условиях нехватки мощностей для обработки данных, а также вы узнаете как Pyarrow может значительно ускорять работу pyspark. Читать...

​​🤪Знакомство с Fugue — уменьшаем шероховатости при работе с PySpark В этой статье автор расскажет, почему рано или поздно объем обрабатываемых данных превосходит возможности Pandas, и возникает необходимость в распределенных вычислениях, и какие могут быть проблемы, с которыми сталкиваются новички и даже опытные пользователи при использовании Spark, а также вы узнаете почему синтаксис и использование Spark и Pandas сильно отличаются. Читать...

​​👤Фундаментальные концепции переобучения и недообучения в машинном обучении В этой статье автор расскажет, почему одели машинного обучения никогда не могут делать идеальные прогнозы, и почему для каждого разделения перекрестной проверки процедура обучает модель на всех красных образцах и оценивает оценку модели на синих образцах, а также вы узнаете как можно получить информацию о времени для подгонки и прогнозирования на каждой итерации перекрестной проверки. Читать...

​​🤖Сassandra для бедных — пускаем в ход HDD В этой статье автор расскажет, почему Cost reduction - очень популярное направление, особенно в дни кризиса IT, и зачем в таблицах, где скорость чтения критична использовать resource intensive Leveled сompaction strategy, а также вы узнаете как можно отказаться от Cassandra на SSD. Читать...

​​Стань лучшим на онлайн-хакатоне PROFBUH HACKATHON | JUNE 🏆 Открыта регистрация на онлайн-хакатон от компании Профбух и Акселератора Возможностей! Кейс: 🔹Автоматическое создание текстовых публикаций на основе записанного видео. Даты хакатона:  23 – 25 июня 2023 года Дедлайн регистрации:  19 июня 23:59 Регистрация и подробности - https://clck.ru/34Wuss   Кому подходит хакатон?  🔸Студентам, разработчикам, дизайнерам, продакт-менеджерам и аналитикам. Что нужно будет сделать? 🔸Разработать web-систему для автоматического создания уникальных статей на основе видео из YouTube.  Что тебя ждёт? 🔹2 дня в онлайн-формате 🔹встречи с экспертами, мастер-классы и питчи 🔹крутой командный проект и интересный кейс в резюме 🔹призовой фонд – 300.000₽ Регистрируйся, решай кейс и выигрывай призы!🏆

​​🎃Компьютерное зрение: загрузка и подготовка данных Fashion MNIST В этой статье автор расскажет, как использовать Keras и строить нейронные сети для решения простых задач, а также вы узнаете как можно использовать TensorFlow для построения нейронных сетей. Читать...

​​📊Что нам стоит диаграмму в Python построить: 5 вариантов привлекающей внимание визуализации данных и кое-что ещё В этой статье автор расскажет, как диаграммы помогают визуализировать простые, и самые сложные наборы данных, и почему древовидную диаграмму несложно делать посредством Plotly, а также вы узнаете почему для создания интерактивной диаграммы лучше использовать библиотеку Plotly, и как она упрощает процесс добавления интерактивности. Читать...

DataScienceBooks - книги по Data Science в формате pdf и epub. Все книги 2017+ годов. Книги скачиваются в 2 клика. Переходите
DataScienceBooks - книги по Data Science в формате pdf и epub.  Все книги 2017+ годов. Книги скачиваются в 2 клика.  Переходите, подписывайтесь и скачивайте: @dsbooksru

​​😎Заповеди начинающего Data Scientist В этой статье автор расскажет, почему никогда нельзя обучать модель на тесте, и как строчка X_test_scaled = scaler.fit_trasnform(X_test) может полностью испортить ваш эксперимент, а также вы узнаете что делать если в коде есть какая-то случайность (случайное разбиение на train и test, случайная инициализация и т. д.). Читать...

​​🫠Выжить без cookies: как мы объединили CDP и сквозную аналитику для компании-автопроизводителя В этой статье автор расскажет, зачем все известные нам браузеры отказываются от сбора сторонних cookies, и почему один из лучших способов адаптации к новой cookieless‑реальности — это сбор и анализ своих собственных данных, а также вы узнаете почему большинство экспертов сходятся на мнении, что нужно сконцентрироваться на сборе собственных данных. Читать...

​​👤Зачем мы моделируем импульсные нейронные сети и с помощью чего это делаем В этой статье автор расскажет, почему обычно нейросети получают на вход огромное количество данных, и почему получаемый сетью поток данных должен быть структурирован, а также вы узнаете почему эффективность реализации ИНС в специализированном нейрочипе зависит прежде всего от нахождения удачных компромиссов между функциональными возможностями нейрона. Читать...

​​😶‍🌫️Что такое Self-Service BI и зачем он нужен В этой статье автор расскажет, как наделить пользователей возможностью самостоятельно исследовать и использовать данные для принятия осознанных управленческих решений, и как повысить культуру и навыки работы с данными, а также вы узнаете какие есть основные подходы к построению Business Intelligence, и почему важен процесс Self-Service. Читать...

​​Сейчас все больше говорят о том, что искусственный интеллект заберет работу у IT-специалистов. Чтобы оставаться востребованным и быть в контексте новых технологий, достаточно понимать, как они работают. 💸 Специалисты по ИИ в среднем получают: В России — ₽200 000 в месяц За рубежом — $125 000 в год, согласно Datamation.  Начните изучать искусственный интеллект с программирования на Python, поскольку большая часть библиотек машинного обучения и анализа данных используется именно в этом языке. 🔥 Международная школа анализа данных и разработки Mathshub проведет бесплатный живой интенсив по основам Python для искусственного интеллекта. Вас ждут живые лекции, сессии парного программирования, а также сертификаты при успешном прохождении обучения. Интенсив продлится 3 недели, за это время вы: ➡️ Научитесь ориентироваться в основах Python: синтаксис, типы данных, условные операторы, циклы, функции, библиотеки ➡️ Погрузитесь в основы машинного обучения ➡️ Узнаете, как работают нейросети Подробнее с программой обучения можно ознакомиться ➡️ тут  Для кого интенсив?  • Новичков, желающих начать программировать на Python • Тех, кто в дальнейшем нацелен освоить анализ данных и машинное обучение • Тех, кто хочет стать востребованным специалистом, создающим ИИ ➡️ Регистрируйтесь по ссылке, старт уже в понедельник 29 мая