Data Science | Machinelearning [ru]

Open in Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Network:Frontender's notes [ru]Russia33 709 Technologies & Applications6 718...

📈 Analytical overview of Telegram channel Data Science | Machinelearning [ru]

Channel Data Science | Machinelearning [ru] (@devsp) in the Russian language segment is an active participant. Currently, the community unites 19 992 subscribers, ranking 6 718 in the Technologies & Applications category and 33 709 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 19 992 subscribers.

According to the latest data from 23 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -85 over the last 30 days and by 0 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 7.98%. Within the first 24 hours after publication, content typically collects 3.64% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 596 views. Within the first day, a publication typically gains 728 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 8.
Thematic interests: Content is focused on key topics such as llm, nvidia, контекст, openai, архитектура.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Thanks to the high frequency of updates (latest data received on 24 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

19 992

Subscribers

No data24 hours

-417 days

-8530 days

1 596

Post views

~ 72824 hours

~ 84648 hours

7.98%

Engagement rate

~ 1

Posts per day

Ads index

beta

Posts Archive

19 992

👾Особенности автоматического дифференцирования в PyTorch. Часть 1 В этой статье автор расскажет, почему PyTorch активно развивается более пяти лет и представляет собой целую экосистему для создания моделей машинного обучения на основе глубоких нейронных сетей, и как они помогают научному и бизнес-сообществу проводить исследования, вести разведку данных и проверять гипотезы. Читать...

19 992

🧑🏼‍💻Реализация мультиоблачной стратегии для Cloud Storage в Битрикс24 В этой статье автор расскажет, зачем понадобилось S3-хранилище, и как его внедряли и интегрировали в архитектуру облачного сервиса Битрикс24. Читать...

19 992

😵Локализация и рывок вперед: как мы разработали новый подход к облачному хранению данных для Hoff В этой статье автор расскажет, как сделали облачное хранилище понятным и структурированным источником информации для Hoff, и почему надежность хранилища определяется качеством системы оповещений, то есть алертингом. Читать...

19 992

🤔PySpark для аналитика. Как выгружать данные с помощью toPandas и его альтернатив В этой статье автор расскажет, как правильно использовать функцию toPandas вместе с библиотекой pyArrow, и когда использовать toPandas не стоит. Читать...

19 992

😬Как развернуть Apache Superset в облаке: Docker, ВМ, Kubernetes В этой статье автор расскажет, какие есть способы развёртывания Apache Superset на разных платформах, и почему вариант с развёртыванием Apache Superset в Docker больше подходит для быстрых тестов, а также вы узнаете какие есть вариант с развёртыванием Apache Superset на виртуальных машинах. Читать...

19 992

📊Генерация конвейеров обработки данных в Dataflow В этой статье автор расскажет, почему в Dataflow есть несколько вариантов образцов рабочих потоков, но бизнес-логика используется в них одна, и почему файл определения main содержит логику только одного выполнения, а также вы узнаете почему поток daily выполняет main на ежедневной основе в течение установленного количества прошедших дней. Читать...

19 992

🧑🏼‍💻Как внедрить Data Driven подход в систему управления поставками В этой статье автор расскажет, почему каждое предприятие при организации складских запасов ориентируется на производственные планы, и почему после внедрения системы менеджер будет заниматься только интеллектуальной работой, а также вы узнаете о проблемах управления цепями поставок и способы их решений. Читать...

19 992

👤Без лишних слов или очищаем речь с помощью текст майнинга В этой статье автор расскажет, почему поиск качественного инструмента для анализа аудио свелся к выбору между облачными сервисами, и как данное исследование поможет разобраться с нашими вербальными привычками, а также вы узнаете как после нетривиальных настроек облака стал доступен API асинхронного распознавания. Читать...

19 992

🚀Оптимизация выборок в больших коллекциях MongoDB В этой статье автор расскажет, почему при работе с большими коллекциями в MongoDB, размер которых превышал десятки миллионов записей, возникает необходимость формировать случайные выборки уникальных значений полей, принадлежащих документам этой коллекции, а ещё вы узнаете почему для такой операции, в MongoDB штатно предусмотрена функция $sample, которую можно использовать в составе pipeline при проведении агрегации данных. Читать...

19 992

🧑🏼‍💻«Инженеров данных заменит автоматика» и другие мифы о DE В этой статье автор расскажет, почему инженеры данных готовят данные для анализа, машинного обучения и других целей, и почему мифы про бесконечный кодинг или однообразие задач могут показаться глупыми и смешными, а также вы узнаете как No-code-инструменты позволяют управлять данными и упрощают создание их базовых структур. Читать...

19 992

👤Дообучение модели машинного перевода В этой статье автор расскажет, почему разработчики машинного перевода часто рассказывают об использовании предварительно обученных моделей, и как можно дообучить такую модель самому, а также вы узнаете почему после дообучения, при помощи кода m2m_multiling_tune_epochs. py, перевод стал гораздо приятнее. Читать...

19 992

✉️Как Почта моделирует риски потери отправлений В этой статье автор расскажет, почему антифрод в логистике — нетривиальная задача, и какие данные легли в основу модели, а также вы узнаете как создать модель, которая предсказывает до 97% возможных пропаж международных отправлений. Читать...

19 992

😎Применение регулярных выражений для обработки данных В этой статье автор расскажет, почему сейчас регулярные выражения применяются в разнообразных задачах, и как регулярные выражения могут применяться для решения задач SQL, а также вы узнаете почему на практике не все специалисты применяют регулярные выражения для решения поставленных задач в SQL. Читать...

19 992

Онлайн-курс по основам программирования дронов. Вы научитесь: – разбираться в устройстве дронов; – создавать программы для управления беспилотниками и анализа данных; – составлять карту пространства; – обрабатывать изображения, полученные с бортовых систем БПЛА; – разрабатывать свою систему управления. В качестве итогового проекта вы создадите систему полёта беспилотника в лесу и примените один из алгоритмов облёта препятствий. Жаркие скидки до 60% по ссылке https://goo.su/zCk9Wy

19 992

🤨Cache warming в Qlik Sense из подручных материалов В этой статье автор расскажет, как сделать приложения Qlik Sense быстрее, и почему Qlik не оптимизирован под постоянную работу с внешними источниками, а также вы узнаете какие бывают инструменты для Cache warming. Читать...

19 992

🚀Как ускорить вывод ML-моделей в 4 раза, или Как может выглядеть экосистема МLOps в банке В этой статье автор расскажет, как может выглядеть полноценный конвейер MLOps, и что может уметь, а также вы узнаете как прийти к максимальной автоматизации процесса вывода моделей в промышленную эксплуатацию. Читать...

19 992

😻 😫 🐹 😫 🐱 😫 🐭 😫🦉 Data Secrets — канал для датасаентистов – Как тренировали алгоритм, который обыграл чемпиона мира в шахматы? – Как работает FaceID в твоем смартфоне? – Как обучить ChatGPT на стареньком ноутбуке? – Как предсказать курс биткоина и исход футбольного матча? – Чем отличаются сверточные и рекуррентные нейросети? Заходи и узнаешь @data_secrets

19 992

🤫Вся правда о кубах данных OLAP: развенчиваем мифы В этой статье автор расскажет, почему кубы данных — не самая простая тема в дата-инжиниринге, и как кубы данных могут помогать бизнес-аналитикам предварительно упаковывать и агрегировать важные для стейкхолдеров показатели, а также вы узнаете почему кубы это важная характеристика ядра традиционных OLAP-систем. Читать...

19 992

🚀Optuna. Подбор гиперпараметров для вашей модели В этой статье автор расскажет, почему гиперпараметры, задаются разработчиком модели перед ее обучением, и почему фреймворк Optuna обычно используют как оптимизатор гиперпараметров, а также вы узнаете как разработчик может самостоятельно задать пространство для поиска гиперпараметров, используя базовый синтаксис Python. Читать...

19 992

😈Масштабируемая Big Data система в Kubernetes с использованием Spark и Cassandra В этой статье автор расскажет, как организовать систему распределенного машинного обучения на GPU NVidia, используя язык Java с фреймворками Spring, Spark ML, XGBoost, DML в standalone кластере Spark, и как запустить Spark Jobs в Kubernetes в режимах client и cluster, а также вы узнаете почему для Spark Driver необходим K8S Service Account с полными правами на неймспейс Читать...