Data Science | Machinelearning [ru]

Открыть в Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Больше

Сеть:Frontender's notes [ru]Россия33 739 Технологии и приложения6 738...

📈 Аналитический обзор Telegram-канала Data Science | Machinelearning [ru]

Канал Data Science | Machinelearning [ru] (@devsp) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 20 041 подписчиков, занимая 6 738 место в категории Технологии и приложения и 33 739 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 20 041 подписчиков.

Согласно последним данным от 14 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -87, а за последние 24 часа — -13, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.71%. В первые 24 часа после публикации контент обычно набирает 4.62% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 1 546 просмотров. В течение первых суток публикация набирает 926 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 7.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, nvidia, контекст, openai, архитектура.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Благодаря высокой частоте обновлений (последние данные получены 15 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

20 041

Подписчики

-1324 часа

+257 дней

-8730 день

1 546

Просмотры поста

~ 92624 часа

~ 1 11548 часов

7.71%

Коэффициент вовлеченности

~ 1

Постов в день

Ads index

beta

Архив постов

20 043

Алоха товарищи. Тут подкаст вышел интересный. Спикер - Антон Полднев — специалист по рекламным технологиям Яндекса с опытом свыше 10 лет. В подкасте он рассказывает о своем пути от стажера, который писал на Perl, до руководителя и делится инсайтами разработки высоконагруженных систем. Он объясняет, как работает рекомендательная система рекламы, как ML помогает предсказывать поведение пользователей и вероятность конверсии для бизнеса. ⠀ Ключевые моменты: 👉 Ответственность за рекламные технологии. 👉 Переход на C++ для повышения производительности. 👉 Внедрение нейросетей и машинного обучения. 👉 Важность командной работы и четкого распределения задач. 👉 Эксперименты и A/B-тесты для оптимизации решений. Также Антон рассказал про Perforator — opensource-инструмент, который помогает анализировать работу приложений на сервере в реальном времени. С помощью этого инструмента разработчики могут увидеть, как распределяются ресурсы серверов и какие программы расходуют их больше всего. Ссылки на подкаст 👉 YouTube 👉 VK 👉 Rutube

20 043

🔎 Подборка вакансий для сеньоров Ведущий Python разработчик 🟢Python, Django, Pydantic, SQL, NoSQL, AWS, Docker, Kubernetes, asyncio, aiohttp, RabbitMQ, Kafka 🟢Уровень дохода не указан | 3–6 лет Ведущий менеджер AI (Data Scientist) 🟢Python, машинное обучение, SQL, A/B тесты, NLP, deep learning, RNN, трансформеры, MLOps, DVC, MLflow, Airflow, Hadoop, Spark, LangChain, LangGraph, LLM 🟢Уровень дохода не указан | 3–6 лет Senior Data Analyst 🟢SQL, Python, Excel, BI tools (Tableau, PowerBI, Metabase) 🟢Уровень дохода не указан | 3–6 лет

20 043

⚙️ Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Продолжение Статья продолжает разбор моделирования температурного временного ряда с двойной сезонностью. Основное внимание уделено подбору оптимальных параметров сезонной модели САРПСС для точного описания данных. Читать...

20 043

🖥 Про разработку LLM: какие ещё есть справочники и кукбуки В статье — разбор, почему собирать платформу инференса LLM с нуля не всегда разумно, и как MWS GPT помогает запускать большие языковые модели проще, быстрее и без лишнего сумасшествия. Читать...

20 043

📂 Мы делимся с вами папкой «ИИ & IT & DSGN», в которой собрали статьи с полезными советами от экспертов. ⚙ Внутри вас ждет: 🟠 Статья "Можете ли Вы отличить ИИ в общении?" 🟠 ИИ-ментор для новых сотрудников 🟠 Игровой помощник от Nvidia. 🟠 ИИ-инструменты для дизайнеров. 🟠 И еще 28 полезные статьи, которые прокачают ваши навыки. 🔗 А мы с вами делимся статьёй: «Распознавание ж/д пикетных столбиков по фотографиям с беспилотника на основе PyTorch и YOLOv5». ✔ Сохраняйте папку «ИИ & IT & DSGN», чтобы быть в курсе всех новостей в мире IT и не только!

20 043

👩‍💻 Постройте логистическую регрессию вручную Напишите простую реализацию логистической регрессии с нуля (без sklearn) для бинарной классификации. Это поможет лучше понять, как работает один из самых базовых алгоритмов в машинном обучении. Решение задачи🔽

import numpy as np # Сигмоида def sigmoid(z): return 1 / (1 + np.exp(-z)) # Функция логистической регрессии def logistic_regression(X, y, lr=0.1, epochs=1000): m, n = X.shape X = np.c_[np.ones(m), X] # добавляем bias theta = np.zeros(n + 1) for _ in range(epochs): z = np.dot(X, theta) h = sigmoid(z) gradient = np.dot(X.T, (h - y)) / m theta -= lr * gradient return theta # Предсказание def predict(X, theta): X = np.c_[np.ones(X.shape[0]), X] return sigmoid(np.dot(X, theta)) >= 0.5 # Пример X = np.array([[1], [2], [3], [4]]) y = np.array([0, 0, 1, 1]) theta = logistic_regression(X, y) print(predict(X, theta)) # [False False True True]

20 043

🖥 Как работает Трансформер: очень простое описание Вот очень простое объяснение для тех, кто не хочет вдаваться в сложную математику, но и не готов принимать эту ключевую технологию как магию, которая просто работает. Конечно, никакого волшебства тут и нет — идея на самом деле довольно проста.. Читать...

20 043

🤖 AI агенты на основе LLM: что нас ждет? Приглашаем на открытый урок. 🗓 14 апреля в 18:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced». Сегодня нейросети такие как ChatGPT, GPT4, GigaChat и другие из больших языковых моделей (LLMs), способных генерировать текст на очень высоком уровне, стремительно превращаются в AI агентов, по сути наших виртуальных ассистентов, способных взаимодействовать со средой, принимать решения и выполнять широкий набор команд. На вебинаре мы расскажем про то, что представляют из себя AI агенты сегодня и что нас ждет в ближайшем будущем. Кому подходит: - Продвинутым DS специалистам, которые хотят углубиться в тему NLP - Выпускникам и учащимся курсов ML-professional, ML-Advanced, NLP Отус - Исследователям и инженерам, работающими с LLM - Практикующим специалистам, которые хотят углубиться в область LLM Результаты урока: - познакомитесь с концепцией AI агентов и агентов на основе LLM - узнаете, какие принципы лежат в основе создания агентов - обсудите перспективы развития агентных систем Участвуйте и получите скидку для обучения на курсе «NLP. Advanced». 🔗 Ссылка на регистрацию: https://vk.cc/cKCA7C Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 043

🔎 Подборка вакансий для джунов Data Scientist (Middle) 🟢Python, SQL, Pandas, NumPy, Matplotlib 🟢Уровень дохода не указан | 3–6 лет Data Engineer (Middle) 🟢Python, Rust, SQL, ClickHouse, PostgreSQL, Greenplum, Airflow, Dagster, Prefect, Docker, Kubernetes 🟢от 200 000 ₽ | 1–3 года Data Scientist 🟢Python, SQL, A/B тесты, MLflow, DVC, Apache Airflow, Hadoop, Spark, LLM, NLP 🟢Уровень дохода не указан | 3–6 лет

20 043

⚙️ Что такое One-Hot Encoding в Data Science и зачем он используется? One-Hot Encoding — это способ преобразования категориальных признаков в числовые. Он создаёт бинарные столбцы для каждого уникального значения категории. Это важно, потому что большинство алгоритмов машинного обучения не работают напрямую с текстовыми значениями. ➡️ Пример:

import pandas as pd

df = pd.DataFrame({'Цвет': ['красный', 'синий', 'зелёный']})

encoded = pd.get_dummies(df)
print(encoded)

🗣️ В этом примере get_dummies() преобразует колонку Цвет в три бинарных признака: Цвет_красный, Цвет_синий, Цвет_зелёный. Для каждой строки только один из них равен 1, остальные — 0.

🖥 Подробнее тут

20 043

🖥 Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект Кратко о том, как Суцкевер стал не просто сооснователем OpenAI, а мозгом ChatGPT, почему ушёл в новый проект и зачем вообще создавать "безопасный сверхинтеллект". Читать...

20 043

🔎 Подборка вакансий для джунов Data engineer (junior) 🟢SQL, Linux, Scala (желательно), понимание ООП, ФП, MapReduce, архитектуры Hadoop YARN, HDFS, Apache Spark 🟢от 70 000 до 140 000 ₽ | Без опыта DATA-аналитик/Аналитик данных (Junior) 🟢T-SQL (MS SQL), Python (pandas, SQLAlchemy, requests), ETL, Excel, Power BI, DAX (приветствуется) 🟢95 000 ₽ | 1–3 года Data Scientist (Junior) 🟢Python, SQL, машинное обучение, статистика, анализ данных 🟢до 150 000 ₽ | 1–3 года

20 043

👩‍💻 Задачка по Python Напишите функцию, которая принимает DataFrame и заменяет отсутствующие значения (NaN) в каждом числовом столбце на среднее значение этого столбца. Если столбец содержит только NaN, оставьте его без изменений. ➡️ Пример:

   feature1  feature2  feature3
0       1.0      10.0       NaN
1       2.0       NaN       NaN
2       NaN      30.0       NaN
3       4.0      40.0       NaN

   feature1  feature2  feature3
0      1.00      10.0       NaN
1      2.00      26.7       NaN
2      2.33      30.0       NaN
3      4.00      40.0       NaN

Решение задачи ⬇️

import pandas as pd def fill_missing_with_mean(df): numeric_columns = df.select_dtypes(include=['float', 'int']) for column in numeric_columns: if df[column].notna().any(): # Проверяем, есть ли значения не NaN df[column] = df[column].fillna(df[column].mean()) return df # Пример использования: data = pd.DataFrame({ 'feature1': [1.0, 2.0, None, 4.0], 'feature2': [10.0, None, 30.0, 40.0], 'feature3': [None, None, None, None] }) result = fill_missing_with_mean(data) print(result)

20 043

🖥 Руководство по созданию приложения для поиска данных на основе агента GraphRAG Статья описывает приложение, объединяющее GraphRAG и AutoGen-агентов с локальными LLM от Ollama для автономного встраивания и вывода. Рассмотрены ключевые аспекты: интеграция знаний, настройка LLM, вызов функций и интерактивный интерфейс. Читать...

20 043

Последний шанс попасть на топовое событие по DS и AI 🚀 Остались считанные дни до закрытия регистрации на конференцию по AI и данным — Data Fusion 2025! Не упустите возможность присоединиться к большому DS-сообществу и узнать о новейших исследованиях и рабочих решениях. 💡 Более 250 экспертов расскажут, как они решают реальные задачи в DS. Вас ждут кейсы, дебаты и дискуссии на актуальные темы: ✔️ Как проектировать ML-инфраструктуру, которая не сломается на проде? ✔️ RAG и LLM в аналитике — как генеративные модели меняют Data Science? ✔️ Практики CDO, DataOps и новые подходы к обработке и хранению данных. Это только часть запланированных сессий — полная программа конференции на сайте: https://data-fusion.ru/programma2025.html Если хотите быть в центре ключевых изменений в индустрии Data Science, тогда Data Fusion 2025 — это must-have! 📌 Бесплатно. 16–17 апреля, Москва, технопарк «Ломоносов». Поторопитесь, регистрация скоро закроется — https://data-fusion.ru/. Ваша безопасность для нас приоритет, поэтому для участия в конференции мы просим заполнить развернутую форму. Благодарим за понимание! — *AI — искусственный интеллект *ML — машинное обучение *LLM — Large language model — большая языковая модель *DataOps — методология разработки и предоставления данных *DS — Data Science — наука о методах анализа данных *RAG — генерация с расширенным поиском

20 043

🔥 Самые интересные статьи за последние дни: • KAN: Kolmogorov–Arnold Networks • Стандартное отклонение для полных чайников • Почему галлюцинируют нейросети [и что с этим делают] • Понимает ли Vision Llama импрессионистов? • Что ищет он в краю далёком? Как найти смысл жизни с PostgreSQL

20 043

👩‍💻 Задачка по Python Напишите функцию, которая принимает список чисел и возвращает все значения, которые являются выбросами. Выбросы определяются как значения, которые находятся ниже первого квартиля (Q1) минус 1.5 * IQR или выше третьего квартиля (Q3) плюс 1.5 * IQR, где IQR — межквартильный размах. ➡️ Пример:

Входной список:
[10, 12, 14, 15, 15, 16, 16, 16, 17, 18, 19, 100]

Ожидаемый вывод:
[100]

Решение задачи ⬇️

import numpy as np def find_outliers(data): q1 = np.percentile(data, 25) q3 = np.percentile(data, 75) iqr = q3 - q1 lower_bound = q1 - 1.5 * iqr upper_bound = q3 + 1.5 * iqr return [x for x in data if x < lower_bound or x > upper_bound] # Пример использования: input_data = [10, 12, 14, 15, 15, 16, 16, 16, 17, 18, 19, 100] result = find_outliers(input_data) print(result) # Ожидаемый результат: [100]

20 043

– OpenAI представила новый голосовой ассистент, который теперь может в реальном времени анализировать изображение, речь и текст — конкуренция Siri и Alexa становится серьезной. – Google тестирует поиск с интеграцией ИИ-резюме, который меняет привычный способ продвижения сайтов. SEO-специалисты — держитесь! – TikTok анонсировал AI Creative Assistant — теперь ИИ помогает создавать и тестировать рекламные креативы за секунды. Хочешь быть в курсе последних новостей в мире ИИ/ИТ/маркетинга ? Мы собрали папку Telegram-каналов, где эксперты каждый день: https://t.me/addlist/gs3Io1EOk2lhNmEy ✔ разбирают тренды ✔ выкладывают кейсы ✔ делятся фреймворками, которые экономят десятки часов ✔ и сразу показывают, как использовать ИИ в маркетинге и ИТ на практике. 📂 Открой доступ к Telegram-папке → https://t.me/addlist/gs3Io1EOk2lhNmEy

20 043

🛍 Как базовые знания кодинга и нейросетей сэкономили нам больше 15 млн ₽ на Wildberries [скрины] Статья раскрывает процесс полной автоматизации создания карточек товаров для маркетплейсов, используя нейросети, Photoshop и немного креативного подхода. Описаны практические методы, которые экономят тысячи рублей на огромном ассортименте. Читать...

20 043

Мы в своих ML-моделях на столько преисполнились… Что ML-команда Купер.тех собрала новый материал для митапа! 24 апреля в 19:00 зовём на Data Science Meetup, соберёмся в Москве и онлайн! В программе доклады и QA-сессия: ⚡️Как мы делали матчинг в Купере». Николай Чугунников, Machine Learning Engineer, Купер.тех ⚡️«Uplift Space Oddity, или как запустить ML-космолёт и не упасть». Екатерина Апраксина, Machine Learning Engineer, Купер.тех ⚡️«Как делать рекомендации не с нуля». Александр Лоскутов, Machine Learning Team Lead, Купер.тех Регистрируйся, чтобы попасть в офлайн или не пропустить ссылку на трансляцию! Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: 2W5zFHodKNx