Data Science | Machinelearning [ru]

الذهاب إلى القناة على Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

إظهار المزيد

الشبكة:Frontender's notes [ru]روسيا33 739 التكنولوجيات والتطبيقات6 738...

📈 نظرة تحليلية على قناة تيليجرام Data Science | Machinelearning [ru]

تُعد قناة Data Science | Machinelearning [ru] (@devsp) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 20 041 مشتركاً، محتلاً المرتبة 6 738 في فئة التكنولوجيات والتطبيقات والمرتبة 33 739 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 20 041 مشتركاً.

بحسب آخر البيانات بتاريخ 14 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -87، وفي آخر 24 ساعة بمقدار -13، مع بقاء الوصول العام مرتفعاً.

حالة التحقق: غير موثّقة
معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 7.71‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 4.62‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
وصول المنشورات: يحصل كل منشور على متوسط 1 546 مشاهدة. وخلال اليوم الأول يجمع عادةً 926 مشاهدة.
التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 7.
الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, nvidia, контекст, openai, архитектура.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 15 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

20 041

المشتركون

-1324 ساعات

+257 أيام

-8730 أيام

1 546

عرض المشاهدات

~ 92624 ساعات

~ 1 11548 ساعات

7.71%

معدل المشاركة

~ 1

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

20 043

Алоха товарищи. Тут подкаст вышел интересный. Спикер - Антон Полднев — специалист по рекламным технологиям Яндекса с опытом свыше 10 лет. В подкасте он рассказывает о своем пути от стажера, который писал на Perl, до руководителя и делится инсайтами разработки высоконагруженных систем. Он объясняет, как работает рекомендательная система рекламы, как ML помогает предсказывать поведение пользователей и вероятность конверсии для бизнеса. ⠀ Ключевые моменты: 👉 Ответственность за рекламные технологии. 👉 Переход на C++ для повышения производительности. 👉 Внедрение нейросетей и машинного обучения. 👉 Важность командной работы и четкого распределения задач. 👉 Эксперименты и A/B-тесты для оптимизации решений. Также Антон рассказал про Perforator — opensource-инструмент, который помогает анализировать работу приложений на сервере в реальном времени. С помощью этого инструмента разработчики могут увидеть, как распределяются ресурсы серверов и какие программы расходуют их больше всего. Ссылки на подкаст 👉 YouTube 👉 VK 👉 Rutube

20 043

🔎 Подборка вакансий для сеньоров Ведущий Python разработчик 🟢Python, Django, Pydantic, SQL, NoSQL, AWS, Docker, Kubernetes, asyncio, aiohttp, RabbitMQ, Kafka 🟢Уровень дохода не указан | 3–6 лет Ведущий менеджер AI (Data Scientist) 🟢Python, машинное обучение, SQL, A/B тесты, NLP, deep learning, RNN, трансформеры, MLOps, DVC, MLflow, Airflow, Hadoop, Spark, LangChain, LangGraph, LLM 🟢Уровень дохода не указан | 3–6 лет Senior Data Analyst 🟢SQL, Python, Excel, BI tools (Tableau, PowerBI, Metabase) 🟢Уровень дохода не указан | 3–6 лет

20 043

⚙️ Неувядающая классика или «чёрный ящик»: кто кого в битве за прогноз. Глава вторая. Продолжение Статья продолжает разбор моделирования температурного временного ряда с двойной сезонностью. Основное внимание уделено подбору оптимальных параметров сезонной модели САРПСС для точного описания данных. Читать...

20 043

🖥 Про разработку LLM: какие ещё есть справочники и кукбуки В статье — разбор, почему собирать платформу инференса LLM с нуля не всегда разумно, и как MWS GPT помогает запускать большие языковые модели проще, быстрее и без лишнего сумасшествия. Читать...

20 043

📂 Мы делимся с вами папкой «ИИ & IT & DSGN», в которой собрали статьи с полезными советами от экспертов. ⚙ Внутри вас ждет: 🟠 Статья "Можете ли Вы отличить ИИ в общении?" 🟠 ИИ-ментор для новых сотрудников 🟠 Игровой помощник от Nvidia. 🟠 ИИ-инструменты для дизайнеров. 🟠 И еще 28 полезные статьи, которые прокачают ваши навыки. 🔗 А мы с вами делимся статьёй: «Распознавание ж/д пикетных столбиков по фотографиям с беспилотника на основе PyTorch и YOLOv5». ✔ Сохраняйте папку «ИИ & IT & DSGN», чтобы быть в курсе всех новостей в мире IT и не только!

20 043

👩‍💻 Постройте логистическую регрессию вручную Напишите простую реализацию логистической регрессии с нуля (без sklearn) для бинарной классификации. Это поможет лучше понять, как работает один из самых базовых алгоритмов в машинном обучении. Решение задачи🔽

import numpy as np # Сигмоида def sigmoid(z): return 1 / (1 + np.exp(-z)) # Функция логистической регрессии def logistic_regression(X, y, lr=0.1, epochs=1000): m, n = X.shape X = np.c_[np.ones(m), X] # добавляем bias theta = np.zeros(n + 1) for _ in range(epochs): z = np.dot(X, theta) h = sigmoid(z) gradient = np.dot(X.T, (h - y)) / m theta -= lr * gradient return theta # Предсказание def predict(X, theta): X = np.c_[np.ones(X.shape[0]), X] return sigmoid(np.dot(X, theta)) >= 0.5 # Пример X = np.array([[1], [2], [3], [4]]) y = np.array([0, 0, 1, 1]) theta = logistic_regression(X, y) print(predict(X, theta)) # [False False True True]

20 043

🖥 Как работает Трансформер: очень простое описание Вот очень простое объяснение для тех, кто не хочет вдаваться в сложную математику, но и не готов принимать эту ключевую технологию как магию, которая просто работает. Конечно, никакого волшебства тут и нет — идея на самом деле довольно проста.. Читать...

20 043

🤖 AI агенты на основе LLM: что нас ждет? Приглашаем на открытый урок. 🗓 14 апреля в 18:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced». Сегодня нейросети такие как ChatGPT, GPT4, GigaChat и другие из больших языковых моделей (LLMs), способных генерировать текст на очень высоком уровне, стремительно превращаются в AI агентов, по сути наших виртуальных ассистентов, способных взаимодействовать со средой, принимать решения и выполнять широкий набор команд. На вебинаре мы расскажем про то, что представляют из себя AI агенты сегодня и что нас ждет в ближайшем будущем. Кому подходит: - Продвинутым DS специалистам, которые хотят углубиться в тему NLP - Выпускникам и учащимся курсов ML-professional, ML-Advanced, NLP Отус - Исследователям и инженерам, работающими с LLM - Практикующим специалистам, которые хотят углубиться в область LLM Результаты урока: - познакомитесь с концепцией AI агентов и агентов на основе LLM - узнаете, какие принципы лежат в основе создания агентов - обсудите перспективы развития агентных систем Участвуйте и получите скидку для обучения на курсе «NLP. Advanced». 🔗 Ссылка на регистрацию: https://vk.cc/cKCA7C Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 043

🔎 Подборка вакансий для джунов Data Scientist (Middle) 🟢Python, SQL, Pandas, NumPy, Matplotlib 🟢Уровень дохода не указан | 3–6 лет Data Engineer (Middle) 🟢Python, Rust, SQL, ClickHouse, PostgreSQL, Greenplum, Airflow, Dagster, Prefect, Docker, Kubernetes 🟢от 200 000 ₽ | 1–3 года Data Scientist 🟢Python, SQL, A/B тесты, MLflow, DVC, Apache Airflow, Hadoop, Spark, LLM, NLP 🟢Уровень дохода не указан | 3–6 лет

20 043

⚙️ Что такое One-Hot Encoding в Data Science и зачем он используется? One-Hot Encoding — это способ преобразования категориальных признаков в числовые. Он создаёт бинарные столбцы для каждого уникального значения категории. Это важно, потому что большинство алгоритмов машинного обучения не работают напрямую с текстовыми значениями. ➡️ Пример:

import pandas as pd

df = pd.DataFrame({'Цвет': ['красный', 'синий', 'зелёный']})

encoded = pd.get_dummies(df)
print(encoded)

🗣️ В этом примере get_dummies() преобразует колонку Цвет в три бинарных признака: Цвет_красный, Цвет_синий, Цвет_зелёный. Для каждой строки только один из них равен 1, остальные — 0.

🖥 Подробнее тут

20 043

🖥 Ведущий разработчик ChatGPT и его новый проект — Безопасный Сверхинтеллект Кратко о том, как Суцкевер стал не просто сооснователем OpenAI, а мозгом ChatGPT, почему ушёл в новый проект и зачем вообще создавать "безопасный сверхинтеллект". Читать...

20 043

🔎 Подборка вакансий для джунов Data engineer (junior) 🟢SQL, Linux, Scala (желательно), понимание ООП, ФП, MapReduce, архитектуры Hadoop YARN, HDFS, Apache Spark 🟢от 70 000 до 140 000 ₽ | Без опыта DATA-аналитик/Аналитик данных (Junior) 🟢T-SQL (MS SQL), Python (pandas, SQLAlchemy, requests), ETL, Excel, Power BI, DAX (приветствуется) 🟢95 000 ₽ | 1–3 года Data Scientist (Junior) 🟢Python, SQL, машинное обучение, статистика, анализ данных 🟢до 150 000 ₽ | 1–3 года

20 043

👩‍💻 Задачка по Python Напишите функцию, которая принимает DataFrame и заменяет отсутствующие значения (NaN) в каждом числовом столбце на среднее значение этого столбца. Если столбец содержит только NaN, оставьте его без изменений. ➡️ Пример:

   feature1  feature2  feature3
0       1.0      10.0       NaN
1       2.0       NaN       NaN
2       NaN      30.0       NaN
3       4.0      40.0       NaN

   feature1  feature2  feature3
0      1.00      10.0       NaN
1      2.00      26.7       NaN
2      2.33      30.0       NaN
3      4.00      40.0       NaN

Решение задачи ⬇️

import pandas as pd def fill_missing_with_mean(df): numeric_columns = df.select_dtypes(include=['float', 'int']) for column in numeric_columns: if df[column].notna().any(): # Проверяем, есть ли значения не NaN df[column] = df[column].fillna(df[column].mean()) return df # Пример использования: data = pd.DataFrame({ 'feature1': [1.0, 2.0, None, 4.0], 'feature2': [10.0, None, 30.0, 40.0], 'feature3': [None, None, None, None] }) result = fill_missing_with_mean(data) print(result)

20 043

🖥 Руководство по созданию приложения для поиска данных на основе агента GraphRAG Статья описывает приложение, объединяющее GraphRAG и AutoGen-агентов с локальными LLM от Ollama для автономного встраивания и вывода. Рассмотрены ключевые аспекты: интеграция знаний, настройка LLM, вызов функций и интерактивный интерфейс. Читать...

20 043

Последний шанс попасть на топовое событие по DS и AI 🚀 Остались считанные дни до закрытия регистрации на конференцию по AI и данным — Data Fusion 2025! Не упустите возможность присоединиться к большому DS-сообществу и узнать о новейших исследованиях и рабочих решениях. 💡 Более 250 экспертов расскажут, как они решают реальные задачи в DS. Вас ждут кейсы, дебаты и дискуссии на актуальные темы: ✔️ Как проектировать ML-инфраструктуру, которая не сломается на проде? ✔️ RAG и LLM в аналитике — как генеративные модели меняют Data Science? ✔️ Практики CDO, DataOps и новые подходы к обработке и хранению данных. Это только часть запланированных сессий — полная программа конференции на сайте: https://data-fusion.ru/programma2025.html Если хотите быть в центре ключевых изменений в индустрии Data Science, тогда Data Fusion 2025 — это must-have! 📌 Бесплатно. 16–17 апреля, Москва, технопарк «Ломоносов». Поторопитесь, регистрация скоро закроется — https://data-fusion.ru/. Ваша безопасность для нас приоритет, поэтому для участия в конференции мы просим заполнить развернутую форму. Благодарим за понимание! — *AI — искусственный интеллект *ML — машинное обучение *LLM — Large language model — большая языковая модель *DataOps — методология разработки и предоставления данных *DS — Data Science — наука о методах анализа данных *RAG — генерация с расширенным поиском

20 043

🔥 Самые интересные статьи за последние дни: • KAN: Kolmogorov–Arnold Networks • Стандартное отклонение для полных чайников • Почему галлюцинируют нейросети [и что с этим делают] • Понимает ли Vision Llama импрессионистов? • Что ищет он в краю далёком? Как найти смысл жизни с PostgreSQL

20 043

👩‍💻 Задачка по Python Напишите функцию, которая принимает список чисел и возвращает все значения, которые являются выбросами. Выбросы определяются как значения, которые находятся ниже первого квартиля (Q1) минус 1.5 * IQR или выше третьего квартиля (Q3) плюс 1.5 * IQR, где IQR — межквартильный размах. ➡️ Пример:

Входной список:
[10, 12, 14, 15, 15, 16, 16, 16, 17, 18, 19, 100]

Ожидаемый вывод:
[100]

Решение задачи ⬇️

import numpy as np def find_outliers(data): q1 = np.percentile(data, 25) q3 = np.percentile(data, 75) iqr = q3 - q1 lower_bound = q1 - 1.5 * iqr upper_bound = q3 + 1.5 * iqr return [x for x in data if x < lower_bound or x > upper_bound] # Пример использования: input_data = [10, 12, 14, 15, 15, 16, 16, 16, 17, 18, 19, 100] result = find_outliers(input_data) print(result) # Ожидаемый результат: [100]

20 043

– OpenAI представила новый голосовой ассистент, который теперь может в реальном времени анализировать изображение, речь и текст — конкуренция Siri и Alexa становится серьезной. – Google тестирует поиск с интеграцией ИИ-резюме, который меняет привычный способ продвижения сайтов. SEO-специалисты — держитесь! – TikTok анонсировал AI Creative Assistant — теперь ИИ помогает создавать и тестировать рекламные креативы за секунды. Хочешь быть в курсе последних новостей в мире ИИ/ИТ/маркетинга ? Мы собрали папку Telegram-каналов, где эксперты каждый день: https://t.me/addlist/gs3Io1EOk2lhNmEy ✔ разбирают тренды ✔ выкладывают кейсы ✔ делятся фреймворками, которые экономят десятки часов ✔ и сразу показывают, как использовать ИИ в маркетинге и ИТ на практике. 📂 Открой доступ к Telegram-папке → https://t.me/addlist/gs3Io1EOk2lhNmEy

20 043

🛍 Как базовые знания кодинга и нейросетей сэкономили нам больше 15 млн ₽ на Wildberries [скрины] Статья раскрывает процесс полной автоматизации создания карточек товаров для маркетплейсов, используя нейросети, Photoshop и немного креативного подхода. Описаны практические методы, которые экономят тысячи рублей на огромном ассортименте. Читать...

20 043

Мы в своих ML-моделях на столько преисполнились… Что ML-команда Купер.тех собрала новый материал для митапа! 24 апреля в 19:00 зовём на Data Science Meetup, соберёмся в Москве и онлайн! В программе доклады и QA-сессия: ⚡️Как мы делали матчинг в Купере». Николай Чугунников, Machine Learning Engineer, Купер.тех ⚡️«Uplift Space Oddity, или как запустить ML-космолёт и не упасть». Екатерина Апраксина, Machine Learning Engineer, Купер.тех ⚡️«Как делать рекомендации не с нуля». Александр Лоскутов, Machine Learning Team Lead, Купер.тех Регистрируйся, чтобы попасть в офлайн или не пропустить ссылку на трансляцию! Реклама. ООО «ИНСТАМАРТ СЕРВИС», ИНН: 9705118142. Ерид: 2W5zFHodKNx