Data Science | Machinelearning [ru]

Ir al canal en Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Red:Frontender's notes [ru]Rusia33 725 Tecnologías y Aplicaciones6 726...

📈 Análisis del canal de Telegram Data Science | Machinelearning [ru]

El canal Data Science | Machinelearning [ru] (@devsp) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 20 028 suscriptores, ocupando la posición 6 726 en la categoría Tecnologías y Aplicaciones y el puesto 33 725 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 20 028 suscriptores.

Según los últimos datos del 18 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -63, y en las últimas 24 horas de -3, conservando un alto alcance.

Estado de verificación: No verificado
Tasa de interacción (ER): El promedio de interacción de la audiencia es 8.21%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 4.21% de reacciones respecto al total de suscriptores.
Alcance de las publicaciones: Cada publicación recibe en promedio 1 645 visualizaciones. En el primer día suele acumular 843 visualizaciones.
Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 7.
Intereses temáticos: El contenido se centra en temas clave como llm, nvidia, контекст, openai, архитектура.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 19 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

20 028

Suscriptores

-324 horas

-507 días

-6330 días

1 645

Visitas de la publicación

~ 84324 horas

~ 1 00948 horas

8.21%

Tasa de compromiso

~ 1

Mensajes por día

Ads index

beta

Archivo de publicaciones

20 028

Встречаемся на митапе для бизнес-аналитиков! На Business Analysis Day ты погрузишься в актуальные темы и тренды бизнес-анализа вместе со спикерами Газпромбанк.Тех, Росбанка, X5 Tech и других компаний! Эксперты поделятся инсайтами и ответят на вопросы: – Может ли эмпатия сделать бизнес-продукт лучше? – Как поменять образ мышления разработчиков в банке? – Чем отличаются «умные чат-боты» от традиционных? А в перерыве между выступлениями ты сможешь поучаствовать в активностях от экспертов Газпромбанк.Тех, пообщаться с другими гостями и обсудить все технические детали. Регистрируйся по ссылке и приходи 25 декабря к нам в гости. Реклама, Банк ГПБ (АО), ИНН: 7744001497, erid: 2Vtzqvqjcmp

20 028

🔎 Подборка вакансий для джунов Junior Аналитик данных 🟢MySQL, Metabase, Python (pandas, NumPy) 🟢от 30 000 до 50 000 ₽ | 1–3 года опыта Junior Data Engineer (Analyst) 🟢SQL, Qlik Sense, Grafana, Python, PostgreSQL 🟢от 250 000 ₸ до вычета налогов | Без опыта Junior Python Backend разработчик 🟢Python, FastAPI, PostgreSQL, SQLAlchemy 🟢от 40 000 ₽ | Без опыта

20 028

👩‍💻 Парсинг и подсчёт количества слов в текстовом файле Напишите функцию на Python, которая принимает путь к текстовому файлу и возвращает словарь с подсчётом количества уникальных слов. Слова должны сравниваться без учёта регистра, а знаки препинания должны быть удалены. Пример:

# Содержимое файла example.txt:
# "Hello, world! This is a test. Hello again."

result = count_words_in_file("example.txt")
print(result)
# Ожидаемый результат:
# {'hello': 2, 'world': 1, 'this': 1, 'is': 1, 'a': 1, 'test': 1, 'again': 1}

Решение задачи🔽

import string from collections import Counter def count_words_in_file(file_path): with open(file_path, 'r', encoding='utf-8') as f: text = f.read().lower() text = text.translate(str.maketrans('', '', string.punctuation)) words = text.split() return dict(Counter(words)) # Пример использования result = count_words_in_file("example.txt") print(result)

20 028

🧠 Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц Как машинное обучение помогает управлять ускорителями частиц? В статье раскрываются примеры применения нейронных сетей, обучения с подкреплением и байесовской оптимизации для стабилизации и настройки пучков частиц. Читать...

20 028

Приглашаем вас на открытый вебинар: «Технологии NLP сегодня: основные тренды в области и перспективы развития» ⏰Дата: 25 декабря в 18:00 мск Спикер: Мария Тихонова 📚На занятии мы обсудим: - Из чего складывается область NLP - Поговорим про последние тренды в этой сфере, возникшие с появлением современных LLM. 🔥Результаты урока: - Вы поймете, где применяются методы NLP - Узнаете основные тренды и перспективы развития методов NLP - Узнаете современное состояние области в связи с быстрым развитием LLM 🧩Кому подходит этот урок: - IT-специалистам, которые хотят расширить свои знания в Data Science - Дата-сайентистам, желающим углубить свои знания по автоматической обработке текстов - Тем кто самостоятельно изучает Data Science Участники всех открытых уроков получат скидку🎁 на большое обучение 👉Регистрируйтесь на открытый вебинар по ссылке: https://vk.cc/cGkS1o Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 028

🔥 Самые интересные статьи за последние дни: • Что читали на Хабре в 2024 году: анализ статей с Node.js, Google Sheets и каплей ChatGPT • Поднимаем в облаке расшифровку речи в текст с помощью нейросетей. VPS на пределе возможностей • Стоит ли ChatGPT о1 Pro своих денег? Небольшой тест-драйв модели • Возможности LLM и RAG на примере реализации бота для поддержки клиентов • Гетерогенные вычисления: проектирование и разработка вычислительной системы для нейросетей

20 028

🤖 Обзор 4 новых инструментов AI для программирования: v0, Bolt.new, Cursor, Windsurf Обзор четырёх инструментов для разработчиков: v0, Bolt.new, Cursor и Windsurf. Сравнение функций, сценариев использования и цен поможет выбрать подходящее решение для повышения продуктивности и оптимизации процессов. Читать...

20 028

Новогодний коллаб Cloud.ru х Самокат Cloud․ru — это провайдер облачных сервисов и AI-технологий, который делает доступ к облакам и искусственному интеллекту простым и удобным. Компания заботится о клиентах во всех аспектах: от сохранности их инфраструктуры в облаке до предоставления простых и удобных сервисов. Cloud․ru вместе с Самокатом позаботились о здоровом перекусе айтишников. Для этого создали специальный снек-бокс, который до 31.12 получат 22 000 счастливчиков в Москве и Питере вместе со своими заказами. А для всех пользователей Самоката заботливо собрали подборку быстрых перекусов. Переходите по ссылке и по промокоду CLOUDRU вы получите скидку 100 рублей при заказе товаров из подборки от 500 рублей. Реклама. ООО "Умный ритейл", ИНН 7811657720. erid: 2VtzqwfLH2r

20 028

🔎 Подборка зарубежных вакансий Data Scientist | Data Analyst 🟢Python, SQL, Power BI, AI (GPT, AutoGPT, Langchain), DWH, BigQuery, Snowflake, Redshift 🟢от 2 000 $ на руки | 1–3 года Marketing Analyst 🟢SQL, Power BI, Marketing Analysis, Google Analytics, Business English, API 🟢от 2 500 до 4 000 $ до вычета налогов | 1–3 года Senior Data Scientist 🟢Python, SQL, RecSys, Uplift Modeling, Churn Prediction, LTV Prediction, Forecasting, MLOps 🟢от 4 500 до 6 500 $ до вычета налогов | Более 6 лет

20 028

🧠 Machine Learning — авторский канал, где собрана вся база по ИИ и машинному обучению. Senior разработчик AI-алгоритмов и автономных агентов, разбирает гайды, редкую литературу и код топовых моделей машинного обучения и искусственного интеллекта. В 2025 году ИИ выйдет на совершенно новый уровень тот, кто не успеет за прогрессом - отстанет, а кто разберется - сорвет куш. Стоит подписаться: t.me/ai_machinelearning_big_data

20 028

🤔 Стоит ли ChatGPT о1 Pro своих денег? Небольшой тест-драйв модели В статье предлагается протестировать новую модель o1 в режиме pro, сравнить её с ChatGPT o1 и ChatGPT 4o. Разберёмся, насколько она оправдывает свою стоимость и как показывает себя на практике. Читать...

20 028

Интересуетесь промышленной робототехникой, хотите начать карьеру, улучшить навыки или роботизировать производство? Центр развития промышленной робототехники Университета Иннополис объединяет вузы, центры разработки, малый и крупный бизнес. В ролике руководители и директор Университета Иннополис рассказывают о центре, а новости и тренды отечественной робототехники ищите на канале ЦРР. Здесь вы: 🟡 узнаете, где пройти обучение для карьеры в робототехнике; 🟡 поймёте, почему роботизация предприятий — это уже реальность; 🟡 увидите, как реализуются сложные проекты роботизации; 🟡 примете участие в вебинарах, форумах и лекциях; 🟡 сможете поучаствовать в квизах и играх. Сейчас на канале проходит новогодний розыгрыш подарков от Центра и ведущих робототехнических компаний. ⚡️ Подписывайтесь, чтобы выиграть призы и ничего не пропустить! Реклама. АНО ВО "УНИВЕРСИТЕТ ИННОПОЛИС". ИНН 1655258235.

20 028

🔎 Подборка вакансий для лидов AI Data Group Lead 🟢Python, TensorFlow, PyTorch, Scikit-learn, Oracle DWH, Hadoop, SQL, Jupyter, Pandas, Matplotlib 🟢Уровень дохода не указан | 1–3 года Team Lead Data Scientist 🟢Python, SQL, RecSys, Uplift Modeling, Churn Prediction, LTV Prediction, Forecasting, MLOps 🟢Уровень дохода не указан | Более 6 лет Team Lead Data Analyst 🟢SQL, Python, ClickHouse, Power BI, Redash, Superset, Metabase, dbt, Airflow 🟢от 300 000 до 450 000 ₽ на руки | 3–6 лет

20 028

Большая языковая модель от MTS AI выйдет уже в первом квартале 2025 года. О завершении бета-теста нейронки упомянул председатель совета директоров МТС Вячеслав Николаев на Дне инвестора. Это будет LLM для корпоративного использования. В лидерборде бенчмарка MERA она заняла второе место, однако по многим параметрам обошла GPT4o и OpenAI. Например, Cotype лучше связывает факты из предоставленного текста и обладает более глубокими знаниями о мире. Также она помогает сократить до четырех часов рабочего времени, избавляя сотрудников от рутинных задач. В открытом доступе модель появится в начале 2025 года.

20 028

⚙️ Что такое PCA (Principal Component Analysis) в машинном обучении и зачем он используется? PCA — это метод снижения размерности, который преобразует исходные переменные в новый набор переменных (компонент), сохраняя как можно больше информации. Он помогает ускорить обучение моделей и уменьшить переобучение. ➡️ Пример:

import numpy as np
from sklearn.decomposition import PCA
from sklearn.datasets import load_iris

# Загрузка данных
data = load_iris()
X = data.data

# Применение PCA для снижения размерности до 2 компонент
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)

print(X_pca[:5])  # Преобразованные данные

🗣️ В этом примере PCA снижает размерность данных Iris с 4 до 2 компонент. Это позволяет визуализировать данные и ускорить работу моделей, сохраняя основную информацию.

🖥 Подробнее тут

20 028

🔧 ТОП-10 опенсорсных инструментов для работы с ИИ в 2025 году Детальный разбор 10 самых перспективных инструментов для работы с ИИ в 2025 году. От создания умных ассистентов до построения мощных RAG-систем — разбираем возможности, сравниваем производительность, безопасность и простоту интеграции каждого решения. Читать...

20 028

Весь декабрь в Яндекс Образовании посвящают математическим наукам — специально ко дню математика вместе с факультетом компьютерных наук НИУ ВШЭ запустили хендбук. Это бесплатный онлайн-учебник по математике для увлеченных IT — с квизами, самостоятельными заданиями, примерами кода. Пригодится всем, кто хочет к новому году подтянуть знания для аналитики, машинного и глубинного обучения. Первая глава посвящена графам, с помощью которых можно описать все вокруг — от сети друзей ВКонтакте до связи между философскими концепциями. А еще решать реальные задачи бизнеса. Например, строить оптимальные маршруты перевозок. Помните что-то о графах? Тогда вот задачка для разминки.

20 028

📈 Подборка статей для вашей карьеры • Вся правда о еженедельных созвонах, или Зачем переливать из пустого в порожнее? • Тяжела и неказиста жизнь простого RnD. Часть первая: как работают с новыми технологиями в крупных компаниях • Прийти на внедренный проект на этапе развития системы: как аналитику быстро погрузиться в процессы • Как гуманитарию подойти к IT: из переводчика в технические писатели • Поздравляем, вы DevOps-инженер. Как найти себя в необъятном мире ИТ

20 028

🔎 Подборка вакансий для сеньоров Senior Data Engineer (MedTech) 🟢Python, SQL, Java, ETL, Docker, Kubernetes, Redshift, BigQuery 🟢до 350 000 ₽ на руки | 3–6 лет Data Architect (MedTech) 🟢SQL, ETL, PostgreSQL, Docker, Kubernetes, Data Warehousing, BI, Agile 🟢до 450 000 ₽ на руки | Более 6 лет Senior Data Scientist 🟢Python, SQL, RecSys, Uplift Modeling, Churn Prediction, LTV Prediction, Forecasting, MLOps 🟢от 4 500 до 6 500 $ до вычета налогов | Более 6 лет Senior Python Dev (AI, Big Data, LLM) 🟢Python, Big Data, ClickHouse, Time Series Analysis, Golang, AI, LLM, WebSocket 🟢от 3 000 $ до вычета налогов | 3–6 лет

20 028

Repost from .ml

Как LLM могут помочь в классическом ML? По статистике, специалисты по Data Science тратят до 70% рабочего времени на этап Feature Engineering, то есть отбирают наиболее важные признаки в данных и формируют новые, более информативные, датасеты. Кажется, с этой рутинной задачей отлично справится LLM. Но нет — в итоге 64% времени уйдёт на подготовку промптов. Исследователи предлагают новые решения проблемы, одно из них — FELIX (Feature Engineering with LLMs for Interpretability and Explainability). Всё, что нужно для получения готовых фич — сам датасет и его короткий контекст. Дальше FELIX делает следующее: ✏️ Из случайных групп сэмплов датасета LLM генерирует численных и категориальных кандидатов в новые признаки. ✏️ С помощью кластеризации эмбеддингов похожие признаки отбрасываются. ✏️ Из полученных признаков отбрасываются те, что дают наименьшую объяснимость. Метод эффективен для текстовых данных и сильно превосходит TF-IDF и трансформерные эмбеддинги от RoBERT. Если вам интересно, расскажем и о преобразовании других типов данных в новых постах!