Data Science | Machinelearning [ru]

Ir al canal en Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Red:Frontender's notes [ru]Rusia33 739 Tecnologías y Aplicaciones6 738...

📈 Análisis del canal de Telegram Data Science | Machinelearning [ru]

El canal Data Science | Machinelearning [ru] (@devsp) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 20 045 suscriptores, ocupando la posición 6 738 en la categoría Tecnologías y Aplicaciones y el puesto 33 739 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 20 045 suscriptores.

Según los últimos datos del 14 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -87, y en las últimas 24 horas de -13, conservando un alto alcance.

Estado de verificación: No verificado
Tasa de interacción (ER): El promedio de interacción de la audiencia es 7.71%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 4.62% de reacciones respecto al total de suscriptores.
Alcance de las publicaciones: Cada publicación recibe en promedio 1 546 visualizaciones. En el primer día suele acumular 926 visualizaciones.
Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 7.
Intereses temáticos: El contenido se centra en temas clave como llm, nvidia, контекст, openai, архитектура.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 15 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

20 045

Suscriptores

-1324 horas

+257 días

-8730 días

1 546

Visitas de la publicación

~ 92624 horas

~ 1 11548 horas

7.71%

Tasa de compromiso

~ 1

Mensajes por día

Ads index

beta

Archivo de publicaciones

20 045

👩‍💻 Оценка точности модели классификации (Accuracy Score) Напишите функцию, которая вычисляет accuracy score — долю правильных предсказаний модели классификации. Это базовая метрика, часто используемая для оценки качества модели. Функция работает следующим образом:

• Сравнивает каждую пару истинного (y_true) и предсказанного (y_pred) значения. • Считает количество совпадений. • Делит число правильных предсказаний на общее количество примеров

Решение задачи🔽

def accuracy_score(y_true, y_pred): correct = sum(1 for true, pred in zip(y_true, y_pred) if true == pred) return correct / len(y_true) # Примеры использования y_true = [0, 1, 1, 0, 1] y_pred = [0, 0, 1, 0, 1] print(accuracy_score(y_true, y_pred)) # Ожидаемый результат: 0.8

20 045

⚙️ ML на «плюсах»: 5 материалов о необычном подходе к обучению моделей В статье показывают, как и зачем использовать C++ в машинном обучении: распознавание лиц, объекты в реальном времени и прирост в производительности без питоньих зависимостей Читать...

20 045

Data Fest 2025 в гостях у VK — офлайн 24 мая 🤩 Открываем конференцию Data Fest 2025 — в офисе VK. Приходите познакомиться с опытом дата-инженеров и исследователей в направлениях LLM, NLP, MLOps и других. Эксперты VK подготовили секцию докладов о RecSys, Reliable ML и карьере тимлида. Афтепати с розыгрышем призов и нетворкингом прилагается. 📍 Встречаемся 24 мая по адресу: Ленинградский проспект, 39, стр. 79, БЦ Skylight, башня А. 🤗 Регистрация уже открыта. Количество мест ограничено, поэтому заполняйте анкету внимательно.

20 045

⚙️ Claude, есть пробитие: взламываем самую защищенную модель В статье показывают, как обойти фильтры модели Claude с помощью модифицированного метода внедрения системных директив, чтобы заставить её выполнять запрещённые инструкции Читать...

20 045

👩‍💻 Что такое обучение с учителем (supervised learning) в ML? Обучение с учителем — это тип машинного обучения, при котором модель обучается на размеченных данных. Каждый пример содержит вход (features) и правильный ответ (label), который модель должна научиться предсказывать. ➡️ Пример:

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

model = LogisticRegression()
model.fit(X_train, y_train)

print("Предсказания:", model.predict(X_test[:5]))

🗣️ В этом примере модель обучается на данных о цветах и учится определять их вид (например, ирис сетоса).

Это классический пример классификации — подтипа обучения с учителем. 🖥 Подробнее тут

20 045

⚙️ Как я не дал ИИ сойти с ума: гайд по промптам и багам В статье — почему нейросети галлюцинируют, примеры «дорогих» ошибок, и промпты для тех, кто работает с кодом, текстами и дизайном. Читать...

20 045

7–8 июня проводим Weekend Offer Analytics Устроиться в Яндекс за выходные — реально. Ищем крутых аналитиков с опытом работы от 3 лет на Python, готовых работать в офисном или гибридном режиме. Подавайте заявку до 3 июня — и всего за 2 дня пройдите технические собеседования. После сможете пообщаться с двенадцатью нанимающими командами и выбрать ту, которая покажется самой интересной. Если всё сложится хорошо, сразу же пришлём вам офер. Узнать подробности и зарегистрироваться.

20 045

🔎 Подборка вакансий для джунов Junior Data Engineer - Mindbox 🟢 Python, SQL, ООП, C#, Spark, Kafka, Airflow 🟢 До 200 000 ₽ | 1–3 года | Удалёнка/Гибрид/На месте Data Engineer [Junior] - Диплей 🟢 Python, Apache Airflow, pandas, NumPy, SQL, ClickHouse 🟢 Доход не указан | 1–3 года | Удалёнка Junior Data Analyst - Forvis Mazars 🟢 SQL, Power BI, Tableau, Pandas, Numpy, Matplotlib, Excel 🟢 Доход не указан | Нет опыта | Удалёнка/Гибрид

20 045

🌟 Откройте новые горизонты с курсом «Machine Learning. Professional»! 🌟 Хотите прокачать свои навыки в области машинного обучения? Пройдите короткое вступительное тестирование и получите скидку на обучение! 🎓💰 За всего 5 месяцев вы освоите ключевые модели машинного обучения, включая: — Обработку естественного языка (NLP) — Глубокое обучение (DL) — Рекомендательные системы 👩‍🏫 Занятия проводятся опытными наставниками, а также вас ждёт реальная практика и проекты, которые значительно усилят ваше портфолио. Готовы к новым вызовам и хотите расширить свои карьерные горизонты? Узнайте подробности и получите выгодные условия прямо сейчас: https://vk.cc/cM5tmz Не упустите свой шанс! 🚀 Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 045

👩‍💻 Normalization of Numerical Data Напишите функцию, которая принимает список чисел и нормализует его, преобразуя значения в диапазон от 0 до 1. Это полезно для подготовки данных перед обучением модели машинного обучения. ➡️ Функция работает следующим образом:

• Находит минимальное и максимальное значение в списке. • Вычисляет нормализованное значение для каждого элемента по формуле: normalized = (𝑥 − min) / max − min) • Возвращает новый список с нормализованными значениями.

Решение задачи🔽

def normalize(data): min_val = min(data) max_val = max(data) # Избегаем деления на ноль, если все элементы равны if max_val == min_val: return [0.0] * len(data) return [(x - min_val) / (max_val - min_val) for x in data] # Примеры использования data = [10, 20, 30, 40, 50] print(normalize(data)) # Ожидаемый результат: [0.0, 0.25, 0.5, 0.75, 1.0]

20 045

Премиальный квартал PRIDE: 1/5 квартиры в подарок Всего 15 минут от Цветного бульвара – и вы у себя дома. В семейном квартале PRIDE вас ждет идеальная среда для жизни: - Выбирайте свой стиль — 2 варианта дизайнерской отделки. - Простор и свет в каждом метре — панорамные окна и большие террасы. - Свой оазис — сад ароматов, пешеходный бульвар и приватные дворы для игр, отдыха и спорта. - Лобби как в 5*отеле от бюро Sundukovy Sisters. - Всё для счастья детей — собственный детский сад и школа. - Клубная инфраструктура - спортзал со спа, переговорная, коворкинг, детская и лаунж зоны. ⚡До 31.05 на выделенный пул квартир действуют специальные условия с выгодой до 12 млн рублей. Узнать больше Проектная декларация на сайте https://наш.дом.рф/. Застройщик: ООО "СЗ "ЛАЙФ САВЕЛОВСКАЯ" #реклама pride-home.ru О рекламодателе

20 045

⚙️ Генерация видео: Обзор интересных подходов | Text-2-video | Part 1 В статье разбирают основные методы генерации видео на основе текста (T2V): от адаптации T2I с AnimateDiff до новинок 2025 года вроде Wan2.1 и HunyuanVideo. Первая часть обзора Читать...

20 045

⚙️ Автоматизация верификации кодовых датасетов подрядчиков с помощью LLM: снизили брак на 40% и сократили стоимость на 60% Статья рассказывает, как автоматизация на основе LLM ускорила верификацию данных и сократила ошибки в производственной цепочке. Узнаете, как это помогло заказчику сэкономить ресурсы и время. Читать...

20 045

👩‍💻 Выявление тренда в временном ряде Напишите Python-скрипт, который принимает временной ряд в виде pandas.Series и определяет тренд: восходящий, нисходящий или отсутствие тренда. Решение должно быть простым и лаконичным. ➡️ Пример:

import pandas as pd
import numpy as np

# Генерация данных
date_range = pd.date_range(start="2020-01-01", periods=12, freq="M")
values = np.linspace(10, 20, 12) + np.random.normal(0, 0.5, 12)
time_series = pd.Series(data=values, index=date_range)

result = detect_trend(time_series)
print(result)  # Ожидаемый результат: "Восходящий тренд"

Решение задачи🔽

import numpy as np def detect_trend(series): x = np.arange(len(series)) slope = np.polyfit(x, series.values, 1)[0] if slope > 0: return "Восходящий тренд" elif slope < 0: return "Нисходящий тренд" else: return "Тренд отсутствует" # Пример использования import pandas as pd import numpy as np date_range = pd.date_range(start="2020-01-01", periods=12, freq="M") values = np.linspace(10, 20, 12) + np.random.normal(0, 0.5, 12) time_series = pd.Series(data=values, index=date_range) print(detect_trend(time_series))

20 045

🔫 Claude сопротивляется Исследование Anthropic показывает, как их ИИ Claude мог притворяться злым, чтобы избежать «переобучения». Модель следовала поддельным документам для бесплатных пользователей, но сопротивлялась для премиум-аудитории. Читать...

20 045

🔥 Самые интересные статьи за последние дни: • Всё, что вы хотели знать о Django Channels • Сборка Python проекта с uv и Docker • DE-1. DIY ассистент на LLM • Ваши генераторные выражения сломаны: чиним и разбираемся • Всё, что вы хотели знать о Django Channels

20 045

🎯 Разделяй свои задачи на «узкие» и «широкие» Иногда ты работаешь над узкой проблемой (например, багом в функции), а иногда — над широкой (архитектурное решение). Легко запутаться, если смешивать такие задачи. 👉 Совет: планируй работу так, чтобы «узкие» задачи чередовались с «широкими». Так мозг не перегружается и сохраняется баланс между точечной работой и глобальным видением проекта.

20 045

👩‍💻 Пишем свой PyTorch на NumPy. Часть 1 PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов для обучения моделей. В этой статье мы реализуем собственную библиотеку машинного обучения на NumPy! Читать...

20 045

🤔 ИИ с человеческим лицом: какие ошибки повторяют модели и что с этим делать В статье рассказывают, почему ИИ, как и люди, подвержен когнитивным искажениям: самоуверенность, предвзятость и шаблонное мышление — как это влияет на бизнес и технологии Читать...

20 045

Алоха, товарищи! Недавно в Сингапуре завершилась одна из главных конференций в мире ML — ICLR 2025, и Яндекс приглашает обсудить самые интересные доклады. Где и когда проходит: 20 мая в офисе на Льва Толстого, 16 (или онлайн) пройдёт Yandex ICLR Recap — вечер инсайтов, мнений и прогнозов от сильных спикеров Яндекса. Кто выступает: 👉 Артём Бабенко, руководитель отдела Research — расскажет, что нового в мире tabular DL и как меняются подходы к работе с табличными данными. 👉 Андрей Бут, лидер команды YandexGPT Alignment — даст срез по NLP: какие задачи сейчас на пике, что получилось, а что нет. 👉 Роман Исаченко, руководитель направления CV — покажет, как развивается компьютерное зрение и в какую сторону движется сообщество. 👉 Алексей Степанов, CTO международного поиска — поделится тем, как современные идеи ICLR применимы к ML-инженерии и поиску. Будем обсуждать и делиться мнениями. Можно немного по холиварить. Это отличный шанс свериться с глобальной повесткой. Регистрация уже открыта. До встречи на рекапе