Data Science | Machinelearning [ru]

Kanalga Telegram’da o‘tish

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Ko'proq ko'rsatish

Tarmoq:Frontender's notes [ru]Rossiya33 739 Texnologiyalar & Aralashmalar6 738...

📈 Telegram kanali Data Science | Machinelearning [ru] analitikasi

Data Science | Machinelearning [ru] (@devsp) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 20 045 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 6 738-o'rinni va Rossiya mintaqasida 33 739-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 20 045 obunachiga ega bo‘ldi.

14 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -87 ga, so‘nggi 24 soatda esa -13 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 7.71% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 4.62% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 1 546 marta ko‘riladi; birinchi sutkada odatda 926 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 7 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, nvidia, контекст, openai, архитектура kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 15 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

20 045

Obunachilar

-1324 soatlar

+257 kunlar

-8730 kunlar

1 546

Post ko'rishlar

~ 92624 soatlar

~ 1 11548 soatlar

7.71%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

20 045

👩‍💻 Оценка точности модели классификации (Accuracy Score) Напишите функцию, которая вычисляет accuracy score — долю правильных предсказаний модели классификации. Это базовая метрика, часто используемая для оценки качества модели. Функция работает следующим образом:

• Сравнивает каждую пару истинного (y_true) и предсказанного (y_pred) значения. • Считает количество совпадений. • Делит число правильных предсказаний на общее количество примеров

Решение задачи🔽

def accuracy_score(y_true, y_pred): correct = sum(1 for true, pred in zip(y_true, y_pred) if true == pred) return correct / len(y_true) # Примеры использования y_true = [0, 1, 1, 0, 1] y_pred = [0, 0, 1, 0, 1] print(accuracy_score(y_true, y_pred)) # Ожидаемый результат: 0.8

20 045

⚙️ ML на «плюсах»: 5 материалов о необычном подходе к обучению моделей В статье показывают, как и зачем использовать C++ в машинном обучении: распознавание лиц, объекты в реальном времени и прирост в производительности без питоньих зависимостей Читать...

20 045

Data Fest 2025 в гостях у VK — офлайн 24 мая 🤩 Открываем конференцию Data Fest 2025 — в офисе VK. Приходите познакомиться с опытом дата-инженеров и исследователей в направлениях LLM, NLP, MLOps и других. Эксперты VK подготовили секцию докладов о RecSys, Reliable ML и карьере тимлида. Афтепати с розыгрышем призов и нетворкингом прилагается. 📍 Встречаемся 24 мая по адресу: Ленинградский проспект, 39, стр. 79, БЦ Skylight, башня А. 🤗 Регистрация уже открыта. Количество мест ограничено, поэтому заполняйте анкету внимательно.

20 045

⚙️ Claude, есть пробитие: взламываем самую защищенную модель В статье показывают, как обойти фильтры модели Claude с помощью модифицированного метода внедрения системных директив, чтобы заставить её выполнять запрещённые инструкции Читать...

20 045

👩‍💻 Что такое обучение с учителем (supervised learning) в ML? Обучение с учителем — это тип машинного обучения, при котором модель обучается на размеченных данных. Каждый пример содержит вход (features) и правильный ответ (label), который модель должна научиться предсказывать. ➡️ Пример:

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

model = LogisticRegression()
model.fit(X_train, y_train)

print("Предсказания:", model.predict(X_test[:5]))

🗣️ В этом примере модель обучается на данных о цветах и учится определять их вид (например, ирис сетоса).

Это классический пример классификации — подтипа обучения с учителем. 🖥 Подробнее тут

20 045

⚙️ Как я не дал ИИ сойти с ума: гайд по промптам и багам В статье — почему нейросети галлюцинируют, примеры «дорогих» ошибок, и промпты для тех, кто работает с кодом, текстами и дизайном. Читать...

20 045

7–8 июня проводим Weekend Offer Analytics Устроиться в Яндекс за выходные — реально. Ищем крутых аналитиков с опытом работы от 3 лет на Python, готовых работать в офисном или гибридном режиме. Подавайте заявку до 3 июня — и всего за 2 дня пройдите технические собеседования. После сможете пообщаться с двенадцатью нанимающими командами и выбрать ту, которая покажется самой интересной. Если всё сложится хорошо, сразу же пришлём вам офер. Узнать подробности и зарегистрироваться.

20 045

🔎 Подборка вакансий для джунов Junior Data Engineer - Mindbox 🟢 Python, SQL, ООП, C#, Spark, Kafka, Airflow 🟢 До 200 000 ₽ | 1–3 года | Удалёнка/Гибрид/На месте Data Engineer [Junior] - Диплей 🟢 Python, Apache Airflow, pandas, NumPy, SQL, ClickHouse 🟢 Доход не указан | 1–3 года | Удалёнка Junior Data Analyst - Forvis Mazars 🟢 SQL, Power BI, Tableau, Pandas, Numpy, Matplotlib, Excel 🟢 Доход не указан | Нет опыта | Удалёнка/Гибрид

20 045

🌟 Откройте новые горизонты с курсом «Machine Learning. Professional»! 🌟 Хотите прокачать свои навыки в области машинного обучения? Пройдите короткое вступительное тестирование и получите скидку на обучение! 🎓💰 За всего 5 месяцев вы освоите ключевые модели машинного обучения, включая: — Обработку естественного языка (NLP) — Глубокое обучение (DL) — Рекомендательные системы 👩‍🏫 Занятия проводятся опытными наставниками, а также вас ждёт реальная практика и проекты, которые значительно усилят ваше портфолио. Готовы к новым вызовам и хотите расширить свои карьерные горизонты? Узнайте подробности и получите выгодные условия прямо сейчас: https://vk.cc/cM5tmz Не упустите свой шанс! 🚀 Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 045

👩‍💻 Normalization of Numerical Data Напишите функцию, которая принимает список чисел и нормализует его, преобразуя значения в диапазон от 0 до 1. Это полезно для подготовки данных перед обучением модели машинного обучения. ➡️ Функция работает следующим образом:

• Находит минимальное и максимальное значение в списке. • Вычисляет нормализованное значение для каждого элемента по формуле: normalized = (𝑥 − min) / max − min) • Возвращает новый список с нормализованными значениями.

Решение задачи🔽

def normalize(data): min_val = min(data) max_val = max(data) # Избегаем деления на ноль, если все элементы равны if max_val == min_val: return [0.0] * len(data) return [(x - min_val) / (max_val - min_val) for x in data] # Примеры использования data = [10, 20, 30, 40, 50] print(normalize(data)) # Ожидаемый результат: [0.0, 0.25, 0.5, 0.75, 1.0]

20 045

Премиальный квартал PRIDE: 1/5 квартиры в подарок Всего 15 минут от Цветного бульвара – и вы у себя дома. В семейном квартале PRIDE вас ждет идеальная среда для жизни: - Выбирайте свой стиль — 2 варианта дизайнерской отделки. - Простор и свет в каждом метре — панорамные окна и большие террасы. - Свой оазис — сад ароматов, пешеходный бульвар и приватные дворы для игр, отдыха и спорта. - Лобби как в 5*отеле от бюро Sundukovy Sisters. - Всё для счастья детей — собственный детский сад и школа. - Клубная инфраструктура - спортзал со спа, переговорная, коворкинг, детская и лаунж зоны. ⚡До 31.05 на выделенный пул квартир действуют специальные условия с выгодой до 12 млн рублей. Узнать больше Проектная декларация на сайте https://наш.дом.рф/. Застройщик: ООО "СЗ "ЛАЙФ САВЕЛОВСКАЯ" #реклама pride-home.ru О рекламодателе

20 045

⚙️ Генерация видео: Обзор интересных подходов | Text-2-video | Part 1 В статье разбирают основные методы генерации видео на основе текста (T2V): от адаптации T2I с AnimateDiff до новинок 2025 года вроде Wan2.1 и HunyuanVideo. Первая часть обзора Читать...

20 045

⚙️ Автоматизация верификации кодовых датасетов подрядчиков с помощью LLM: снизили брак на 40% и сократили стоимость на 60% Статья рассказывает, как автоматизация на основе LLM ускорила верификацию данных и сократила ошибки в производственной цепочке. Узнаете, как это помогло заказчику сэкономить ресурсы и время. Читать...

20 045

👩‍💻 Выявление тренда в временном ряде Напишите Python-скрипт, который принимает временной ряд в виде pandas.Series и определяет тренд: восходящий, нисходящий или отсутствие тренда. Решение должно быть простым и лаконичным. ➡️ Пример:

import pandas as pd
import numpy as np

# Генерация данных
date_range = pd.date_range(start="2020-01-01", periods=12, freq="M")
values = np.linspace(10, 20, 12) + np.random.normal(0, 0.5, 12)
time_series = pd.Series(data=values, index=date_range)

result = detect_trend(time_series)
print(result)  # Ожидаемый результат: "Восходящий тренд"

Решение задачи🔽

import numpy as np def detect_trend(series): x = np.arange(len(series)) slope = np.polyfit(x, series.values, 1)[0] if slope > 0: return "Восходящий тренд" elif slope < 0: return "Нисходящий тренд" else: return "Тренд отсутствует" # Пример использования import pandas as pd import numpy as np date_range = pd.date_range(start="2020-01-01", periods=12, freq="M") values = np.linspace(10, 20, 12) + np.random.normal(0, 0.5, 12) time_series = pd.Series(data=values, index=date_range) print(detect_trend(time_series))

20 045

🔫 Claude сопротивляется Исследование Anthropic показывает, как их ИИ Claude мог притворяться злым, чтобы избежать «переобучения». Модель следовала поддельным документам для бесплатных пользователей, но сопротивлялась для премиум-аудитории. Читать...

20 045

🔥 Самые интересные статьи за последние дни: • Всё, что вы хотели знать о Django Channels • Сборка Python проекта с uv и Docker • DE-1. DIY ассистент на LLM • Ваши генераторные выражения сломаны: чиним и разбираемся • Всё, что вы хотели знать о Django Channels

20 045

🎯 Разделяй свои задачи на «узкие» и «широкие» Иногда ты работаешь над узкой проблемой (например, багом в функции), а иногда — над широкой (архитектурное решение). Легко запутаться, если смешивать такие задачи. 👉 Совет: планируй работу так, чтобы «узкие» задачи чередовались с «широкими». Так мозг не перегружается и сохраняется баланс между точечной работой и глобальным видением проекта.

20 045

👩‍💻 Пишем свой PyTorch на NumPy. Часть 1 PyTorch — это мощный и гибкий фреймворк для машинного обучения, широко используемый для создания нейронных сетей. Он особенно популярен благодаря простоте использования, динамическим вычислительным графам и богатой экосистеме инструментов для обучения моделей. В этой статье мы реализуем собственную библиотеку машинного обучения на NumPy! Читать...

20 045

🤔 ИИ с человеческим лицом: какие ошибки повторяют модели и что с этим делать В статье рассказывают, почему ИИ, как и люди, подвержен когнитивным искажениям: самоуверенность, предвзятость и шаблонное мышление — как это влияет на бизнес и технологии Читать...

20 045

Алоха, товарищи! Недавно в Сингапуре завершилась одна из главных конференций в мире ML — ICLR 2025, и Яндекс приглашает обсудить самые интересные доклады. Где и когда проходит: 20 мая в офисе на Льва Толстого, 16 (или онлайн) пройдёт Yandex ICLR Recap — вечер инсайтов, мнений и прогнозов от сильных спикеров Яндекса. Кто выступает: 👉 Артём Бабенко, руководитель отдела Research — расскажет, что нового в мире tabular DL и как меняются подходы к работе с табличными данными. 👉 Андрей Бут, лидер команды YandexGPT Alignment — даст срез по NLP: какие задачи сейчас на пике, что получилось, а что нет. 👉 Роман Исаченко, руководитель направления CV — покажет, как развивается компьютерное зрение и в какую сторону движется сообщество. 👉 Алексей Степанов, CTO международного поиска — поделится тем, как современные идеи ICLR применимы к ML-инженерии и поиску. Будем обсуждать и делиться мнениями. Можно немного по холиварить. Это отличный шанс свериться с глобальной повесткой. Регистрация уже открыта. До встречи на рекапе