Data Science | Machinelearning [ru]

Kanalga Telegram’da o‘tish

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Ko'proq ko'rsatish

Tarmoq:Frontender's notes [ru]Rossiya33 730 Texnologiyalar & Aralashmalar6 734...

📈 Telegram kanali Data Science | Machinelearning [ru] analitikasi

Data Science | Machinelearning [ru] (@devsp) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 20 042 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 6 734-o'rinni va Rossiya mintaqasida 33 730-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 20 042 obunachiga ega bo‘ldi.

15 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -82 ga, so‘nggi 24 soatda esa -1 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 7.88% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 4.47% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 1 580 marta ko‘riladi; birinchi sutkada odatda 896 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 7 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, nvidia, контекст, openai, архитектура kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 16 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

20 042

Obunachilar

-124 soatlar

+307 kunlar

-8230 kunlar

1 580

Post ko'rishlar

~ 89624 soatlar

~ 1 08548 soatlar

7.88%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

20 043

➡️ Самые интересные статьи за последние дни: • Эксперимент: даём ChatGPT полный доступ к компьютеру • Правильный путь создания python-библиотеки: от создания до публикации • Запускаем Yolo на пятирублёвой монете или Luckfox Pico Mini • Более мощное семейство моделей YandexGPT 4: рост качества ответов, длинный контекст, пошаговые рассуждения • Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

20 043

Яндекс открывает новый сезон Тренировок по ML Смотрите лекции, решайте задачи, поднимайтесь в рейтинге. В третьем сезоне Тренировки по ML сосредоточатся на теме Computer Vision. Вас ждут 4 темы с контестами по 10 задач. Вы изучите не только классические методы компьютерного зрения, но и генеративные модели, локальные дескрипторы изображений, детекцию, сегментацию, контрастное предобучение и многое другое. Лучшие участники получат сертификат о прохождении Тренировок (нужно решить 20 из 40 задач), возможность пройти пробное техническое собеседование в Яндекс, проходку на топовый гик-фест о старте карьеры в IT Young Con и не только. Участники, которые хорошо себя проявят, получат возможность пройти ускоренный отбор на стажировку или сразу в штат компании. Подать заявку на Тренировки можно здесь.

20 043

🔎 Подборка зарубежных вакансий Data Analyst 🟢SQL, Python, ClickHouse, MySQL, Snowflake, Tableau, Power BI 🟢Уровень дохода не указан | 3–6 лет E-commerce Data Analyst (Amazon, Walmart) 🟢Excel, Google Sheets, Looker Studio, Power BI, Tableau 🟢от 1 000 до 1 300 $ | 1–3 года AI Game Designer (UE) 🟢Unreal Engine, Blueprints, Gameplay Ability System 🟢Уровень дохода не указан | 3–6 лет

20 043

📉 Иногда нужно сознательно писать меньше кода Чем больше кода — тем больше точек отказа, багов и времени на поддержку. А мы здесь не ради фич ради фич. 👉 Совет: прежде чем что-то реализовать — подумай, а нужно ли это вообще? Может, задачу можно решить конфигом, сторонним инструментом или просто выкинуть. Самый чистый код — тот, которого не пришлось писать.

20 043

👩‍💻 7 малоизвестных возможностей стандартной библиотеки Python Стандартная библиотека Python – это кладезь возможностей. Мы представляем семь недооцененных модулей, которые помогут вам улучшить организацию данных, оптимизировать производительность и упростить распространение ваших программ. Читать...

20 043

⚡ Мы делимся с вами папкой «TECH & SCI», в которой собрали статьи о самых инновационных разработках, новостях, которые были реализованы в 2024-2025 году в сфере технологий, науки. 📂 Внутри вас ждет: 🟠 ИИ-агенты - новый способ оптимизации процессов в 2024-2025. 🟠 Золотая жила для разработчиков в 2025 GenAI: подборка из 44 готовых ИИ-агентов с исходным кодом. 🟠 Прорывы в сфере астрономии в 2025 году. 🟠 Последние изобретения в Data Science. 🟠 И еще 24 полезные статьи, которые прокачают ваши навыки. 🔗 А мы с вами делимся статьёй: «Как я с помощью нейросетей обогнала инфляцию». ✔ Сохраняйте папку «TECH & SCI», изучайте материалы и выходите на новый уровень!

20 043

❓ Как работает кросс-валидация в ML? Кросс-валидация — это техника оценки модели, которая помогает избежать переобучения и лучше оценить её обобщающую способность. В классической k-блочной кросс-валидации данные разбиваются на k равных частей, и модель обучается k раз, каждый раз используя одну часть для тестирования и остальные для обучения. ➡️ Пример применения кросс-валидации с использованием библиотеки scikit-learn:

from sklearn.model_selection import cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris

data = load_iris()
X, y = data.data, data.target
clf = RandomForestClassifier()

scores = cross_val_score(clf, X, y, cv=5)
print(f'Средняя точность: {scores.mean()}')

Здесь модель обучается 5 раз (5-fold) на разных частях данных, и вычисляется средняя точность.

🗣️ Кросс-валидация помогает лучше понять, как модель будет работать на новых данных, улучшая её обобщение.

🖥 Подробнее тут

20 043

Готов увидеть будущее искусственного интеллекта? 🧠 GoCloud — масштабная конференция про облака и AI. Здесь ML-инженеры, дата сайентисты, разработчики и архитекторы обмениваются лучшими практиками и знаниями. В программе: ▫️ презентация платформы для работы с AI&ML — от идеи до результата ▫️ анонс новых сервисов для работы с GenAI ▫️ реальный кейс трансформации клиентского сервиса с помощью AI ▫️ анонс сервиса для простого и быстрого запуска ML-моделей в облаке 30+ докладов, нетворкинг с экспертами и live-демо сервисов ждут тебя 10 апреля. Регистрация по ссылке 👈

20 043

🚀 Оптимизируй свой AI: разоблачение 6 мифов о работе с векторами в Pgvector Шесть заблуждений, которые мешают тебе использовать всю мощь векторных баз данных в AI. Развенчав эти мифы, ты сможешь раскрыть истинный потенциал векторов и значительно повысить эффективность твоих AI-проектов. Читать...

20 043

🤖 ChatGPT VS DeepSeek Приглашаем на открытый урок. 🗓 01 апреля в 18:00 МСК 🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced». ChatGPT, DeepSeek, Gemini… Что у них внутри и какие технологии их создают? На открытом уроке разберем архитектуру современных LLM, методы их обучения и принципы, которые двигают индустрию NLP вперед. Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. Если вы хотите глубже понять работу LLM, разобраться в ключевых концепциях DeepSeek и узнать о будущих трендах, этот вебинар для вас. Участвуйте и получите скидку для обучения на курсе «NLP. Advanced». 🔗 Ссылка на регистрацию: https://vk.cc/cKhpfL Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxCbVse

20 043

📝 Подборка вакансий для сеньоров Системный аналитик (Data Office) • SQL, BPMN, REST, анализ требований • Уровень дохода не указан | опыт не указан Senior Data Scientist в команду антифрода • Python, SQL, TensorFlow, PyTorch, машинное обучение • Уровень дохода не указан | от 2 лет Продуктовый аналитик • Yandex DataLens, Python, Amplitude, ClickHouse, Oracle, Microsoft Excel, Tableau, Metabase, PowerBI, анализ данных • Уровень дохода не указан | от 2 лет

20 043

МТС True Tech Hack 2025 — создай новое решение на базе The Platform от МТС и поборись за призовой фонд в 1 500 000 рублей. Регистрация открыта до 16 апреля. Твоя формула успеха: ✅ Хочешь внести вклад в продукты, которые приносят пользу разработчикам по всей России ✅ Знаешь, как превратить идею в работающий прототип ✅ Любишь работать в команде. На хакатон приглашают разработчиков, Data Scientists, Data Engineers, системных и бизнес-аналитиков, UI/UX-дизайнеров и других специалистов. Участие — командное, в каждой будет от 2 до 5 человек. Треки МТС True Tech Hack 2025: ✅ DataOps Pipeline: оптимизация от сбора до отчета ✅ AI Schema Builder: генерация схем ✅ Цифровизация через True Tabs: интеграция данных и процессов в единую экосистему ✅ TouchVision: AI-ассистент для незрячих и слабовидящих пользователей ✅ Золотая середина: дистилляция моделей MWS GPT Не пропусти митап 9 апреля с экспертами хакатона — задай вопросы и узнай больше о задачах. Регистрируйся на МТС True Tech Hack 2025

20 043

📈 Подборка статей для вашей карьеры • Продуктивность и почему «сделать много всего» — это не про неё • Куда выйти из айти? • Как я боролся с выгоранием в ИТ: лайфхаки и личный опыт • ИТ-пенсионеры и где они обитают • Почему мне нужно, чтобы ты вкатился в айти

20 043

↗️ Как я с помощью нейросетей обогнала инфляцию В статье рассказывается, как использовать нейросети для оптимизации работы, если ваш доход в рублях, а расходы — в валюте. Спойлер: полное делегирование задач ИИ — миф, но с его помощью можно значительно упростить рутину и повысить продуктивность. Поделены реальные кейсы из жизни автора. Читать...

20 043

⚡️Разбираем тестовое задание в Альфа Банк на позицию Junior Аналитика данных Чтобы найти работу, мало пройти курс и сделать классное резюме. На практике, чтобы выделиться на собеседовании, нужно понимать, что лежит под капотом каждого инструмента, а не следовать конкретному заученному алгоритму. Чтобы попрактиковаться в этом, приходите на бесплатный вебинар, где будем разбирать реальное тестовое задание, которое дают аналитикам в Альфа Банке. Что будем делать на вебинаре: 🟠Напишем сложные SQL-запросы для банковских данных; 🟠Вспомним, как правильно использовать оконные функции; 🟠Узнаем, как создавать разметку, из чего она состоит и для чего она нужна; 🟠На реальных данных проведем когортный анализ и сделаем выводы; 🟠Расскажем, как доставать инсайты из данных. Вебинар проведет Денис Иванов, ведущий продуктовый аналитик 😶Зарегистрироваться на бесплатный вебинар

20 043

🌞 Автоэнкодеры простыми словами Автоэнкодеры являются базовой техникой машинного обучения и искусственного интеллекта, на основе которой строятся более сложные модели, например, в диффузионных моделях, таких как Stable Diffusion. Что же такое автоэнкодер? Читать...

20 043

👩‍💻 Задачка по Python Напишите функцию, которая принимает DataFrame и возвращает имена двух столбцов с наибольшей положительной корреляцией. ➡️ Пример:

data = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [2, 4, 6, 8],
    'C': [1, 0, 1, 0],
    'D': [10, 20, 30, 40]
})

print(find_highest_correlation(data))  
# Ожидаемый результат: ('B', 'D')

Решение задачи ⬇️

def find_highest_correlation(df): corr_matrix = df.corr() max_corr = 0 columns = (None, None) for col1 in corr_matrix.columns: for col2 in corr_matrix.columns: if col1 != col2 and corr_matrix[col1][col2] > max_corr: max_corr = corr_matrix[col1][col2] columns = (col1, col2) return columns # Пример использования: import pandas as pd data = pd.DataFrame({ 'A': [1, 2, 3, 4], 'B': [2, 4, 6, 8], 'C': [1, 0, 1, 0], 'D': [10, 20, 30, 40] }) print(find_highest_correlation(data)) # Ожидаемый результат: ('B', 'D')

20 043

⚙️ Как обеспечить Data Quality терабайтов данных и зачем: опыт СИБУРа Статья посвящена опыту СИБУРа в создании DQ-сервиса для обеспечения качества данных. Рассматриваются задачи DQ, архитектура решения и универсальные подходы, применимые для анализа данных в крупных компаниях. Читать...

20 043

Ваша карьера в аналитике данных может выйти на новый уровень DWH — это основа качественной аналитики. Без правильно спроектированного хранилища данные хаотичны, отчеты несистемны, а решения принимаются вслепую. 📍 На открытом уроке 26 марта в 20:00 мск разберем, какие существуют подходы к построению хранилищ, как они влияют на скорость обработки данных и какие задачи решают. После урока вы: - Разберетесь в ключевых архитектурах DWH. - Научитесь выбирать подходящую под задачи бизнеса. - Поймете, как архитектура влияет на масштабируемость и производительность. Спикер Алексей Железной — Senior Data Engineer с большим опытом и широким технологическим стеком. ➡️ Регистрируйтесь и получите скидку на большое обучение «Data Warehouse Analyst»: https://vk.cc/cKdonV Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

20 043

📝 Подборка вакансий для мидлов Data Analyst • Python, R, Java, SQL, NoSQL • Уровень дохода не указан | от 2 лет Data Engineer (Middle) • Python, PostgreSQL, MongoDB, ClickHouse, AWS, Kafka, Spark • Уровень дохода не указан | от 2 лет Python разработчик (Трайб Data Office) • Python, HTML, JavaScript, CSS, Vue.js, Linux • Уровень дохода не указан | опыт не указан