Data Portal | DS & ML
Open in Telegram
Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx
Show more8 404
Subscribers
-724 hours
-77 days
-430 days
Posts Archive
Эта статья Себастьяна Рашки пошагово проводит через реализацию self-attention с нуля, далее расширяя разбор до multi-head и cross-attention, с понятными объяснениями и примерами кода на PyTorch.
Обязательное чтение, если хотите глубоко разобраться в трансформерах. Читайте здесь
👉 @DataSciencegx
Эта статья Себастьяна Рашки пошагово проводит через реализацию self-attention с нуля, далее расширяя разбор до multi-head и cross-attention, с понятными объяснениями и примерами кода на PyTorch.
Обязательное чтение, если хотите глубоко разобраться в трансформерах. Читайте здесь
👉 @DataSciencegx
🔥Прими участие в Хакатоне от ИТ-холдинга Т1 в Новосибирске и поборись за призовой фонд 800 000 рублей!
Когда: 23–26 октября
Формат: онлайн + финал на площадке
Участвуй, если ты:
🔹обучаешься на технической или ИТ-специальности;
🔹развиваешься в направлении разработки, аналитики, CV, ML или DevOps;
🔹сможешь быть в Новосибирске 26 октября.
Выбери свой кейс:
✴️Цифровой дресс-код: фон, который выделяет вас. Создай локальный ML-модуль сегментации видео и генератор персонализированных фонов. ✴️CodeMetrics: метрики, которые помогают расти. Разработай систему автооценки эффективности команд через анализ Git-метрик.Почему стоит участвовать: 🔘Кейс в портфолио и полезная обратная связь от менторов Т1; 🔘Шанс проявить себя, чтобы начать карьеру в одной из крупнейших ИТ-компаний; 🔘Реальный опыт командной работы; 🔘Мерч и атмосфера сильного комьюнити — в Т1 более 5 000 джунов из 580+ вузов России и Беларуси. Регистрация открыта! ➡️ Успей до 21 октября по ссылке. erid: 2Vtzqwmd32u
Генеративные vs. дискриминативные модели в ML
(популярный вопрос на собеседованиях по ML)
👉 @DataSciencegx
Годный проект с GitHub, который предоставляет единое sandbox-окружение для разработки AI-агентов. Он объединяет браузер, терминал, файловую систему, VS Code и Jupyter в одном Docker-контейнере, готовый к использованию "из коробки".
Все компоненты работают с общей файловой системой: файл, скачанный в браузере, сразу доступен в терминале или коде.
В контейнер также предустановлены несколько MCP-серверов, благодаря чему AI Agent может напрямую вызывать различные возможности без дополнительной сложной настройки окружения.
Есть поддержка Chrome DevTools Protocol для программного управления браузером, а также встроенный порт-форвардинг и мониторинг сервисов для удобного предпросмотра и отладки веб-приложений.
Предоставляются SDK для Python, TypeScript и Golang, запуск возможен в один клик через Docker.
GitHub: AIO Sandbox
👉 @DataSciencegx
MCP-серверы могут предоставлять богатые UI-возможности
MCP-серверы в Claude/Cursor пока не предлагают никакого UI, например, графики. Это просто текст/JSON.
mcp-ui позволяет добавлять в вывод интерактивные веб-компоненты, которые может отрендерить MCP-клиент.
Забираем с GitHub
👉 @DataSciencegx
Открытый урок «Minority drift: от методов детекции до стабильного прода»
• 6 октября, ПН
• 19:00 по мск
• 2 часа
2 часа вместе с Team Lead Yandex на практике учимся распознавать виды Minority Drift, делать модели устойчивыми к дрейфу, оценивать деградацию и финансовые риски. От PSI и KL-дивергенции до Fairness Metrics.
Что будет на уроке:
1️⃣Виды Minority Drift в продакшен данных: Class-wise, Conditional, Subpopulation, Hidden Drift
2️⃣Оценка деградации моделей и финансовых потерь на практике
3️⃣Методы стабилизации признаков и моделей: PSI и KL-дивергенция
4️⃣Контроль качества — построение Fairness Metrics
Преподает Дмитрий Сафонов, Data Science Team Lead в Яндекс.
Урок для Data Scientists, Classic ML и NLP-инженеров. Нужны базовые знания основ машинного обучения, математики и программирования.
➡️ Записаться на урок
Сооснователь
super.com, который сам разработчик и у его компании годовой ревенью $200M, собрал список материалов по тому, что он сам выучил про ИИ, и сказал: «Прочитайте это за две недели»:
https://github.com/henrythe9th/AI-Crash-Course
Я посмотрел, что он там накидал - реально интересно. В основном это базовые статьи по искусственному интеллекту, и действительно для успеха нет короткого пути: нужно учиться :)
👉 @DataSciencegx📘 На Stepik вышел курс — «MLOps с нуля: как довести модель до продакшна»
Начинаете путь в MLOps и хотите понять, как перевести ML-модель из ноутбука в реальный продукт? Этот курс — именно то, что нужно.
🔍 Что вы получите:
• Понимание полного жизненного цикла ML-модели: от обучения до мониторинга
• Практику с современными инструментами: Docker, Kubernetes, CI/CD, MLflow
• Опыт построения воспроизводимых пайплайнов и управления экспериментами
• Навыки автоматизации и работы с инфраструктурой для реального продакшна
🎓 Сертификат по завершении — добавьте его в резюме или профиль LinkedIn
🚀 Сделайте шаг к профессии MLOps-инженера. Начните уже сегодня и получите скидку 30%, которая действительна в течение 24 часов
👉 Пройти курс на Stepik
Забирайте в закладки этот бесплатный визуальный гайд по эмбеддингам LLM
Ты узнаешь:
- Что такое эмбеддинги?
- Каким должен быть хороший эмбеддинг?
- Традиционные техники эмбеддингов
- BERT
- Эмбеддинги в современных LLM
- Эмбеддинги в действии
- Эмбеддинги как графы: анализ сети
Ссылка: LLM Embeddings Explained: A Visual and Intuitive Guide
👉 @DataSciencegx
Wink AI Challenge — хакатон на стыке IT и кино. Участников ждут задачи, которые ускорят производство фильмов и сериалов за счёт прикладных AI-решений. Призовой фонд соревнования — 1 125 000 рублей.
Регистрация до 31 октября: https://cnrlink.com/winkaichallengedataportal
Приглашаем на первый в России хакатон, посвящённый применению ИИ в кинопроизводстве, ML-инженеров, backend- и frontend-разработчиков, специалистов в DevOps, MLOps, а также инженеров в сфере мультимедиа.
Вы сможете:
🔸 Разработать ML-модель, которую оценят и будут использовать продюсеры популярных российских фильмов и сериалов.
🔸 Решить кейсы, основанные на реальных задачах, с которыми продюсеры сталкиваются каждый день.
🔸 Использовать настоящие сценарии и видеоматериалы для анализа текстов, извлечения сущностей и генерации структуры съёмок.
🔸 Попрактиковаться в применении NLP, NER и мультимодальных данных в задачах кинопроизводства.
Регистрируйтесь на Wink AI Challenge, чтобы разработать ИИ-ассистента, который станет частью производства фильмов и сериалов: https://cnrlink.com/winkaichallengedataportal
Бесплатный курс, чтобы научиться строить LLM с нуля, используя только чистый PyTorch
Этот курс проведёт вас через весь жизненный цикл: от базовых концептов до продвинутых техник алайнмента
К концу у вас будет глубокий практический опыт, достаточный, чтобы собирать и кастомизировать собственные LLM
https://www.youtube.com/watch?v=p3sij8QzONQ
👉 @DataSciencegx
Обучайте модели ИИ на данных, которых даже не существует
SDV — это open-source фреймворк, который с помощью ML изучает паттерны ваших реальных данных и генерирует синтетические табличные данные в больших масштабах.
Поддерживает встроенную анонимизацию, валидацию и многое другое.
GitHub: SDV
👉 @DataSciencegx
🕊🕊🕊🕊🕊🕊🕊🕊🕊🕊
Каналы с IT мероприятиями
Подписывайся,
чтобы не пропустить 👨💻
1. IT мероприятия для стажеров и студентов
2. IT мероприятия по РФ
3. IT мероприятия и хакатоны
4. Бесплатные IT мероприятия
5. IT мероприятия онлайн
6. IT мероприятия Москва
7. IT мероприятия Санкт Петербург
Это лучший способ понять, как на самом деле работают ML-модели
Используйте Drawdata, чтобы нарисовать 2D-датасет прямо в Jupyter. С его помощью можно интерактивно выбирать данные через виджет и обновлять модель по мере того, как данные добавляются
Полностью интерактивно, в реальном времени и с открытым исходным кодом
👉 @DataSciencegx
⚡️ На Stepik вышел курс по Linux
Внутри 20+ модулей: от установки Linux и работы с файлами до сетей, прав, дисков, процессов, автоматизации на Bash и многого другого. Всё сразу закрепляется на практике (200+ заданий с автопроверкой).
Материал подаётся понятным языком, шаг за шагом, на реальных примерах и с наглядными схемами.
После прохождения вы получите сертификат, который можно добавить в резюме.
Есть бесплатные демо-уроки для ознакомления. В ближайшие 48 часов курс доступен со скидкой 20%: открыть курс на Stepik (скидка применяется по этой ссылке)
Available now! Telegram Research 2025 — the year's key insights 
