Data Portal | DS & ML

Відкрити в Telegram

Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx

Сітка:IT Portal Росія75 941 Технології та додатки13 882

8 407

Підписники

-724 години

-77 днів

-430 день

951

Перегляди допису

~ 57524 години

~ 69048 годин

11.31%

Коефіцієнт залучення

~ 2

Дописів на день

Ads index

beta

Архів дописів

8 405

Эта статья Себастьяна Рашки пошагово проводит через реализацию self-attention с нуля, далее расширяя разбор до multi-head и cross-attention, с понятными объяснениями и примерами кода на PyTorch. Обязательное чтение, если хотите глубоко разобраться в трансформерах. Читайте здесь 👉 @DataSciencegx

8 405

🔥Прими участие в Хакатоне от ИТ-холдинга Т1 в Новосибирске и поборись за призовой фонд 800 000 рублей! Когда: 23–26 октября Формат: онлайн + финал на площадке Участвуй, если ты: 🔹обучаешься на технической или ИТ-специальности; 🔹развиваешься в направлении разработки, аналитики, CV, ML или DevOps; 🔹сможешь быть в Новосибирске 26 октября. Выбери свой кейс:

✴️Цифровой дресс-код: фон, который выделяет вас. Создай локальный ML-модуль сегментации видео и генератор персонализированных фонов. ✴️CodeMetrics: метрики, которые помогают расти. Разработай систему автооценки эффективности команд через анализ Git-метрик.

Почему стоит участвовать: 🔘Кейс в портфолио и полезная обратная связь от менторов Т1; 🔘Шанс проявить себя, чтобы начать карьеру в одной из крупнейших ИТ-компаний; 🔘Реальный опыт командной работы; 🔘Мерч и атмосфера сильного комьюнити — в Т1 более 5 000 джунов из 580+ вузов России и Беларуси. Регистрация открыта! ➡️ Успей до 21 октября по ссылке. erid: 2Vtzqwmd32u

8 405

Генеративные vs. дискриминативные модели в ML (популярный вопрос на собеседованиях по ML) 👉 @DataSciencegx

8 405

Годный проект с GitHub, который предоставляет единое sandbox-окружение для разработки AI-агентов. Он объединяет браузер, терминал, файловую систему, VS Code и Jupyter в одном Docker-контейнере, готовый к использованию "из коробки". Все компоненты работают с общей файловой системой: файл, скачанный в браузере, сразу доступен в терминале или коде. В контейнер также предустановлены несколько MCP-серверов, благодаря чему AI Agent может напрямую вызывать различные возможности без дополнительной сложной настройки окружения. Есть поддержка Chrome DevTools Protocol для программного управления браузером, а также встроенный порт-форвардинг и мониторинг сервисов для удобного предпросмотра и отладки веб-приложений. Предоставляются SDK для Python, TypeScript и Golang, запуск возможен в один клик через Docker. GitHub: AIO Sandbox 👉 @DataSciencegx

8 405

MCP-серверы могут предоставлять богатые UI-возможности MCP-серверы в Claude/Cursor пока не предлагают никакого UI, например, графики. Это просто текст/JSON. mcp-ui позволяет добавлять в вывод интерактивные веб-компоненты, которые может отрендерить MCP-клиент. Забираем с GitHub 👉 @DataSciencegx

8 405

Открытый урок «Minority drift: от методов детекции до стабильного прода» • 6 октября, ПН • 19:00 по мск • 2 часа 2 часа вместе с Team Lead Yandex на практике учимся распознавать виды Minority Drift, делать модели устойчивыми к дрейфу, оценивать деградацию и финансовые риски. От PSI и KL-дивергенции до Fairness Metrics. Что будет на уроке: 1️⃣Виды Minority Drift в продакшен данных: Class-wise, Conditional, Subpopulation, Hidden Drift 2️⃣Оценка деградации моделей и финансовых потерь на практике 3️⃣Методы стабилизации признаков и моделей: PSI и KL-дивергенция 4️⃣Контроль качества — построение Fairness Metrics Преподает Дмитрий Сафонов, Data Science Team Lead в Яндекс. Урок для Data Scientists, Classic ML и NLP-инженеров. Нужны базовые знания основ машинного обучения, математики и программирования. ➡️ Записаться на урок

8 405

Сооснователь super.com, который сам разработчик и у его компании годовой ревенью $200M, собрал список материалов по тому, что он сам выучил про ИИ, и сказал: «Прочитайте это за две недели»: https://github.com/henrythe9th/AI-Crash-Course Я посмотрел, что он там накидал - реально интересно. В основном это базовые статьи по искусственному интеллекту, и действительно для успеха нет короткого пути: нужно учиться :) 👉 @DataSciencegx

8 405

4 стратегии, которые используют LLM для генерации текста 👉 @DataSciencegx

8 405

📘 На Stepik вышел курс — «MLOps с нуля: как довести модель до продакшна» Начинаете путь в MLOps и хотите понять, как перевести ML-модель из ноутбука в реальный продукт? Этот курс — именно то, что нужно. 🔍 Что вы получите: • Понимание полного жизненного цикла ML-модели: от обучения до мониторинга • Практику с современными инструментами: Docker, Kubernetes, CI/CD, MLflow • Опыт построения воспроизводимых пайплайнов и управления экспериментами • Навыки автоматизации и работы с инфраструктурой для реального продакшна 🎓 Сертификат по завершении — добавьте его в резюме или профиль LinkedIn 🚀 Сделайте шаг к профессии MLOps-инженера. Начните уже сегодня и получите скидку 30%, которая действительна в течение 24 часов 👉 Пройти курс на Stepik

8 405

Забирайте в закладки этот бесплатный визуальный гайд по эмбеддингам LLM Ты узнаешь: - Что такое эмбеддинги? - Каким должен быть хороший эмбеддинг? - Традиционные техники эмбеддингов - BERT - Эмбеддинги в современных LLM - Эмбеддинги в действии - Эмбеддинги как графы: анализ сети Ссылка: LLM Embeddings Explained: A Visual and Intuitive Guide 👉 @DataSciencegx

8 405

11 типов переменных в датасете наглядно 👉 @DataSciencegx

8 405

Wink AI Challenge — хакатон на стыке IT и кино. Участников ждут задачи, которые ускорят производство фильмов и сериалов за счёт прикладных AI-решений. Призовой фонд соревнования — 1 125 000 рублей. Регистрация до 31 октября: https://cnrlink.com/winkaichallengedataportal Приглашаем на первый в России хакатон, посвящённый применению ИИ в кинопроизводстве, ML-инженеров, backend- и frontend-разработчиков, специалистов в DevOps, MLOps, а также инженеров в сфере мультимедиа. Вы сможете: 🔸 Разработать ML-модель, которую оценят и будут использовать продюсеры популярных российских фильмов и сериалов. 🔸 Решить кейсы, основанные на реальных задачах, с которыми продюсеры сталкиваются каждый день. 🔸 Использовать настоящие сценарии и видеоматериалы для анализа текстов, извлечения сущностей и генерации структуры съёмок. 🔸 Попрактиковаться в применении NLP, NER и мультимодальных данных в задачах кинопроизводства. Регистрируйтесь на Wink AI Challenge, чтобы разработать ИИ-ассистента, который станет частью производства фильмов и сериалов: https://cnrlink.com/winkaichallengedataportal

8 405

Бесплатный курс, чтобы научиться строить LLM с нуля, используя только чистый PyTorch Этот курс проведёт вас через весь жизненный цикл: от базовых концептов до продвинутых техник алайнмента К концу у вас будет глубокий практический опыт, достаточный, чтобы собирать и кастомизировать собственные LLM https://www.youtube.com/watch?v=p3sij8QzONQ 👉 @DataSciencegx

8 405

Обучайте модели ИИ на данных, которых даже не существует SDV — это open-source фреймворк, который с помощью ML изучает паттерны ваших реальных данных и генерирует синтетические табличные данные в больших масштабах. Поддерживает встроенную анонимизацию, валидацию и многое другое. GitHub: SDV 👉 @DataSciencegx

8 405

8 405

Open-source RAG-стек (2025) 👉 @DataSciencegx

8 405

Это лучший способ понять, как на самом деле работают ML-модели Используйте Drawdata, чтобы нарисовать 2D-датасет прямо в Jupyter. С его помощью можно интерактивно выбирать данные через виджет и обновлять модель по мере того, как данные добавляются Полностью интерактивно, в реальном времени и с открытым исходным кодом 👉 @DataSciencegx

8 405

⚡️ На Stepik вышел курс по Linux Внутри 20+ модулей: от установки Linux и работы с файлами до сетей, прав, дисков, процессов, автоматизации на Bash и многого другого. Всё сразу закрепляется на практике (200+ заданий с автопроверкой). Материал подаётся понятным языком, шаг за шагом, на реальных примерах и с наглядными схемами. После прохождения вы получите сертификат, который можно добавить в резюме. Есть бесплатные демо-уроки для ознакомления. В ближайшие 48 часов курс доступен со скидкой 20%: открыть курс на Stepik (скидка применяется по этой ссылке)

8 405

8 архитектур RAG для AI-инженеров 👉 @DataSciencegx