Data Portal | DS & ML
رفتن به کانال در Telegram
Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx
نمایش بیشتر8 404
مشترکین
-724 ساعت
-77 روز
-430 روز
آرشیو پست ها
Этот репозиторий на GitHub — настоящая находка для ML-специалистов
Репозиторий Kaggle Solutions собирает решения и идеи от лучших участников прошлых соревнований Kaggle. Список регулярно обновляется после каждого соревнования.
Он охватывает интервью по машинному обучению, лекции и решения
https://github.com/faridrashidi/kaggle-solutions
👉 @DataSciencegx
Эта лекция о больших языковых моделях (LLM) обязательна к просмотру для инженеров в области ИИ.
Полуторачасовая лекция охватывает: токенизацию, законы масштабирования, дообучение, оценку, оптимизацию, вызовы, затраты и многое другое.
От Стэнфорда, около 1 млн просмотров
https://www.youtube.com/watch?v=9vM4p9NN0Ts
👉 @DataSciencegx
⚡️Анализируем продажи на Wildberries с помощью Python
С каждым днем все больше бизнесов выходят на маркетплейсы, а значит еще более ценными становятся аналитики, которые умеют с ними работать. Хотите за несколько часов собрать интересный кейс для своего портфолио?
Андрон Алексанян - эксперт по аналитике с 8 летним опытом и по совместительству CEO Simulative в прямом эфире проанализирует продажи на Wildberries с помощью Python.
Что будет на вебинаре:
🟠Напишем скрипт на Python, который каждый час собирает статистику о ранжировании карточки на WB по ключевым запросам;
🟠Построим наглядные визуализации для отслеживания динамики ранжирования.
Важно досмотреть вебинар до конца, чтобы узнать как упаковать этот кейс в портфолио своих проектов.
😶Зарегистрироваться на бесплатный вебинар
4 стратегии обучения на нескольких GPU, объяснённые наглядно:
👉 @DataSciencegx
Стэнфорд выкатил свежий курс по LLM — CS336: Language Modeling from Scratch
Курс с фокусом на практику: вся теория по LLM раскрывается через создание собственной модели. Ты изучаешь всё end-to-end — от обработки данных и архитектуры трансформеров до RL и эвала
Ведёт курс Перси Лианг — профессор Стэнфорда и сооснователь TogetherAI.
Курс прямо сейчас идёт в Стэнфорде, и лекции заливаются по ходу — контент свежий, как только из печи
Первые лекции здесь, а домашка и ноутбуки — тут.
👉 @DataSciencegx
Жизнь CV-модели после релиза
После релиза работа не заканчивается — и именно здесь начинаются реальные сложности. Как понять, что модель начала деградировать? Как построить поддержку, если в команде нет лишних рук? Как мониторить предсказания CV-модели?
Команда DeepSchool подготовила открытую лекцию, на которой они разберут, где и что может пойти не так после релиза, как это вовремя заметить, и что делать, если количество моделей растёт, а команда всё та же.
На лекции расскажут:
- как в реальности выглядит цикл жизни CV-модели
- как выстраивать поддержку: что можно автоматизировать, а что — нет
- как следить за качеством модели: дрифты, аутлаеры, шум, ключевые метрики
- какие есть подходы для автоматизации мониторинга модели
- и спроектируют возможное решение на примере реальной задачи
Спикеры также расскажут о курсе, на котором вы научитесь решать трудные задачи: специфичные корнер-кейсы, шумные данные, трёхэтажные постпроцессинги и прочее.
Обо всём этом расскажут:
— Анастасия Старобыховская — руководитель CV-направления НЛМК ИТ
— Тимур Фатыхов — основатель DeepSchool, ex Lead CV Engineer, KoronaPay
🗓 24 апреля, четверг, 18:00 МСК.
Регистрируйтесь по ссылке и приходите в четверг!
Подключите любую LLM к любому MCP-серверу
MCP-Use — это open-source способ подключить любую LLM к любому MCP-серверу и создавать кастомных агентов с доступом к инструментам без использования проприетарных решений или клиентских приложений.
Создавайте полностью локальные MCP-клиенты: https://github.com/pietrozullo/mcp-use
👉 @DataSciencegx
Открытый репозиторий по Data Science для изучения и применения в решении реальных задач.
Это упрощённый путь для начала изучения Data Science.
Всё необходимое вы найдёте здесь: https://github.com/academic/awesome-datascience
👉 @DataSciencegx
Оказывается, чтобы расти в доходе в ML и IT, недостаточно закончить топовый матфак, работать 24/7 и знать все фреймворки мира
Да, это круто, но это – далеко не главное. На самом деле чаще всего выигрывают люди с прокаченным софт скиллами – те, кто уверенно ведет диалог и грамотно доносит ценность своих решений.
Вот вам пример: Senior ML-инженер Олег Андриянов рассказывает в своем канале, как его доход вырос за 4 года в 12,5 раз. В блоге куча крутых статей, вот наш топ-3:
– Как гарантированно повысить свою зарплату?
– Какие 2 ключевых софт-скилла делают тебя на голову выше конкурентов на рынке труда?
– Как Олегу удалось вырасти в доходах в 12,5 раз за 4 года?
У автора большой опыт руководителя, так что он знает, чего хочет от сотрудника индустрия, и в его канале – не фантазии, а настоящие практические инструменты, которые помогут быстрее достичь карьерных целей.
Подписывайся, если хочешь стать незаменимым в любой IT-команде: @andriyanov_leads
Реклама. СЗ Волков Д.Д. ИНН: 370701873479, erid: 2Vtzqwy7BPx
Полный краш-курс по MCP для Python-разработчиков
– Что такое MCP и как он устроен
– Как поднять свой MCP-сервер
– Подключение Python-приложений к MCP
– Интеграция LLM-моделей с MCP
– MCP против function calling
– Деплой в Docker
– Управление жизненным циклом
Гайд для тех, кто хочет строить AI-системы на базе MCP и выйти за рамки базовых туториалов:
https://www.youtube.com/watch?v=5xqFjh56AwM
👉 @DataSciencegx
Сделайте sentence transformers в 50 раз меньше и в 500 раз быстрее
Model2Vec преобразует любой sentence transformer в компактную статическую модель с минимальной потерей качества. Кроме того, он обеспечивает мгновенный векторный поиск по миллионам документов без предварительной индексации.
Полностью с открытым исходным кодом
https://github.com/MinishLab/model2vec/tree/main
👉 @DataSciencegx
Мы слишком много знаем!
И просто обязаны этим поделиться. За 5 лет существования школы karpovꓸcourses мы обучили более 95 000 человек, и 80% наших выпускников уже работают в VK, Яндексе, Авито и других известных компаниях. И мы решили сделать для вас Karpov.Conf — чтобы поделиться знаниями не только с нашими студентами, но и с каждым, кто интересуется аналитикой данных и другими направлениями Data Science.
Будем обсуждать особенности работы с Power BI и практическое применение ML-моделей в крупных компаниях, разберем пользовательский опыт и реализацию аналитики на базе Yagpt, узнаем, как дерево метрик помогает принимать решения, и какие ошибки совершают крупные компании в контексте аналитики.
Мы собрали действительно звездный состав спикеров, мы очень старались сделать это мероприятие максимально полезным — вам осталось только не пропустить его!
Регистрируйтесь на KARPOV.CONF 2025 — включите Data-driven на полную!
Если вы только начинаете заниматься ML/DL и переживаете, что придётся потратить недели на подтягивание математики, поверьте — этого видео вам достаточно.
Это видео длится 5 часов, и этого вполне достаточно, чтобы начать.
Не усложняйте
https://www.youtube.com/watch?v=Ixl3nykKG9M
👉 @DataSciencegx
Repost from Python Portal
NVIDIA завезла нативную поддержку Python в CUDA
Теперь можно напрямую использовать ускорение на GPU прямо из Python — что сильно упрощает работу над проектами в сфере ИИ, машинного обучения и научных вычислений. Никаких обёрток, костылей и танцев с C/C++.
— CUDA Core — переосмыслен для Python: здесь сделан упор на JIT-компиляцию и минимизацию зависимостей
— cuPyNumeric — прокачанная версия NumPy, работающая на GPU
— NVMath — поддержка линейной алгебры, совместима с хостом и устройством
— Добавлены инструменты для профилирования и анализа кода
— Новый подход к параллельным вычислениям — CuTile. Абстракция не на уровне потоков, а на уровне массивов и тайлов
Посмотреть презентацию можно тут ✌️
👉 @PythonPortal
Google представил Agent2Agent (A2A)
Протокол для общения ИИ-агентов между собой, независимо от платформы или фреймворка. Использует технологии HTTP, SSE и JSON-RPC. Подробнее тут
Agent2Agent Protocol vs. Model Context Protocol, четкое объяснение (с визуализацией):
— Протокол Agent2Agent позволяет AI-агентам подключаться к другим агентам.
— Протокол Model Context позволяет AI-агентам подключаться к инструментам и API.
Оба протокола являются open-source и не конкурируют друг с другом
👉 @DataSciencegx
Отличное приложение на основе ИИ начинается с выбора подходящего типа эмбеддингов.
Вот 6 типов эмбеддингов и случаи, когда стоит их использовать:
• Sparse embeddings: https://weaviate.io/developers/weaviate/search/bm25
• Dense embeddings: https://weaviate.io/developers/weaviate/search/similarity
• Quantized embeddings: https://weaviate.io/developers/weaviate/concepts/vector-quantization
• Binary embeddings: https://weaviate.io/developers/weaviate/concepts/vector-quantization#binary-quantization
• Variable dimensions: https://weaviate.io/blog/openais-matryoshka-embeddings-in-weaviate
• Multi-vector embeddings: https://weaviate.io/developers/weaviate/tutorials/multi-vector-embeddings
👉 @DataSciencegx
Плейлист из 30 видео на YouTube для изучения основ машинного обучения с нуля
Если вы не знаете, с чего начать изучение машинного обучения, этот список под названием «Machine Learning: Teach by Doing» — отличный выбор, чтобы освоить как теорию, так и практическое программирование.
1. Введение в машинное обучение — Teach by Doing: https://lnkd.in/gqN2PMX5 2. Что такое машинное обучение? История машинного обучения: https://lnkd.in/gvpNSAKh 3. Типы моделей машинного обучения: https://lnkd.in/gSy2mChM 4. 6 этапов любого ML-проекта: https://lnkd.in/ggCGchPQ 5. Установка Python и VSCode, запуск первого кода: https://lnkd.in/gyic7J7b 6. Линейные классификаторы. Часть 1: https://lnkd.in/gYdfD97D 7. Линейные классификаторы. Часть 2: https://lnkd.in/gac_z-G8 8. Jupyter Notebook, Numpy и Scikit-Learn: https://lnkd.in/gWRaC_tB 9. Запуск алгоритма случайного линейного классификатора на Python: https://lnkd.in/g5HacbFC 10. Самая первая ML-модель — перцептрон: https://lnkd.in/gpce6uFt 11. Реализация перцептрона на Python: https://lnkd.in/gmz-XjNK 12. Теорема сходимости перцептрона: https://lnkd.in/gmz-XjNK 13. Магия признаков в машинном обучении: https://lnkd.in/gCeDRb3g 14. One-hot encoding (одноразрядное кодирование): https://lnkd.in/g3WfRQGQ 15. Логистическая регрессия. Часть 1: https://lnkd.in/gTgZAAZn 16. Функция потерь — кросс-энтропия: https://lnkd.in/g3Ywg_2p 17. Как работает градиентный спуск: https://lnkd.in/gKBAsazF 18. Логистическая регрессия с нуля на Python: https://lnkd.in/g8iZh27P 19. Введение в регуляризацию: https://lnkd.in/gjM9pVw2 20. Реализация регуляризации на Python: https://lnkd.in/gRnSK4v4 21. Введение в линейную регрессию: https://lnkd.in/gPYtSPJ9 22. Пошаговая реализация метода наименьших квадратов (OLS): https://lnkd.in/gnWQdgNy 23. Основы и интуиция гребневой регрессии (Ridge Regression): https://lnkd.in/gE5M-CSM 24. Резюме по регрессии для собеседований: https://lnkd.in/gNBWzzWv 25. Архитектура нейронной сети за 30 минут: https://lnkd.in/g7qSrkxG 26. Интуиция обратного распространения ошибки (Backpropagation): https://lnkd.in/gAmBARHm 27. Функции активации в нейронных сетях: https://lnkd.in/gqrC3zDP 28. Моментум в градиентном спуске: https://lnkd.in/g3M4qhbP 29. Практическое обучение нейросети на Python: https://lnkd.in/gz-fTBxs 30. Введение в сверточные нейронные сети (CNN): https://lnkd.in/gpmuBm3j👉 @DataSciencegx
Repost from N/a
Плейлист из 30 видео на YouTube для изучения основ машинного обучения с нуля
Если вы не знаете, с чего начать изучение машинного обучения, этот список под названием «Machine Learning: Teach by Doing» — отличный выбор, чтобы освоить как теорию, так и практическое программирование.
1. Введение в машинное обучение — Teach by Doing: https://lnkd.in/gqN2PMX5 2. Что такое машинное обучение? История машинного обучения: https://lnkd.in/gvpNSAKh 3. Типы моделей машинного обучения: https://lnkd.in/gSy2mChM 4. 6 этапов любого ML-проекта: https://lnkd.in/ggCGchPQ 5. Установка Python и VSCode, запуск первого кода: https://lnkd.in/gyic7J7b 6. Линейные классификаторы. Часть 1: https://lnkd.in/gYdfD97D 7. Линейные классификаторы. Часть 2: https://lnkd.in/gac_z-G8 8. Jupyter Notebook, Numpy и Scikit-Learn: https://lnkd.in/gWRaC_tB 9. Запуск алгоритма случайного линейного классификатора на Python: https://lnkd.in/g5HacbFC 10. Самая первая ML-модель — перцептрон: https://lnkd.in/gpce6uFt 11. Реализация перцептрона на Python: https://lnkd.in/gmz-XjNK 12. Теорема сходимости перцептрона: https://lnkd.in/gmz-XjNK 13. Магия признаков в машинном обучении: https://lnkd.in/gCeDRb3g 14. One-hot encoding (одноразрядное кодирование): https://lnkd.in/g3WfRQGQ 15. Логистическая регрессия. Часть 1: https://lnkd.in/gTgZAAZn 16. Функция потерь — кросс-энтропия: https://lnkd.in/g3Ywg_2p 17. Как работает градиентный спуск: https://lnkd.in/gKBAsazF 18. Логистическая регрессия с нуля на Python: https://lnkd.in/g8iZh27P 19. Введение в регуляризацию: https://lnkd.in/gjM9pVw2 20. Реализация регуляризации на Python: https://lnkd.in/gRnSK4v4 21. Введение в линейную регрессию: https://lnkd.in/gPYtSPJ9 22. Пошаговая реализация метода наименьших квадратов (OLS): https://lnkd.in/gnWQdgNy 23. Основы и интуиция гребневой регрессии (Ridge Regression): https://lnkd.in/gE5M-CSM 24. Резюме по регрессии для собеседований: https://lnkd.in/gNBWzzWv 25. Архитектура нейронной сети за 30 минут: https://lnkd.in/g7qSrkxG 26. Интуиция обратного распространения ошибки (Backpropagation): https://lnkd.in/gAmBARHm 27. Функции активации в нейронных сетях: https://lnkd.in/gqrC3zDP 28. Моментум в градиентном спуске: https://lnkd.in/g3M4qhbP 29. Практическое обучение нейросети на Python: https://lnkd.in/gz-fTBxs 30. Введение в сверточные нейронные сети (CNN): https://lnkd.in/gpmuBm3j👉 @DataSciencegx
⚡⚡⚡Москва: Okko Tech Team вместе с коллегами из MTС и ecom.tech приглашает вас на технический митап! 🙌
📅Когда: 17 апреля в 18.30
📍Где: Москва, Даниловаская мануфактура, Варшавское шоссе 9 стр.1, 5 подъезд, 5 подъезд
(* при себе необходимо иметь паспорт для прохода в здание)
Программа мероприятия:
👫 18.30-18.45 Сбор гостей
🔖 18.45-19.15
Федулаев Алексей, Head of Cloud Native Security at MTC Web Services
Тема: ИИ в безопасности и безопасность в ИИ.
Поговорим о том, как ИИ помогает защищать данные и как защитить сам ИИ от злоумышленников.
🔖 19.15-19.45
Владимир Цельев, Инженер Okko
Тема: ClearML: польза и возможные сложности.
Расскажем, почему ClearML — это находка для ML-экспертов, и какие подводные камни могут встретиться на пути к успеху.
🍕19.45-20.00 Перерыв
🔖20.00-20.30
Кристина Пахомова, Инженер данных в ecom.tech
Тема: Миграция хранилища данных Мегамаркета: как претерепрь большие изменения в сжатые сроки и не обрушить SLA.
Поделимся опытом миграции хранилища данных маркетплейса, расскажем о выбранной стратегии, какие инструменты были разработаны и адаптированы для того, чтобы миграция прошла максимально комфортно и без лишних сюрпризов.
🔖 20.30-21.00
Кирилл Попов, Инженер Okko
Тема: OpenAPI Specification. Организация, сложные типы данных.
Погрузимся в мир OpenAPI спецификаций и узнаем, как организовать работу с ними, чтобы даже самые сложные типы данных стали вашими лучшими друзьями.
🥂 21.00-22.00 Нетворкинг, легкие напитки и закуски станут приятным завершением вечера
На митапе от Okko Tech Team всегда интересно, вкусно и нет времени на поскучать☺️
Регистрируйся тут 👈
11 графиков в Data Science, которые используются в 90% случаев
👉 @DataSciencegx
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
