Data Portal | DS & ML
前往频道在 Telegram
Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx
显示更多8 404
订阅者
-624 小时
-107 天
-930 天
帖子存档
Хватит ждать подготовку LLM неделями – ускорьте их обучение до пары часов
Тренировка LLM моделей на обычном компьютере может занять вечность. Значит, вы потеряете дополнительную прибыль.
Artificial Intelion помогает ML и DS-специалистам получить мгновенный доступ к лучшему железу.
Мы предоставляем серверы с большим объёмом VRAM (>24 Gb), чтобы вы могли работать с лучшими моделями и значительно сократить время обучения.
Ускорить развитие ваших проектов и опередить конкурентов: @artificial_intelion
🔥 Практическое видео по работе с базовым набором DS-инструментов
Видео с введением в основные библиотеки и инструменты для науки о данных и машинного обучения. Предназначено для начинающих.
Таймкоды:
⏩ Программирование на Python
⏩ Анализ данных с Pandas
⏩ Анализ данных с NumPy
⏩ Визуализация данных с Matplotlib
⏩ Визуализация данных с Seaborn
⏩ Визуализация данных с Plotly
⏩ Проект по анализу данных
⏩ Машинное обучение со Scikit-learn
⏩ Проект по машинному обучению
🔜 Ссылка на ролик
👉 @DataSciencegx | #курсы
Расширенная аналитика с PySpark: Практические примеры анализа больших наборов данных с использованием Python и Spark
Автор: Акаш Тандон, Сэнди Райза, Ури Ласерсон
Год: 2023
⬇️ Скачать книгу
👉 @DataSciencegx | #книги
Теоретические основы популярных алгоритмов машинного обучения и их реализация с нуля на Python
Автор «Хабра» Егор Захаренко составил список собственных статей с описанием популярных алгоритмов классического машинного обучения. К каждой статье прилагается код на Python.
Обучение с учителем
⏩ Линейная регрессия и её модификации
⏩ Логистическая и Softmax-регрессии
⏩ Линейный дискриминантный анализ (LDA)
⏩ Наивный байесовский классификатор
⏩ Метод опорных векторов (SVM)
⏩ Метод K-ближайших соседей (KNN)
⏩ Дерево решений (CART)
⏩ Бэггинг и случайный лес
⏩ Алгоритмы AdaBoost (SAMME & R2)
⏩ Градиентный бустинг и его модификации
⏩ Стекинг и блендинг
Обучение без учителя
⏩ Метод главных компонент (PCA)
⏩ Популярные алгоритмы кластеризации
🔜 Ноутбуки с алгоритмами можно скачать на Kaggle и GitHub.
👉 @DataSciencegx | #ресурсы
Базовая математика для искусственного интеллекта
Автор: Нельсон Хала
Год: 2024
⬇️ Скачать книгу
👉 @DataSciencegx | #книги
Стать Data-инженером за 120 часов
14 октября в Слёрме стартует поток курса «Data-инженер»: 88 часов практики и 32 часа теории.
Будем работать с большими данными:
✔️ Сбор, хранение и обработка
✔️ Визуализация и отчетность
✔️ Интеграция
⚙️ Освоим инструменты и технологии для аналитики и обработки данных и научимся эффективно их подбирать под задачу: PythonSQL, PostgreSQL, Сlickhouse, MongoDB, HDFSHadoop, Spark, Apache Kafka, Redis, Airflow, NiFi, dbt, Metabase.
⚡️Смотреть программу подробнее и оставить заявку по ссылке – на сайте⚡️
Отличные визуальные объяснения ключевых концепций и алгоритмов машинного обучения
MLU-Explain — проект Amazon, созданный для упрощения изучения теоретических и практических основ машинного обучения
Каждая из представленных тем сопровождается доступными объяснениями и интерактивными графиками:
⏩Нейронные сети
⏩Equality of odds
⏩Логистическая регрессия
⏩Линейная регрессия
⏩Обучение с подкреплением
⏩Случайный лес и др.
🔜 Перейти на сайт
👉 @DataSciencegx | #ресурсы
Бесплатные материалы с теорией и практикой математики для Data Science
Авторы из Amazon написали целый раздел по математике для сайта d2l.ai. Там есть про:
⏩векторы и линейные преобразования;
⏩спектральное разложение матрицы;
⏩дифференциальное исчисление;
⏩анализ функций многих переменных;
⏩интегральное исчисление;
⏩метод максимального правдоподобия;
⏩распределения;
⏩статистику;
⏩теорию информации.
Материал изложен на английском, но зато хорошо структурирован и сопровождается всеми необходимыми формулами и примерами кода.
Крутой бонус – можно выбрать диалект, на котором вам будут показываться примеры – PyTorch, Keras или MXNET.
🔜 Изучить всё можно по этой ссылке
👉 @DataSciencegx | #ресурсы
Основы инженерии данных: как создавать надёжные системы обработки данных
Автор: Д. Рис, М. Хоусли
Год: 2024
📂 Скачать книгу
👉 @DataSciencegx | #книги
🤩 Deep Learning Models
Репозиторий с коллекцией моделей и архитектур глубокого обучения. Все они представлены в Jupyter Notebook.
Репо охватывает модели:
— Перцептрон;
— Многослойный перцептрон;
— Свёрточные нейронные сети (AlexNet, LeNet и др.);
— Transformers;
— Генеративно-состязательные сети (GAN);
— Графовые нейронные сети.
🔜 Ссылка на репозиторий
👉 @DataSciencegx | #ресурсы
👩💻 Best-of Machine Learning with Python
Это репозиторий с 920 библиотеками и фреймворками на Python для машинного обучения. Все проекты ранжированы по качеству.
Репозиторий можно использовать как источник инструментов под различные нужды, в частности:
⏩для непосредственно машинного обучения;
⏩для визуализации данных;
⏩для работы с финансовыми, медицинскими и другими особыми данными;
⏩для оптического распознавания символов;
⏩для поиска ближайших элементов в больших наборах данных, основываясь на их векторных представлениях.
🔜 Ссылка на репозиторий
👉 @DataSciencegx | #ресурсы
⚡️ Аналитика данных - блог ведущего Дата саентиста, работающего с данными в Uber
Материал канала поможет реально вырасти до профессионала по работе с данными и получить самую высокоплачиваю ит-профессию.
А тут полная папка слитых курсов, книг и уроков для всех, кто хочет изучить Data Science на проф уровне.
1 канал вместо тысячи учебников и курсов, подписывайтесь: @data_analysis_ml
Наконец-то появился мощный курс по LLM для тех, кто хочет углубиться в тему 🔥
Вас ждут лекции о промт-инжиниринге, файнтюнинге (как и зачем это делать?), а также о RAG — методе, позволяющем обучить ChatGPT на нужных данных без файнтюна. Кроме того, вы узнаете, как оценивать LLM-модели.
Этот курс уникален: все лекции записаны опытными специалистами из Meta, Anthropic, Mistral и других передовых компаний в сфере ИИ.
Курс включает текстовые саммари, презентации, примеры кода и полезные ссылки на ресурсы.
Требования минимальны: базовые знания в области LLM и понимание ключевых терминов.
Ссылка на курс — здесь
👉 @DataSciencegx | #курсы
Data Scientist Handbook 2024
В этом репозитории собраны множество полезных ресурсов, которые помогут прокачать ваши навыки. Среди собранных ресурсов есть как платные, так и бесплатные
⛓ Ссылка: тык
👉 @DataSciencegx | #ресурсы
Топ на выходные: два сайта с наборами задач для тренировки навыков ML и AI.
Внутри задачки разной сложности в категориях линейной алгебры, machine и deep learning — идеально, если видите своё будущее в нейросетях.
Deep-ML и Tensorgym — не благодарите
👉 @DataSciencegx | #ресурсы
The Little Learner: чудесное машинное обучение
Автор: Фридман Д. П., Мендхекар А.
Год: 2024
📂 Скачать книгу
👉 @DataSciencegx | #книги
Бесплатный доступ к ИИ боту 🎁
Мик Вайсман запустил бота для расшифровки и автоматического создания конспектов встреч по аудиозаписям
— Voice Summary AI Sobir.ai
В текущей версии бота вы можете:
⚜️ Расшифровывать аудиозаметки, голосовые записи, записи встреч в Zoom и диктофонные записи.
⚜️ Создавать краткие конспекты, адаптированные под размер и тип заметки.
Бот автоматически подстраивается, чтобы предложить наилучший формат конспекта, будь то длинная встреча или личные заметки.
⚜️ Есть поддержка больших аудиофайлов встреч.
🎁 Чтобы получить БЕСПЛАТНЫЙ доступ к боту:
1️⃣ Подпишитесь на канал: https://t.me/+t_kAwcYQ1rkxMTIy
2️⃣ Поставьте «+» под последним постом в канале.
Открытый курс по ML с видео и лекциями от Амстердамского университета
Этот курс покрывает множество тем ML, вот некоторые из них:
— Gaussian Mixture Models
— PCA (Principal Component Analysis)
— SVM (Support Vector Machines)
— Bootstrapping, Feature Bagging
К каждой теме приводится pdf с основными формулами и видео с подробным объяснением, в целом очень годный курс
⛓ Ссылка: тык
👉 @DataSciencegx | #ресурсы
Maestro — это инструмент искусственного интеллекта, который использует возможности передовых нейронных сетей для выполнения ваших задач.
Этот Python-скрипт задействует до трех моделей ИИ для решения задач: Мощная связка из GPT-4o, Claude-3.5 и LlaMa 3, работающих вместе для решения ваших задач.
Роли моделей следующие:
🟡 ORCHESTRATOR MODEL — управляет всем процессом.Модель принимает ваш промпт, разбивает её на более мелкие задачи и передает их следующей модели.
🟡 SUB AGENT MODEL — выполняет ключевые функции проекта, такие как написание кода, генерация текста и многое другое.
🟡 REFINER MODEL — оптимизирует и улучшает результаты предыдущхи моделей, исправляет ошибки, делает текст более естественным и многое другое.
⛓ Ссылка: тык
👉 @DataSciencegx | #ресурсы
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
