Data Portal | DS & ML
Open in Telegram
Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx
Show more8 458
Subscribers
+5424 hours
+417 days
+5530 days
Posts Archive
Проектирование систем машинного обучения
Автор: Чип Хьюен
Год: 2023
⬇️ Скачать книгу
👉 @DataSciencegx | #книги
🧠 Machine Learning — авторский канал, где собрана вся база по ИИ и машинному обучению.
Senior разработчик AI-алгоритмов и автономных агентов, разбирает гайды, редкую литературу и код топовых моделей машинного обучения и искусственного интеллекта.
В 2025 году ИИ выйдет на совершенно новый уровень тот, кто не успеет за прогрессом - отстанет, а кто разберется - сорвет куш.
Стоит подписаться: t.me/ai_machinelearning_big_data
SQL за 6 недель для дата-сайентистов
Опытный дата-сайентист с семилетним стажем создал подробный план изучения SQL, представленный в формате репозитория на GitHub. Каждый этап обучения включает полезные ссылки на обучающие материалы.
Вот как выглядит 6-недельная программа:
🔸 Неделя 1: Основы SQL. Научимся извлекать данные из баз данных.
🔸 Неделя 2: Группировка данных с помощью GROUP BY.
🔸 Неделя 3: Разбираем типы JOIN и их применение.
🔸 Неделя 4: Погружаемся в оконные функции.
🔸 Неделя 5: Изучаем CTE и подзапросы.
🔸 Неделя 6: Создаём собственный проект, чтобы закрепить знания.
👉 Дорожная карта на GitHub
👉 @DataSciencegx | #ресурсы
Гайд по тензорам
Эта компактная книга на 50 страниц подробно освещает все аспекты, связанные с тензорами
Тензор — это универсальное понятие, обозначающее матрицы с любым числом измерений. К тензорам относятся как скаляры (тензоры нулевого ранга), так и векторы (тензоры первого ранга) и матрицы (тензоры второго ранга).🔜 Ссылка на сайт The Tensor Cookbook 👉 @DataSciencegx | #ресурсы
Шпаргалка по методам кодирования категориальных признаков
👉 @DataSciencegx
Автоматизация контакт-центров — тренд или способ увеличить прибыль?
Несвоевременное обслуживание клиентов, трудности в коммуникации с клиентами из-за неавтоматизированных систем, ручной ввод данных CRM… И это еще не все проблемы, с которыми сталкиваются менеджеры по обслуживанию клиентов.
На бесплатном вебинаре вы познакомитесь с омниканальной платформой контакт-центра и ее ключевыми возможностями.
Наш Контакт-центр — это:
🖥 Удобный конструктор для всех задач бизнеса
⏱️ Внедрение за 1-2 месяца
📞 Автообзвон на 140 000 звонков в день при 20 операторах
С автоматизацией вы получите:
• снижение нагрузки на операторов
• работу через все каналы без сложных интеграций
• конструктор для решения ваших задач
📅 Присоединяйтесь к вебинару 12 декабря в 13:00 по МСК
«Контакт-центр с максимальной выгодой для вашего бизнеса»
Мы выгодный контакт для контакт-центра!
👉 Ссылка для регистрации
Как загружать веса моделей при ограниченных ресурсах?
Если объём памяти на вашем GPU ограничен, но нужно сохранить модель с помощью команды torch.save(model.state_dict(), 'model.pth') и продолжить её обучение в будущем, это вполне решаемая задача.
👉 В этом ноутбуке вы найдёте полезные советы и рекомендации, которые помогут справиться с этой проблемой.
👉 @DataSciencegx | #ресурсы
PandasAI — это инструмент для анализа данных, позволяющий работать с ними через запросы на естественном языке
Где использовать:
⏩ в Jupyter ноутбуках,
⏩ Streamlit-приложениях,
⏩ в виде REST API.
Как использовать: Просто формулировать вопросы к данным на естественном языке.
🔜 Демо в Google Colab
🔜 Репозиторий проекта
👉 @DataSciencegx | #ресурсы
Краткий свод концепций Tensor Flow
⏩архитектуру TensorFlow: устройство и базовые концепты;
⏩типы данных и форматы тензоров в TensorFlow;
⏩оптимизацию и обучение моделей;
⏩обучение и распределённое вычисление: стратегии и параллелизация;
⏩работу с данными и их подготовку: Dataset API и трансформации данных;
⏩сохранение и развёртывание моделей.
🔜 Читать статью
👉 @DataSciencegx | #cтатья
Господи, да в чём проблема стать фронтендером?
Подписался на эти три канала:
👉 Фронтенд
👉 Верстка
👉 Node.JS
Заходишь каждый день, тратишь 15 минут и изучаешь актуальную информацию. Можешь сразу применять на практике. ВСЁ!
Это настолько просто, что даже твой кот справится. Подпишись сейчас, потом спасибо скажешь.
latexify — библиотека для красивого вывода формул
Вот основные функции:
⏩компилирует код Python или AST в формат LaTeX
⏩предоставляет классы для IPython для красивого отображения формул.
🔜 Ссылка на репозиторий
👉 @DataSciencegx | #ресурсы
Изучаем основы Python. Практический курс для дата-аналитиков
Автор: П.И. Меликов
Год: 2023
⬇️ Скачать книгу
👉 @DataSciencegx | #книги
⚡️Всероссийский Хакатон ФИЦ 2024
🚀Попробуйте себя в одном из предложенных кейсов:
Кейс №2. Выявление трендов в сфере бухгалтерского учета, поиск «болей» бухгалтера: разработать алгоритм для поиска новых трендов и проблем бухгалтера.
Кейс №8. Формирование фото и видео контента с использованием нейросетей на основе биографии и фото персоны.
Кейс №10. Цифровая карта подземных коммуникаций с использованием Cesium.
Кейс №12. Цифровой сервис для ведения реестра зеленых насаждений города Москвы.
Кейс №17. Стартовый (профилактический) комплаенс: предотвращение рисков с помощью AI.
Кейс №19. Parallax-scroll лендинг для сайта Insidium.
И другие 19 кейсов смотрите на сайте: https://фиц2024.рф/hackathon
Хакатон пройдет в 2 этапа: Отборочный этап в Онлайн, Финал в Офлайн.
🏆Призовой фонд: 6 000 000 руб.
🔥Дедлайн регистрации: 28 ноября, 23:59
📅Даты отборочного этапа: 29 ноября - 2 декабря
🦾Даты финала: 3 - 4 декабря
Зарегистрируйтесь для участия в хакатоне: https://фиц2024.рф/hackathon
Реклама. ООО «Акселератор Возможностей», ИНН: 9704005146, erid:2VtzqwZkaCf
Data Science Interview Questions & Exercises
Это подборка вопросов и ответов для собеседования на позицию дата-сайентиста.
Охватывает темы:
⏩основы машинного обучения;
⏩глубокое обучение и нейросети;
⏩статистика и теория верояностей;
⏩А/Б-тестирование;
⏩NLP.
🔜 Ссылка
👉 @DataSciencegx | #ресурсы
Illustrated Machine Learning
Этот сайт предоставляет визуальные объяснения различных концепций машинного обучения. Здесь можно найти иллюстрации по таким темам, как:
⏩Введение в машинное обучение
⏩Линейная регрессия
⏩Логистическая регрессия
⏩Деревья решений
⏩Бэггинг и бустинг
⏩Кластеризация
⏩Нейронные сети и глубокое обучение и др.
🔜 Ссылка на сайт
👉 @DataSciencegx | #ресурсы
Совет на 2025 год - учите Data Science и Machine learning
Все нейросети, базы данных компаний, выявление болезней и многое другое - не обходятся без DS и ML.
А чтобы освоиться за несколько месяцев, а не лет, читайте канал Data Science. В нём на пальцах рассказывается, что и как учить, чтобы стать специалистом.
Начните 2025 год с освоения новой профессии - devsp
Deep Learning на пальцах
Бесплатный курс по глубокому обучению от исследователя MIT Семёна Козлова. Он читается для магистрантов НГУ и студентов CS центра Новосибирска
Темы включают основы Python, numpy, работу с нейронными сетями, PyTorch, а также вводные концепции в NLP, компьютерное зрение, распознавание речи и обучение с подкреплением
🔜 Ссылка на материалы
👉 @DataSciencegx | #ресурсы
⚡️Всероссийский Хакатон ФИЦ 2024
🚀Попробуйте себя в одном из предложенных кейсов:
1. Семантический делитель текстов: Разработать алгоритм, который сможет обеспечить точное разделение текста на блоки в рамках произвольно заданных ограничений размера блока.
2. Контекстный перевод названий научных работ: Разработать и реализовать переводчик, который будет переводить названия научных работ с русского на английский.
3. Прогнозирование бизнес драйверов: Разработать решение для задачи прогнозирования временных рядов бизнес-драйверов и произвести прогноз на следующий календарный месяц.
4. Система контроля и управления доступом: Разработка системы контроля и управления доступом в реальном времени. Система будет включать API для управления сотрудниками, точками доступа и интеграцию с системой видеонаблюдения.
И другие 16 кейсов смотрите на сайте: https://фиц2024.рф/hackathon
Хакатон пройдет в 2 этапа: Отборочный этап в Онлайн, Финал в Офлайн.
🏆Призовой фонд: 6 000 000 руб.
🔥Дедлайн регистрации: 26 ноября, 23:59
📅Даты отборочного этапа: 29 ноября - 2 декабря
🦾Даты финала: 3 - 4 декабря
Зарегистрируйтесь для участия в хакатоне: https://фиц2024.рф/hackathon
Реклама. ООО «Акселератор Возможностей», ИНН: 9704005146, erid: 2VtzquqsWwY
Профессор Том Йет создал Google Sheets, в котором предлагает вам самостоятельно вычислить архитектуру Transformer
В таблице представлены все матрицы, составляющие систему, и ваша задача — вычислить результирующие матрицы. Ответы, указанные прописными буквами, можно скрыть для самопроверки.
Также автор делится полезными материалами для лучшего понимания архитектуры Transformer.
👉 @DataSciencegx | #ресурсы
Available now! Telegram Research 2025 — the year's key insights 
