Data Portal | DS & ML
Відкрити в Telegram
Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx
Показати більше8 404
Підписники
-624 години
-107 днів
-930 день
Архів дописів
PandasAI — это инструмент для анализа данных, позволяющий работать с ними через запросы на естественном языке
Где использовать:
⏩ в Jupyter ноутбуках,
⏩ Streamlit-приложениях,
⏩ в виде REST API.
Как использовать: Просто формулировать вопросы к данным на естественном языке.
🔜 Демо в Google Colab
🔜 Репозиторий проекта
👉 @DataSciencegx | #ресурсы
Краткий свод концепций Tensor Flow
⏩архитектуру TensorFlow: устройство и базовые концепты;
⏩типы данных и форматы тензоров в TensorFlow;
⏩оптимизацию и обучение моделей;
⏩обучение и распределённое вычисление: стратегии и параллелизация;
⏩работу с данными и их подготовку: Dataset API и трансформации данных;
⏩сохранение и развёртывание моделей.
🔜 Читать статью
👉 @DataSciencegx | #cтатья
Господи, да в чём проблема стать фронтендером?
Подписался на эти три канала:
👉 Фронтенд
👉 Верстка
👉 Node.JS
Заходишь каждый день, тратишь 15 минут и изучаешь актуальную информацию. Можешь сразу применять на практике. ВСЁ!
Это настолько просто, что даже твой кот справится. Подпишись сейчас, потом спасибо скажешь.
latexify — библиотека для красивого вывода формул
Вот основные функции:
⏩компилирует код Python или AST в формат LaTeX
⏩предоставляет классы для IPython для красивого отображения формул.
🔜 Ссылка на репозиторий
👉 @DataSciencegx | #ресурсы
Изучаем основы Python. Практический курс для дата-аналитиков
Автор: П.И. Меликов
Год: 2023
⬇️ Скачать книгу
👉 @DataSciencegx | #книги
⚡️Всероссийский Хакатон ФИЦ 2024
🚀Попробуйте себя в одном из предложенных кейсов:
Кейс №2. Выявление трендов в сфере бухгалтерского учета, поиск «болей» бухгалтера: разработать алгоритм для поиска новых трендов и проблем бухгалтера.
Кейс №8. Формирование фото и видео контента с использованием нейросетей на основе биографии и фото персоны.
Кейс №10. Цифровая карта подземных коммуникаций с использованием Cesium.
Кейс №12. Цифровой сервис для ведения реестра зеленых насаждений города Москвы.
Кейс №17. Стартовый (профилактический) комплаенс: предотвращение рисков с помощью AI.
Кейс №19. Parallax-scroll лендинг для сайта Insidium.
И другие 19 кейсов смотрите на сайте: https://фиц2024.рф/hackathon
Хакатон пройдет в 2 этапа: Отборочный этап в Онлайн, Финал в Офлайн.
🏆Призовой фонд: 6 000 000 руб.
🔥Дедлайн регистрации: 28 ноября, 23:59
📅Даты отборочного этапа: 29 ноября - 2 декабря
🦾Даты финала: 3 - 4 декабря
Зарегистрируйтесь для участия в хакатоне: https://фиц2024.рф/hackathon
Реклама. ООО «Акселератор Возможностей», ИНН: 9704005146, erid:2VtzqwZkaCf
Data Science Interview Questions & Exercises
Это подборка вопросов и ответов для собеседования на позицию дата-сайентиста.
Охватывает темы:
⏩основы машинного обучения;
⏩глубокое обучение и нейросети;
⏩статистика и теория верояностей;
⏩А/Б-тестирование;
⏩NLP.
🔜 Ссылка
👉 @DataSciencegx | #ресурсы
Illustrated Machine Learning
Этот сайт предоставляет визуальные объяснения различных концепций машинного обучения. Здесь можно найти иллюстрации по таким темам, как:
⏩Введение в машинное обучение
⏩Линейная регрессия
⏩Логистическая регрессия
⏩Деревья решений
⏩Бэггинг и бустинг
⏩Кластеризация
⏩Нейронные сети и глубокое обучение и др.
🔜 Ссылка на сайт
👉 @DataSciencegx | #ресурсы
Совет на 2025 год - учите Data Science и Machine learning
Все нейросети, базы данных компаний, выявление болезней и многое другое - не обходятся без DS и ML.
А чтобы освоиться за несколько месяцев, а не лет, читайте канал Data Science. В нём на пальцах рассказывается, что и как учить, чтобы стать специалистом.
Начните 2025 год с освоения новой профессии - devsp
Deep Learning на пальцах
Бесплатный курс по глубокому обучению от исследователя MIT Семёна Козлова. Он читается для магистрантов НГУ и студентов CS центра Новосибирска
Темы включают основы Python, numpy, работу с нейронными сетями, PyTorch, а также вводные концепции в NLP, компьютерное зрение, распознавание речи и обучение с подкреплением
🔜 Ссылка на материалы
👉 @DataSciencegx | #ресурсы
⚡️Всероссийский Хакатон ФИЦ 2024
🚀Попробуйте себя в одном из предложенных кейсов:
1. Семантический делитель текстов: Разработать алгоритм, который сможет обеспечить точное разделение текста на блоки в рамках произвольно заданных ограничений размера блока.
2. Контекстный перевод названий научных работ: Разработать и реализовать переводчик, который будет переводить названия научных работ с русского на английский.
3. Прогнозирование бизнес драйверов: Разработать решение для задачи прогнозирования временных рядов бизнес-драйверов и произвести прогноз на следующий календарный месяц.
4. Система контроля и управления доступом: Разработка системы контроля и управления доступом в реальном времени. Система будет включать API для управления сотрудниками, точками доступа и интеграцию с системой видеонаблюдения.
И другие 16 кейсов смотрите на сайте: https://фиц2024.рф/hackathon
Хакатон пройдет в 2 этапа: Отборочный этап в Онлайн, Финал в Офлайн.
🏆Призовой фонд: 6 000 000 руб.
🔥Дедлайн регистрации: 26 ноября, 23:59
📅Даты отборочного этапа: 29 ноября - 2 декабря
🦾Даты финала: 3 - 4 декабря
Зарегистрируйтесь для участия в хакатоне: https://фиц2024.рф/hackathon
Реклама. ООО «Акселератор Возможностей», ИНН: 9704005146, erid: 2VtzquqsWwY
Профессор Том Йет создал Google Sheets, в котором предлагает вам самостоятельно вычислить архитектуру Transformer
В таблице представлены все матрицы, составляющие систему, и ваша задача — вычислить результирующие матрицы. Ответы, указанные прописными буквами, можно скрыть для самопроверки.
Также автор делится полезными материалами для лучшего понимания архитектуры Transformer.
👉 @DataSciencegx | #ресурсы
🔢 Калькулятор для расчёта необходимого размера выборки для A/B тестов
Реддитор поделился сайтом, который сделал, чтобы облегчить себе жизнь.
Калькулятор может:
⏩работать с разными пропорциями распределения групп (например, 20/80),
⏩поддерживать более двух тестируемых групп помимо,
⏩выбирать между односторонним и двусторонним статистическим тестом.
🔜 Ссылка на калькулятор
👉 @DataSciencegx | #ресурсы
⚡️ Awesome Machine Learning — фреймворки и библиотеки для ML
Репозиторий содержащий подборку полезных ресурсов, библиотек и инструментов для изучения и работы с машинным обучением (ML).
🔜 Ссылка на репозиторий Awesome Machine Learning
👉 @DataSciencegx | #ресурсы
🔥 Бесплатный курс по компьютерному зрению от Hugging Face
Этот курс предлагает пошаговое введение в основы компьютерного зрения, включая как теорию, так и практические занятия. В нём можно найти следующие темы:
⏩Основы компьютерного зрения;
⏩Свёрточные нейронные сети;
⏩Визуальные трансформеры;
⏩Генеративные модели;
⏩Обработка видео;
⏩Машинное 3D-зрение, визуализация сцен и реконструкция;
⏩Zero-shot зрение (позволяет компьютерам распределять объекты по классам, которые они раньше не видели);
⏩Этические аспекты компьютерного зрения.
🔜 Ссылка на курс
👉 @DataSciencegx | #курсы
Это — база по Machine Learning и Data Science, которая заменит вам сотни тг-каналов и сайтов. Фишка в том, что здесь опытные ML-специалисты первыми освещают новости сферы, пишут емкие разборы статей и делятся прикладными материалами.
И канал – только часть клада: ребята сделали целый сайт с научными лонгридами, ML-соревнованиями и свежими вакансиями индустрии.
Подписывайтесь: @data_secrets – это жемчужина, которую можно уверенно рекомендовать.
Глубокое обучение с fastai и PyTorch. Минимум формул, минимум кода, максимум эффективности
Автор: Гуггер Сильвейн, Ховард Джереми
Год: 2022
⬇️ Скачать книгу
👉 @DataSciencegx | #книги
🔥 Несколько полезных шпаргалок для дата-сайентистов
Могут пригодиться при подготовке к собеседованию.
⏩Введение в теорию вероятностей
⏩Обзор способов визуализации данных
⏩Описательная статистика
👉 @DataSciencegx | #ресурсы
🔥 Почти 1000 опенсорсных LLM-инструментов
На этом сайте каждые 6 часов обновляется llama-police — список инструментов на основе больших языковых моделей (LLM) с открытым исходным кодом. В таблице перечислены репозитории таких проектов, их краткое описание, количество контрибьюторов, звёзд и т.д.
🔜 Большинство из проектов также можно найти в cool-llm-repos на GitHub.
🔜 Ссылка на сайт
👉 @DataSciencegx | #ресурсы
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
