Data Portal | DS & ML
رفتن به کانال در Telegram
Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx
نمایش بیشتر8 404
مشترکین
-624 ساعت
-107 روز
-930 روز
آرشیو پست ها
Вам нравится читать контент на этом канале?
Возможно, вы задумывались о том, чтобы купить на нем интеграцию?
Следуйте 3 простым шагам, чтобы сделать это:
1) Нажмите на ссылку: Вход
2) Пополняйтесь удобным способом
3) Размещайте публикацию
Если тематика вашего поста подойдет нашему каналу, мы с удовольствием опубликуем его.
Ускорьте Python в 50 раз за 4 простых шага
По умолчанию интерпретатор Python, CPython, работает медленно, в основном из-за своей динамичности.
После определения переменной с определённым типом её можно изменить на другой. Эти динамические манипуляции приводят к дополнительным затратам на выполнение и память.
Чтобы ускорить работу, используйте модуль Cython. Он превращает код Python в C, делая его быстрым и эффективным.
Вот как использовать модуль Cython:
1) Загрузите модуль Cython: %load_ext Cython
2) Добавьте магическую команду Cython
3) Указывайте типы данных параметров при использовании функций
4) Определяйте каждую переменную с помощью ключевого слова cdef и указывайте её тип данных
Вот и всё!
Теперь ваш код будет работать с ускорением до скорости нативного машинного кода, как показано на картинке.
👉 @DataSciencegx
Почему DeepSeek Janus-7B — это нечто действительно невероятное
В статье рассматриваются ключевые особенности новой мультимодальной модели DeepSeek Janus-7B, которая, по заявлениям, превосходит популярные AI-инструменты, такие как DALL-E 3 и Stable Diffusion.
Подробно анализируются её уникальные технические решения и возможности.
🔜 Читать статью
👉 @DataSciencegx | #cтатья
Совет IT-спецам на 2025 год - чаще посещайте тематические мероприятия
Зачем тратить время на Ютубчик, когда можно интересно проводить время, при этом развивая свои навыки!
А чтобы не гуглить афиши и не подписываться на сотню разных каналов, IT-мероприятия России уже собрали все самые топовые события в одном месте.
Оффлайн и онлайн, для разных специальностей и уровней знаний.
👨🏻💻 В этом канале ты найдешь самые актуальные и интересные события: анонсы форумов, конференций, митапов, вебинаров, хакатонов, олимпиад и многое другое.
Присоединяйся к комьюнити лучших спецов и заново влюбись в свою работу:
IT мероприятия России / ITMeeting / IT events
bRAG: Серия уроков по RAG
Открытое руководство, которое проведет вас от основ RAG до продвинутых реализаций.
Уроки насыщены практическими примерами, которые помогут вам создавать готовые к продакшену системы RAG с применением новейших технологий, таких как CRAG и многовекторный поиск.
👉 https://github.com/bRAGAI/bRAG-langchain
👉 @DataSciencegx | #ресурсы
«Комбинаторика для начинающих» — бесплатный курс на «Степике»
Курс предназначен для начинающих, которые хотят освоить основы комбинаторики с нуля, а также для тех, кто когда-то изучал этот раздел математики, но нуждается в обновлении и систематизации знаний.
Включает разделы:
🔸Правило сложения и умножения. Принцип Дирихле
🔸Основные комбинаторные величины и их свойства
🔸Сочетания с повторениями и без
🔸Комбинаторные тождества
🔸Полиномиальные коэффициенты
🔸Формула включений и исключений
🔸Выравнивания
👉 Ссылка на курс
👉 @DataSciencegx | #ресурсы
⚡ Kali LInux — канал-гайд, который научит тебя хакингу и защите информации с нуля.
Это кладезь полезной информации, первоисточник того, что появляется в платных гайдах и курсах.
•Лучшие бесплатные курсы и книги по Этичному Хакингу и Информационной Безопасности.
• Полезный репозиторий с подборкой ресурсов по хакингу
• Где изучать Linux и хакинг. Бесплатные курсы
•Виртуальная машина Linux для #OSINT на базе Ubuntu.
•Целая папка полезных ресурсов для Хакеров
и многое другое
🔈 Подписывайся, это самый простой способ научиться хакингу: @linuxkalii
Отличный ресурс для изучения SQL — SQL Squid Game
Вы — новоиспечённый дата-сайентист в загадочной организации. Ваш босс, Фронтмен, требует от вас решения бизнес-задач с помощью SQL. Не справитесь — ☠️9 уровней, растущая сложность, а заодно — отличная прокачка навыков. Не уверены в силах? На сайте есть 33 урока, чтобы подтянуть SQL перед стартом Держите ссылку: https://datalemur.com/sql-game 👉 @DataSciencegx | #ресурсы
Gaze-LLE
Это модель позволяющая предсказывать куда направлен взгляд человека на видео.
Метод поддерживает многопользовательскую инференцию, обрабатывая пакеты изображений с указанием ограничивающих рамок на головы людей.
Включены функции визуализации тепловых карт и скрипты для оценки на наборах данных GazeFollow и VideoAttentionTarget, а модели можно легко интегрировать с PyTorch Hub.
👉 https://github.com/fkryan/gazelle
👉 @DataSciencegx | #ресурсы
Гайд по техникам RAG
В репозитории собраны материалы по различным способам реализации Retrieval Augmented Generation (RAG). Вот некоторые методы:
🔸Простой RAG с LangChain;
🔸RAG с валидацией данных;
🔸RAG с трансформацией запроса;
🔸Relevant Segment Extraction (RSE);
🔸Сжатие контекста из документов.
👉 Ссылка на репозиторий
👉 @DataSciencegx | #ресурсы
Совет на 2025 год - учите Data Science и Machine learning
Все нейросети, базы данных компаний, выявление болезней и многое другое - не обходятся без DS и ML.
А чтобы освоиться за несколько месяцев, а не лет, читайте канал Data Science. В нём на пальцах рассказывается, что и как учить, чтобы стать специалистом.
Начните 2025 год с освоения новой профессии - devsp
Scientific Computing with Python — бесплатный интерактивный курс
Это своего рода учебник от Freecodecamp. Его цель — дать обучающимся навыки анализа и обработки данных с помощью Python. Учебник содержит следующие темы:
⏩работа со строками;
⏩List Comprehension;
⏩основы дизайна алгоритмов;
⏩структуры данных;
⏩классы и объекты.
⛓ Ссылка: тык
👉 @DataSciencegx | #курсы
Советы от эксперта для тех, кто хочет развиваться в области DS и ML
На канале школы MLinside вышел подкаст с Алексеем Толстиковым, руководителем ШАД Яндекса.
Что внутри:
⏩ Какие навыки важны для работы в Data Science и Machine Learning
⏩ Почему одних технических знаний может не хватить для того, чтобы быть востребованным специалистом
⏩ Роль соревнований и междисциплинарности в развитии карьеры
⏩ Как поступить в ШАД и совмещать учёбу с работой
🔜 Ссылка: тык
👉 @DataSciencegx | #ресурсы
Проектирование систем машинного обучения
Автор: Чип Хьюен
Год: 2023
⬇️ Скачать книгу
👉 @DataSciencegx | #книги
🧠 Machine Learning — авторский канал, где собрана вся база по ИИ и машинному обучению.
Senior разработчик AI-алгоритмов и автономных агентов, разбирает гайды, редкую литературу и код топовых моделей машинного обучения и искусственного интеллекта.
В 2025 году ИИ выйдет на совершенно новый уровень тот, кто не успеет за прогрессом - отстанет, а кто разберется - сорвет куш.
Стоит подписаться: t.me/ai_machinelearning_big_data
SQL за 6 недель для дата-сайентистов
Опытный дата-сайентист с семилетним стажем создал подробный план изучения SQL, представленный в формате репозитория на GitHub. Каждый этап обучения включает полезные ссылки на обучающие материалы.
Вот как выглядит 6-недельная программа:
🔸 Неделя 1: Основы SQL. Научимся извлекать данные из баз данных.
🔸 Неделя 2: Группировка данных с помощью GROUP BY.
🔸 Неделя 3: Разбираем типы JOIN и их применение.
🔸 Неделя 4: Погружаемся в оконные функции.
🔸 Неделя 5: Изучаем CTE и подзапросы.
🔸 Неделя 6: Создаём собственный проект, чтобы закрепить знания.
👉 Дорожная карта на GitHub
👉 @DataSciencegx | #ресурсы
Гайд по тензорам
Эта компактная книга на 50 страниц подробно освещает все аспекты, связанные с тензорами
Тензор — это универсальное понятие, обозначающее матрицы с любым числом измерений. К тензорам относятся как скаляры (тензоры нулевого ранга), так и векторы (тензоры первого ранга) и матрицы (тензоры второго ранга).🔜 Ссылка на сайт The Tensor Cookbook 👉 @DataSciencegx | #ресурсы
Шпаргалка по методам кодирования категориальных признаков
👉 @DataSciencegx
Автоматизация контакт-центров — тренд или способ увеличить прибыль?
Несвоевременное обслуживание клиентов, трудности в коммуникации с клиентами из-за неавтоматизированных систем, ручной ввод данных CRM… И это еще не все проблемы, с которыми сталкиваются менеджеры по обслуживанию клиентов.
На бесплатном вебинаре вы познакомитесь с омниканальной платформой контакт-центра и ее ключевыми возможностями.
Наш Контакт-центр — это:
🖥 Удобный конструктор для всех задач бизнеса
⏱️ Внедрение за 1-2 месяца
📞 Автообзвон на 140 000 звонков в день при 20 операторах
С автоматизацией вы получите:
• снижение нагрузки на операторов
• работу через все каналы без сложных интеграций
• конструктор для решения ваших задач
📅 Присоединяйтесь к вебинару 12 декабря в 13:00 по МСК
«Контакт-центр с максимальной выгодой для вашего бизнеса»
Мы выгодный контакт для контакт-центра!
👉 Ссылка для регистрации
Как загружать веса моделей при ограниченных ресурсах?
Если объём памяти на вашем GPU ограничен, но нужно сохранить модель с помощью команды torch.save(model.state_dict(), 'model.pth') и продолжить её обучение в будущем, это вполне решаемая задача.
👉 В этом ноутбуке вы найдёте полезные советы и рекомендации, которые помогут справиться с этой проблемой.
👉 @DataSciencegx | #ресурсы
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
