ch
Feedback
Data Science

Data Science

前往频道在 Telegram

DS По всем вопросам- @haarrp @ai_machinelearning_big_data - machine learning @pythonl - Python @itchannels_telegram - 🔥 best it channels @ArtificialIntelligencedl - AI @pythonlbooks-📚 @programming_books_it -📚 Реестр РКН: https://clck.ru/3Fk3zS

显示更多

📈 Telegram 频道 Data Science 的分析概览

频道 Data Science (@datascienceiot) 是活跃参与者。目前社区聚集了 41 885 名订阅者,在 技术与应用 类别中位列第 3 241,并在 俄罗斯 地区排名第 15 299

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 41 885 名订阅者。

根据 18 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -32,过去 24 小时变化为 -12,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 8.85%。内容发布后 24 小时内通常能获得 2.90% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 3 709 次浏览,首日通常累积 1 213 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 0
  • 主题关注点: 内容集中在 llm, агентов, api, октября, разработчиков 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
DS По всем вопросам- @haarrp @ai_machinelearning_big_data - machine learning @pythonl - Python @itchannels_telegram - 🔥 best it channels @ArtificialIntelligencedl - AI @pythonlbooks-📚 @programming_books_it -📚 Реестр РКН: https://clck.ru/3...

凭借高频更新(最新数据采集于 19 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

41 885
订阅者
-1224 小时
-157
-3230
帖子存档
Сегодня не можешь найти стажировку. Завтра — открываешь с ноги дверь в топовые компании и претендуешь на зп выше рынка. Как т
Сегодня не можешь найти стажировку. Завтра — открываешь с ноги дверь в топовые компании и претендуешь на зп выше рынка. Как так? Очень просто со знанием SQL. Как работать с данными на профессиональном уровне, рассказывают на курсе Нетологии «SQL и получение данных». За 2 месяца вы узнаете, как создавать собственные базы данных, станете асом в создании сложных запросов и сможете с первого раза находить нужную информацию в огромных таблицах. Всё обучение построено с упором на практику: вы выполните 6 работ, а в конце самостоятельно развернёте и проанализируете базу данных. Как минимум — будет повод похвастаться друзьям, как максимум — добавить новый скилл в резюме и получить крутую работу. Регистрируйтесь Реклама. ООО "Нетология". Erid 2VSb5wTxP5A

📚 Машинное и глубокое обучение ОНЛАЙН-УЧЕБНИК 📖 Книга @datascienceiot
+1
📚 Машинное и глубокое обучение ОНЛАЙН-УЧЕБНИК 📖 Книга @datascienceiot

SLAck: Semantic, Location, and Appearance Aware Open-Vocabulary Tracking 📖 Arxiv @datascienceiot
SLAck: Semantic, Location, and Appearance Aware Open-Vocabulary Tracking 📖 Arxiv @datascienceiot

Repost from Machinelearning
📌Туториал по файнтюну Qwen2-VL-7B с использованием экосистемы Hugging Face. Статья на HF из цикла Open-Source AI Cookbook c
+3
📌Туториал по файнтюну Qwen2-VL-7B с использованием экосистемы Hugging Face. Статья на HF из цикла Open-Source AI Cookbook c подробным пошаговым описанием и примерами кода процесса тонкой настройки VLM Qwen2-VL-7B в области ответов на вопросы по изображениям с использованием библиотеки Transformer Reinforcement Learning (TRL). В качестве целевого датасета используется ChartQA, который содержит диаграммы разных типов в паре с вопросами и ответами. Для обучения модели демонстрируется методы Supervised Fine-Tuning (SFT) с использованием библиотеки TRL, QLoRA, которая квантует веса LoRA, обеспечивая более низкие требования к памяти и повышенную эффективность обучения. Отдельным разделом выделен процесс подготовки данных к обучению с помощью функции collate_fn, которая выполняет корректное извлечение и пакетную обработку данных и их форматирование для модели. Обучение модели осуществляется с помощью класса SFTTrainer. В результате модель научилась отвечать на вопросы в соответствии с используемым датасетом. Оценить готовый файнтюн можно в демо на HF Space. Дополнительно, в качестве альтернативы тонкой настройке, рассматривается использование промтинга с добавлением системного сообщения для контекстуализации ввода для модели, чтобы улучшить точность ее ответов. ▶️ Блокнот на Google Collab для практических экспериментов. Для его запуска понадобится платный тариф с GPU А100. ▶️Структура туториала по разделам: 🟢Установка среды 🟢Загрузка датасета 🟢Загрузка модели и проверка производительности 🟢Файнтюн модели с помощью TRL 🟠Загрузка квантованной модели для обучения 🟠Настройка QLoRA и SFTConfig 🟠Обучение модели 🟢Тестирование готовой модели 🟢Сравнение обученной модели с базовой + промптинг 🟢Дополнительные ресурсы для более глубокого изучения VLM 🔜 Статья на HuggingFace @ai_machinelearning_big_data #AI #ML #VLM #HuggingFace #Tutorial

⚡️Всероссийский Хакатон ФИЦ 2024 🚀Попробуйте себя в одном из предложенных кейсов: 1. Семантический делитель текстов: Разрабо
⚡️Всероссийский Хакатон ФИЦ 2024 🚀Попробуйте себя в одном из предложенных кейсов: 1. Семантический делитель текстов: Разработать алгоритм, который сможет обеспечить точное разделение текста на блоки. 2. Контекстный перевод названий научных работ: Разработать переводчик, который будет переводить названия научных работ. 3. Прогнозирование бизнес драйверов: Разработать решение для задачи прогнозирования временных рядов бизнес-драйверов. 4. Система контроля и управления доступом: Разработка системы контроля и управления доступом. И др. 16 кейсов смотрите на сайте: https://фиц2024.рф/hackathon  Хакатон пройдет в 2 этапа: Отборочный этап в Онлайн, Финал в Офлайн. 🏆Призовой фонд: 6 000 000 руб. 🔥Дедлайн регистрации: 26 ноября, 23:59 📅Даты отборочного этапа: 29 ноября - 2 декабря 🦾Даты финала: 3 - 4 декабря Зарегистрируйтесь для участия в хакатоне: https://фиц2024.рф/hackathon #реклама О рекламодателе

Problem Solving with Algorithms and Data Structures 🔗 Book @datascienceiot
Problem Solving with Algorithms and Data Structures 🔗 Book @datascienceiot

Machine Learning for Hackers 📖 книга @datascienceiot
Machine Learning for Hackers 📖 книга @datascienceiot

Что инженер данных должен уметь в Kubernetes? ➡️ Запускать Apache Spark ➡️ Деплоить распределенные файловые системы и базы да
Что инженер данных должен уметь в Kubernetes? ➡️ Запускать Apache Spark ➡️ Деплоить распределенные файловые системы и базы данных ➡️ Разворачивать сервинг ML-моделей на KServe, Seldon Core, Bento+Yatai 9 декабря учебный центр Слёрм запускает новый поток курса «Kubernetes для разработчиков». Внутри — глубокий разбор куба с точки зрения приложения. В программе: 🔸 Внутреннее устройство куба 🔸 Управление сервисами 🔸 Работа с кластером и управление кластером ОБНОВИЛИ ПРАКТИКУ в августе 2024 года 🔸7 недель обучения 🔸7 встреч со спикерами 🔸76 часов практики и работы со стендами 🔸Итоговая сертификация 🎁 Видеокурс по основам Docker в подарок Старт потока: 9 декабря Изучить программу курса и занять место ➡️ по ссылке Реклама ООО «Слёрм» ИНН 3652901451

Introduction to Statistical Thought 📖 book @datascienceiot
+2
Introduction to Statistical Thought 📖 book @datascienceiot

Repost from Machinelearning
🌟 OpenCoder - модели для кодинга, cookbook обучения и датасеты. OpenCoder - это открытое и воспроизводимое семейство LLM для
+3
🌟 OpenCoder - модели для кодинга, cookbook обучения и датасеты. OpenCoder - это открытое и воспроизводимое семейство LLM для программирования, включающее 1,5B и 8B базовые и instruct версии, поддерживающее английский и китайский языки. Семейство моделей OpenCoder обучалось с нуля на 2,5 трлн. лексем, состоящих на 90 % из сырого кода и на 10 % из веб-данных, связанных с кодом, и прошло отладку на более чем 4,5 млн. высококачественных примеров SFT, в итоге достигнув производительности топовых LLM с похожей специализацией. В открытый доступ опубликованы не только веса моделей и код для инференса, но и датасеты, полный цикл обработки данных, результаты экспериментальной абляции и подробные протоколы обучения. OpenCoder тщательно протестирован с помощью исследований абляции на различных стратегиях очистки данных и процессах обучения, включая эксперименты по дедупликации на уровне файлов и репозиториев, что обеспечило семейству тщательную проверку производительности моделей. OpenCoder достигает высокой производительности в различных бенчмарках, что ставит их в ряд SOTA-моделей с открытым исходным кодом для задач программирования. ▶️ Семейство моделей OpenCoder : 🟢OpenCoder-1.5B-Base, 4 тыс. токенов контекста; 🟢OpenCoder-8B-Base, 8 тыс. токенов контекста; 🟠OpenCoder-1.5B-Instruct, 4 тыс. токенов контекста; 🟠OpenCoder-8B-Instruct, 8 тыс. токенов контекста; ▶️ Датасеты: 🟢OpenCoder-SFT-Stage1, 4.21 млн. строк; 🟠OpenCoder-SFT-Stage2, 375 тыс.строк. ▶️ Пример инференса на HF Transformers:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "infly/OpenCoder-8B-Instruct"
model = AutoModelForCausalLM.from_pretrained(model_name,
                                             torch_dtype=torch.bfloat16,
                                             device_map="auto",
                                             trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

messages=[
    { 'role': 'user', 'content': "write a quick sort algorithm in python."}
]

inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")

outputs = model.generate(inputs, max_new_tokens=512, do_sample=False)

result = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
🟡Страница проекта 🟡Набор моделей 🟡Arxiv 🟡Набор датасетов 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #OpenCoder #Datasets

Stanford “Probability Theory” lecture notes (PhD level) 📖 Lectures @datascienceiot
Stanford “Probability Theory” lecture notes (PhD level) 📖 Lectures @datascienceiot

Collection of resources in the form of eBooks related to Data Science, Machine Learning, and similar topics 📖 Github @datasc
Collection of resources in the form of eBooks related to Data Science, Machine Learning, and similar topics 📖 Github @datascienceiot

Вот что ждет в Т-Банке аналитиков DWH, кроме ДМС, крутых офисов и других плюшек: ▪️Актуальный стек. Здесь следят за трендами
Вот что ждет в Т-Банке аналитиков DWH, кроме ДМС, крутых офисов и других плюшек: ▪️Актуальный стек. Здесь следят за трендами и быстро внедряют новое. ▪️Улучшения может предложить каждый. Здесь знают, как устроен продукт, и влияют на его развитие. ▪️Прозрачная система роста. Вы всегда будете знать, какие навыки нужно подтянуть и как получить повышение. ▪️Вы окажетесь среди профессионалов, у которых можно многому научиться. А если захотите — можете стать ментором для младших коллег. Устраивайтесь в Т-Банк на позицию аналитика DWH до 23 декабря 2024 года и получайте приветственный бонус в размере одного оклада.

The hitchhikers guide to python 📖 Book @datascienceiot
The hitchhikers guide to python 📖 Book @datascienceiot

Тренажёр-практикум Python и SQL (от NumPy и OpenCV до PostgreSQL) в аналитике данных и ML Откройте карьерные возможности в ма
Тренажёр-практикум Python и SQL (от NumPy и OpenCV до PostgreSQL) в аналитике данных и ML Откройте карьерные возможности в машинном обучении и аналитике данных - Научитесь проводить анализ больших объёмов данных. - Создавайте интерактивные и 3D-визуализации для представления данных. - Освойте работу с SQL-базами для хранения, модификации и извлечения данных. Для кого будет полезен этот тренажёр? Аналитикам данных, бизнес-аналитикам и продуктовым специалистам: Новичкам и продолжающим в области анализа и визуализации данных, которые хотят освоить ключевые инструменты для эффективного анализа и машинного обучения на практике. Тем, кто уже знаком с Python и стремится развиваться в аналитике данных и ML: Разработчикам и специалистам по данным, стремящимся углубить навыки обработки данных и визуализации. Инженерам данных и всем заинтересованным: Тем, кто сталкивается с трудностями при предобработке данных для моделей машинного обучения и хочет выстроить системный подход к работе с ними. Тем, кто стремится автоматизировать процессы и управлять данными: После курса вы научитесь эффективно работать с NumPy и Pandas, создавать визуализации через Matplotlib и Seaborn, а также управлять базами данных с PostgreSQL. 🎓 Попробуйте первые уроки бесплатно! В демо-версии курса вы познакомитесь с основами библиотек NumPy, Pandas и Matplotlib, научитесь создавать и редактировать массивы, работать с изображениями и решать практические задачи. Пройдите 6 практических заданий сразу! PS. В демо также доступен ИИ-бот Ду-Ду с code review 24/7. 👉 Регистрация на демо-доступ

FRONTIERMATH: A BENCHMARK FOR EVALUATING ADVANCED MATHEMATICAL REASONING IN AI 📚 Read @datascienceiot
FRONTIERMATH: A BENCHMARK FOR EVALUATING ADVANCED MATHEMATICAL REASONING IN AI 📚 Read @datascienceiot

Освойте универсальные навыки в мире цифровых профессий — научитесь работать с SQL, Python, Power BI и DataLens на бесплатном
Освойте универсальные навыки в мире цифровых профессий — научитесь работать с SQL, Python, Power BI и DataLens на бесплатном курсе от Нетологии. В результате вы: — разберётесь в основах Python для анализа данных и узнаете, как извлекать информацию. — научитесь делать запросы и отчёты с помощью SQL. — сможете строить интерактивные дашборды в Power BI и DataLens. Курс подойдёт новичкам и тем, кто хочет расширить свои навыки. Также после бесплатного курса вы получите карьерную консультацию и скидку до 50% для продолжения обучения на курсах-профессиях в Нетологии. Присоединяйтесь бесплатно Реклама. ООО "Нетология". Erid 2VSb5xxJ9Zi

OPENCODER: THE OPEN COOKBOOK FOR TOP-TIER CODE LARGE LANGUAGE MODELS 📚 Книга @datascienceiot
OPENCODER: THE OPEN COOKBOOK FOR TOP-TIER CODE LARGE LANGUAGE MODELS 📚 Книга @datascienceiot

Яндекс Игры пришли к нам с запросом:
SELECT * 
FROM subscribers 
WHERE channel_name = 'datascienceiot'
AND technical_skills IN ('SQL', 'Airflow', 'MapReduce', 'DataLens') 
AND data_driven_approach = true 
AND analytical_mindset = true 
AND years_of_experience >= 2 
AND fit = true;
Ребята ищут аналитика в свою команду. Яндекс Игры посещают более 40 млн пользователей в месяц, поэтому можно проверять кучу гипотез на крупных выборках и экспериментировать. ВАЖНО. Проверенные гипотезы не пойдут «в стол», а будут помогать команде принимать взвешенные решения и влиять на развитие продукта. Если у тебя есть опыт работы с продуктами, аналитический склад ума и необходимые навыки, — это отличный шанс быстро вырасти и прокачаться на интересных задачах. Описание вакансии здесь, но лучше сразу пишите рекрутеру и договаривайтесь о собеседовании: @danny_md1

How to Build Your Career in AI 📚 Book @datascienceiot
+2
How to Build Your Career in AI 📚 Book @datascienceiot