ch
Feedback
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

前往频道在 Telegram

Все самое полезное для дата сайентиста в одном канале. По рекламе: @proglib_adv Курс по Ai-агентам: https://clc.to/9L0Tqg Для обратной связи: @proglibrary_feeedback_bot РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9

显示更多

📈 Telegram 频道 Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение 的分析概览

频道 Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение (@dsproglib) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 18 502 名订阅者,在 技术与应用 类别中位列第 7 254,并在 俄罗斯 地区排名第 36 554

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 18 502 名订阅者。

根据 10 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -21,过去 24 小时变化为 3,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 6.73%。内容发布后 24 小时内通常能获得 4.52% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 1 246 次浏览,首日通常累积 837 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 5
  • 主题关注点: 内容集中在 сайентиста, llm, буст, навигация, openai 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
Все самое полезное для дата сайентиста в одном канале. По рекламе: @proglib_adv Курс по Ai-агентам: https://clc.to/9L0Tqg Для обратной связи: @proglibrary_feeedback_bot РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9

凭借高频更新(最新数据采集于 11 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

18 502
订阅者
+324 小时
-97
-2130
吸引订阅者
六月 '26
六月 '26
+33
在0个频道中
五月 '26
+142
在1个频道中
Get PRO
四月 '26
+106
在0个频道中
Get PRO
三月 '26
+329
在4个频道中
Get PRO
二月 '26
+154
在5个频道中
Get PRO
一月 '26
+212
在4个频道中
Get PRO
十二月 '25
+211
在3个频道中
Get PRO
十一月 '25
+101
在1个频道中
Get PRO
十月 '25
+148
在5个频道中
Get PRO
九月 '25
+105
在2个频道中
Get PRO
八月 '25
+103
在4个频道中
Get PRO
七月 '25
+171
在2个频道中
Get PRO
六月 '25
+185
在42个频道中
Get PRO
五月 '25
+319
在6个频道中
Get PRO
四月 '25
+206
在18个频道中
Get PRO
三月 '25
+247
在53个频道中
Get PRO
二月 '25
+236
在36个频道中
Get PRO
一月 '25
+180
在41个频道中
Get PRO
十二月 '24
+212
在42个频道中
Get PRO
十一月 '24
+217
在52个频道中
Get PRO
十月 '24
+224
在43个频道中
Get PRO
九月 '24
+249
在38个频道中
Get PRO
八月 '24
+269
在37个频道中
Get PRO
七月 '24
+197
在37个频道中
Get PRO
六月 '24
+257
在31个频道中
Get PRO
五月 '24
+429
在38个频道中
Get PRO
四月 '24
+339
在38个频道中
Get PRO
三月 '24
+437
在32个频道中
Get PRO
二月 '24
+426
在32个频道中
Get PRO
一月 '24
+473
在28个频道中
Get PRO
十二月 '23
+604
在34个频道中
Get PRO
十一月 '23
+289
在13个频道中
Get PRO
十月 '23
+462
在22个频道中
Get PRO
九月 '23
+631
在0个频道中
Get PRO
八月 '23
+488
在0个频道中
Get PRO
七月 '23
+420
在0个频道中
Get PRO
六月 '23
+329
在0个频道中
Get PRO
五月 '23
+433
在0个频道中
Get PRO
四月 '23
+224
在0个频道中
Get PRO
三月 '23
+712
在0个频道中
Get PRO
二月 '23
+249
在0个频道中
Get PRO
一月 '23
+260
在0个频道中
Get PRO
十二月 '22
+292
在0个频道中
Get PRO
十一月 '22
+407
在0个频道中
Get PRO
十月 '22
+172
在0个频道中
Get PRO
九月 '22
+209
在0个频道中
Get PRO
八月 '22
+287
在0个频道中
Get PRO
七月 '22
+352
在0个频道中
Get PRO
六月 '22
+407
在0个频道中
Get PRO
五月 '22
+166
在0个频道中
Get PRO
四月 '22
+215
在0个频道中
Get PRO
三月 '22
+225
在0个频道中
Get PRO
二月 '22
+129
在0个频道中
Get PRO
一月 '22
+250
在0个频道中
Get PRO
十二月 '21
+203
在0个频道中
Get PRO
十一月 '21
+253
在0个频道中
Get PRO
十月 '21
+237
在0个频道中
Get PRO
九月 '21
+208
在0个频道中
Get PRO
八月 '21
+297
在0个频道中
Get PRO
七月 '21
+312
在0个频道中
Get PRO
六月 '21
+288
在0个频道中
Get PRO
五月 '21
+446
在0个频道中
Get PRO
四月 '21
+446
在0个频道中
Get PRO
三月 '21
+429
在0个频道中
Get PRO
二月 '21
+396
在0个频道中
Get PRO
一月 '21
+351
在0个频道中
Get PRO
十二月 '20
+12 450
在0个频道中
日期
订阅者增长
提及
频道
11 六月+1
10 六月+6
09 六月+4
08 六月+6
07 六月+1
06 六月+3
05 六月0
04 六月+8
03 六月+2
02 六月+2
01 六月0
频道帖子
PyTorch custom operations: когда стандартных слоёв не хватает Иногда нужна операция, которой нет в PyTorch из коробки. Можно написать её на Python, но если нужна скорость — пишут на C++ и CUDA. Разбираем как это устроено. Два способа расширить PyTorch 1. Custom function — stateless операция Реализуется на C++/CUDA, регистрируется через TORCH_LIBRARY_IMPL. PyTorch сам выбирает CPU или CUDA реализацию в зависимости от устройства тензора:

# После загрузки .so файла
result = torch.ops.my_ops.identity_conv_op(tensor)
2. Custom class — операция с состоянием Если нужно хранить параметры (веса, конфиг) — используют torch::CustomClassHolder. Класс регистрируется и становится доступен из Python:

conv = torch.classes.my_ops.IdentityConvClass(channels=3)
output = conv.forward(input_tensor)
Главная сложность — torch.export Когда модель компилируется для продакшена через torch.export, трассировщик работает с «фейковыми» тензорами — он не запускает реальный C++ код. Поэтому нужно зарегистрировать абстрактную Python-версию каждой операции:

@torch.library.register_fake("my_ops::identity_conv_op")
def _fake(x: torch.Tensor) -> torch.Tensor:
    return torch.empty_like(x)  # только форма и тип, без вычислений
Что в итоге Скомпилированная модель (.pt2 файл) запускается и из Python, и из чистого C++ без зависимости от libpython — удобно для деплоя в продакшен без Python окружения. Схема работы:
C++/CUDA код → .so библиотека → регистрация в PyTorch
    ↓
torch.export → AOTInductor → model.pt2
    ↓
Python inference  или  C++ inference (dlopen)
Полный пример с Identity Convolution 📍 Навигация: ВакансииЗадачиСобесы Библиотека дата-сайентиста #буст

2
✳️Шпаргалка: рабочая станция для AI/ML в 2026 Больше не нужен огромный бюджет на облако. Консьюмерское железо и open-source модели изменили правила. Но покупать нужно стратегически. 🖥 Железо: смотрите на VRAM, не на CPU GPU (RTX 5090): — лучший выбор для дообучения тяжёлых моделей — CUDA незаменима для full fine-tuning — дорого, шумно, энергозатратно NPU + unified memory (Apple M5 Max, Intel Panther Lake): — 64–128 ГБ RAM → большая часть уходит под VRAM — 70B+ моделей локально без облака — тихо, эффективно, достаточно для большинства DS-задач Правило: для инференса и экспериментов — unified memory. Для обучения с нуля — GPU. 📦 Локальные модели: уходите от API-зависимости Лучшие модели для локального запуска в 2026: — DeepSeek V4 — сильный reasoning, хорош для кода — Qwen3-Coder — отличный выбор для задач с данными — Llama 3.3 — универсальный вариант Запуск через Ollama: ollama run qwen3-coder ollama run deepseek-v4 Квантизация — ключевое понятие: Q8 — максимальное качество, нужно много VRAM Q4 — баланс качества и размера (рекомендуется) Q3 — минимум VRAM, качество падает заметно 🔍 Как выбрать модель для задачи — Анализ данных, код → Qwen3-Coder, DeepSeek V4 — Длинный контекст, документы → Gemini 3.1 Pro — Сложные агентные задачи → Claude Opus 4.7 — Быстрый инференс локально → Llama 3.3 Q4 Ориентир для сравнения моделей на реальных задачах с кодом — SWE-bench. ⚙️ Минимальный стек для старта Ollama — локальный запуск моделей LM Studio — GUI для экспериментов LangChain — оркестрация агентов ChromaDB — локальная векторная БД для RAG 💡 Правило выбора — Чувствительные данные → только локально — Разовые тяжёлые задачи → API — Повторяющиеся задачи → локально, окупается быстро 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
700
3
🌳 SuperTree — интерактивная визуализация деревьев решений прямо в Jupyter Notebook Если вы работаете с деревьями решений и а
🌳 SuperTree — интерактивная визуализация деревьев решений прямо в Jupyter Notebook Если вы работаете с деревьями решений и ансамблями, то наверняка сталкивались с тем, что стандартные визуализации быстро становятся неудобными для анализа. SuperTree решает эту проблему, добавляя полноценную интерактивность: ✅ Масштабирование и навигация по дереву ✅ Сворачивание и разворачивание узлов ✅ Отслеживание пути конкретного объекта через дерево ✅ Работа прямо в Jupyter Notebook, JupyterLab и Google Colab Установка: pip install supertree Пример использования: from sklearn.tree import DecisionTreeClassifier from sklearn.datasets import load_iris from supertree import SuperTree iris = load_iris() model = DecisionTreeClassifier(max_depth=3) model.fit(iris.data, iris.target) super_tree = SuperTree( model, iris.data, iris.target, iris.feature_names, iris.target_names ) super_tree.show_tree() 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
946
4
🧠 Google представила Memory-Cached RNN — возможного конкурента Transformers Последние 7 лет практически все крупные языковые
🧠 Google представила Memory-Cached RNN — возможного конкурента Transformers Последние 7 лет практически все крупные языковые модели — ChatGPT, Claude, Gemini, Llama — строились на архитектуре Transformer. Несмотря на впечатляющие результаты, у неё есть фундаментальная проблема: вычислительная сложность внимания растёт квадратично относительно длины контекста. До появления Transformers основой многих нейросетей были RNN (Recurrent Neural Networks). Они обрабатывают последовательности намного эффективнее, но страдают от другой проблемы — ограниченной памяти. При работе с длинными текстами модель постепенно «забывает» информацию из начала последовательности. Исследователи Google предложили новый подход в работе «Memory Caching: RNNs with Growing Memory». 💡 Ключевая идея — добавить RNN механизм кэширования промежуточных состояний. Вместо фиксированной памяти модель сохраняет важные «снимки» своего внутреннего состояния по мере чтения текста. По мере роста последовательности память также может расширяться. Что это даёт: • память растёт вместе с длиной контекста; • вычислительная стоимость остаётся значительно ниже, чем у Transformer; • улучшается работа с длинными документами и задачами на запоминание; • достигается качество, близкое к Transformer, без квадратичного роста вычислений. 🚀 Если результаты подтвердятся на больших языковых моделях промышленного масштаба, в ближайшие годы мы можем увидеть новый класс архитектур, где память растёт динамически, а вычисления остаются линейными по длине последовательности. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
972
5
Библиотека дата-сайентиста #развлекалово
Библиотека дата-сайентиста #развлекалово
1 053
6
🖼️ Как работает сжатие изображений: взгляд Data Scientist Для дата-сайентиста изображение — это не картинка, а матрица чисел
🖼️ Как работает сжатие изображений: взгляд Data Scientist Для дата-сайентиста изображение — это не картинка, а матрица чисел. Сжатие же изображений позволяет уменьшить объём данных, сохранив максимум полезной информации. Классный гид для быстрого понимания темы 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 068
7
🔥 Инженерная методичка по ИИ от Романа Барлоса (Team Lead в Yandex Cloud) Продолжаем делиться экспертизой команды курса «Раз
🔥 Инженерная методичка по ИИ от Романа Барлоса (Team Lead в Yandex Cloud) Продолжаем делиться экспертизой команды курса «Разработка ИИ-агентов». Роман собрал мастхев-инструменты и ключевые работы для тех, кто хочет выйти за рамки вайбкодинга. 🛠️ Полезные инструменты: • Understand Anything — граф знаний по коду и зависимостям. • DeepTutor — open-source платформа для персонализированного обучения. • Superpowers — набор практик для системной разработки с ИИ. • Awesome Agent Skills — коллекция навыков для ИИ-агентов. 📚 Ключевые работы по LLM: • Attention Is All You Need (2017) — архитектура Transformer. • GPT-1 (2018) — начало эпохи GPT. • GPT-2 (2019) — решение новых задач без дообучения. • GPT-3 (2020) — обучение на примерах из запроса. • InstructGPT (2022) — RLHF и современные чат-боты. На курсе Роман выступает консультантом программы: помогает формировать содержание уроков с опорой на актуальные инженерные практики». Занять свое место на потоке: 👉 Курс «Разработка ИИ-агентов»
1 080
8
🤖 Материалы: Awesome Self-Evolving Agents Подборка материалов про самоэволюционирующих AI-агентов и их развитие в последние
🤖 Материалы: Awesome Self-Evolving Agents Подборка материалов про самоэволюционирующих AI-агентов и их развитие в последние годы. Проект систематизирует исследования в области agentic AI и разбивает их на понятную структуру эволюции методов 📍 Навигация: Вакансии • Задачи • Собесы 📍 Как внедрять AI-логику в бэкенд и сохранять стабильность сервиса #буст
1 135
9
🖼️ Как CNN «видят» изображения Сверточные нейронные сети (CNN) лежат в основе множества задач компьютерного зрения — от клас+3
🖼️ Как CNN «видят» изображения Сверточные нейронные сети (CNN) лежат в основе множества задач компьютерного зрения — от классификации изображений до детекции объектов и сегментации. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 113
10
📘 Это классика: Dive into Deep Learning Один из самых популярных open-source учебников по deep learning — «Dive into Deep Learning» от Aston Zhang, Zachary C. Lipton, Mu Li и Alexander J. Smola. Это не просто теория, а практико-ориентированное пособие, которое объясняет ключевые идеи машинного обучения и нейросетей через код и интуицию. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 186
11
😎 Знакомьтесь с экспертом Proglib.academy: Senior Software Engineer и Team Lead в Yandex Cloud Роман Барлос Роман — консульт
😎 Знакомьтесь с экспертом Proglib.academy: Senior Software Engineer и Team Lead в Yandex Cloud Роман Барлос Роман — консультант нашего курса «Разработка ИИ-агентов». Он работает на стыке cloud-native архитектуры и AI, активно внедряя современные ИИ-подходы в реальные процессы разработки. За что его ценит IT-комьюнити? 🟣 Team Lead и AI-евангелист в команде UX Yandex Cloud 14-лет в разработке. Занимается AI-адопшеном в команде Yandex Cloud, проводит мастер-классы и продвигает лучшие практики для повышения эффективности разработчиков. 🟣 Техлид Sourcecraft Code Assistant С сильным практическим бэкграундом принимал участие как технический лид в создании мощного AI-расширения для VS Code. 🟣 Создатель полезного Open Source Разрабатывает утилиты, которые позволяют быстро начать эксперименты с инференсом и агентами в локальном окружении: например, набор скриптов vllm-setup для быстрого запуска окружения и mini-proxy — минималистичный прокси для OpenAI API провайдеров. 🟣 Автор интерактивных ML-визуализаций Объясняет сложные концепции наглядно. Создал серию залипательных обучающих материалов, где можно вживую пощупать работу сетей Хопфилда, машин Больцмана и VC-размерности. Роман регулярно делится инженерными наработками, инсайтами и экспертизой в своем авторском Telegram-канале На курсе Роман выступает консультантом программы: он помогает формировать содержание уроков с опорой на актуальные инженерные практики и жесткие требования индустрии. Узнать больше о программе и разработке автономных систем: 👉 Курс «Разработка ИИ-агентов» Так, продолжаем знакомить вас с командой? 👍 — Да, ждем новых лиц 🔥 — Жду полезные материалы от Романа
1 131
12
Новый open-source проект для тех, кто исследует современные механизмы внимания в трансформерах. attnhut — это коллекция реали
Новый open-source проект для тех, кто исследует современные механизмы внимания в трансформерах. attnhut — это коллекция реализаций различных Attention-механизмов в PyTorch, собранных в одном месте. Вместо того чтобы искать код по десяткам репозиториев, можно быстро изучить и протестировать популярные подходы через единый интерфейс. Что уже доступно: ✅ Standard Multi-Head Attention (Transformer) ✅ Multi-Query Attention (MQA) ✅ Grouped Query Attention (GQA) ✅ Multi-Head Latent Attention (MLA) из DeepSeek ✅ Differential Attention ✅ Delta Attention ✅ DeepSeek Sparse Attention ✅ MiniMax Sparse Attention ✅ BigBird ✅ Slot Attention ✅ Compressed Sparse Attention (DeepSeek V4) ✅ Heavily Compressed Attention Особенность проекта — максимально простой API: from attnhut import GroupedQueryAttention attn = GroupedQueryAttention( dim=512, num_heads=8, num_kv_heads=2 ) y = attn(x) 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 243
13
🚀 MLOps на минималках: разворачиваем production-стек прямо на ноутбуке На инфографике выше представлен подробный пайплайн на
🚀 MLOps на минималках: разворачиваем production-стек прямо на ноутбуке На инфографике выше представлен подробный пайплайн настройки локальной среды для работы с ML-моделями. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 293
14
✔️ Визуальные объяснения по deep learning Идея простая — закреплять знания через активное воспроизведение, а не просто чтение
✔️ Визуальные объяснения по deep learning Идея простая — закреплять знания через активное воспроизведение, а не просто чтение. Это работает: когда объясняешь тему сам себе, пробелы сразу становятся видны. Проект рассчитан на абсолютных новичков — людям с опытом может показаться базовым. Это работа в процессе, новые темы будут добавляться по мере изучения. 🔗 Сайт: https://clc.to/dOkFVQ 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 354
15
Wall Attention — новый механизм внимания который умеет забывать Стандартный attention обрабатывает все токены одинаково — каж
Wall Attention — новый механизм внимания который умеет забывать Стандартный attention обрабатывает все токены одинаково — каждый запрос смотрит на весь контекст с одинаковым «весом памяти». Исследователи решили это исправить. Wall Attention добавляет обучаемый decay в QK скалярное произведение — каждый канал учится забывать с разной скоростью. Если упростить: модель сама решает какая информация из прошлого важна для каждого типа признаков. Технически это выглядит так: # Стандартный attention score(i, j) = sum_n(q[i,n] * k[j,n]) # Wall Attention — добавляем decay между позициями score(i, j) = sum_n(q[i,n] * k[j,n] * decay(i,j,n)) Поддерживает GQA, sliding window, varlen packing, BF16/FP32. При g=0 получаем обычный softmax attention — полная обратная совместимость. Пока исследовательский инструмент, но направление интересное — особенно для задач с длинным контекстом: pip install -e . 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 310
16
Лень как двигатель промпт-инжиниринга Рассказываю, как нейронка может составить инструкцию за тебя, всё на реальном кейсе с поиском лидов. ➖ Задача: найти зацепки в тоннах отчетов Я работаю над поисковиком, который переваривает гигабайты годовых отчетов компаний. Клиенту нужно не просто «найти компанию», а выудить конкретные «крючки» для продаж. Нужно лезть в глубину, понимать боли бизнеса и искать точки соприкосновения. ➖ Метод: «План для ассистента» Вместо того чтобы самому расписывать, на что обращать внимание при анализе, я прошу ChatGPT составить план исследования. Help me build a research blueprint for scouting potential clients for [COMPANY_NAME]. Below is our business profile for context: [INSERT_DESCRIPTION]. The goal is to provide a "discovery checklist" for investigating a specific lead company online. I need a list of sharp questions and data points that will help me understand if they are a fit. Please focus the checklist on: Identifying recent "trigger events" (pivots, new product launches, or leadership changes). Pinpointing current operational friction or visible bottlenecks. Finding JTBD-style insights (what specific "job" is this company currently trying to solve?). The final output should be a structured list of investigation points for a research agent to follow during their deep-dive. Самое забавное, что «ассистентом», который пойдет работать по этой инструкции, будет тот же самый ChatGPT. Итог: нейронка сама пишет себе ТЗ, сама его выполняет, а ты просто забираешь качественный результат. Проблема в том, что люди часто пытаются быть микроменеджерами для ИИ, когда пора переходить на уровень постановки стратегии. Если хочешь перестать просто «переписываться с ботом» и научиться создавать автономные системы, которые реально работают в проде, заглядывай на курс по AgentOps Доверяете нейронке писать инструкции для самой себя? ❤️ - да, она лучше знает свои возможности 🔥 - нет, предпочитаю контролировать каждый символ в промпте 🔹 Курс разработка AI-агентов 🔹 Получить консультацию менеджера 🔹 Сайт Академии 🔹 Сайт Proglib 🏃‍♀️ Азбука айтишника #магиякода
1 196
17
🔥 SQL Шпаргалка для Data Analytics Независимо от того, работаете ли вы с PostgreSQL, MySQL, SQL Server или BigQuery, большинство запросов строятся вокруг одних и тех же конструкций. Сохраняйте шпаргалку, чтобы не искать синтаксис в документации каждый раз. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 312
18
🔎 Профилирование в PyTorch: как находить узкие места через `torch.profiler` Если PyTorch-код работает медленно, угадывать причину почти всегда бесполезно. Гораздо эффективнее — смотреть профилировщик. Ниже — практический чеклист, который помогает быстро читать torch.profiler и понимать, где именно теряется производительность. 1️⃣ Сначала проверьте соотношение CPU и GPU времени Откройте prof.key_averages().table(): CPU ≫ GPU (ms vs µs) → overhead-bound - причина: Python-оверhead, dispatch, мелкие операции - решение: увеличить batch, размер матриц, фьюзинг операций CPU ≈ GPU (оба в ms) → compute-bound - это нормальный режим, дальше оптимизация идёт на уровне GPU 2️⃣ Если GPU простаивает — ищите пустые зоны в трейсе В trace (Perfetto / Chrome): - задержки между CPU и GPU - паузы перед cudaLaunchKernel - разрывы между record_function и aten::* Чаще всего это связано с: - lazy инициализацией cuBLAS - аллокациями памяти - слишком мелкими kernel’ами - Python overhead 3️⃣ Обращайте внимание на cudaOccupancyMaxActiveBlocksPerMultiprocessor Если он присутствует перед kernel’ом: - это тяжелый kernel (GEMM, conv) - есть runtime-выбор конфигурации - cuBLAS подбирает стратегию исполнения Если его нет — чаще всего это elementwise операция с фиксированной стоимостью запуска. 4️⃣ Warmup обязателен Без warmup вы фактически измеряете: - инициализацию CUDA - загрузку cuBLAS - первые аллокации Минимальный вариант: for _ in range(5): step() 5️⃣ Маленькие матрицы почти всегда дают искажения Например: - 64×64 → GPU почти не загружен - 4096×4096 → нормальный compute-bound режим Если кажется, что GPU медленный, сначала увеличьте размер задачи. 6️⃣ Что важно в таблице профайлера Обращайте внимание на: - одна операция занимает 80–90% CUDA time → основной bottleneck - большое число вызовов → кандидат на fusion - CPU total ≫ self CPU → проблема внутри вложенных операций 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 122
19
⚡️ Продолжаем знакомить вас с экспертами курса AgentOps! — Сергей Нотевский расскажет, как выстроить FinOps для AI-продуктов:
⚡️ Продолжаем знакомить вас с экспертами курса AgentOps! — Сергей Нотевский расскажет, как выстроить FinOps для AI-продуктов: оптимизировать затраты на разработку и продакшен, внедрить model routing, semantic cache и систему алертов для контроля расходов — Эмиль Сатаев разберет Context Engineering: управление контекстом, защиту от prompt injection, работу с длинными контекстами и построение безопасного пайплайна входа для AI-систем — Михаил Бондаревский покажет, как подготовить инфраструктуру для AI-агентов: Docker, sandboxing, streaming, docker-compose и воспроизводимое окружение для разработки и продакшена — Мурат Хажгериев расскажет про Enterprise Integrations & MCP: когда MCP действительно нужен, как подключать внешние сервисы и реализовывать интеграции с OAuth2 delegation — Герман Сабиров разберет Governance & Compliance для AI-систем: data flow, audit logs, требования 152-ФЗ, локализацию данных и построение compliance-подхода на уровне архитектуры Курс для backend-разработчиков, тимлидов и LLM инженеров о том, как внедрять AI-логику в бэкенд IT-продуктов и сохранять стабильность сервиса. 👉 Изучить обновленную программу AgentOps и занять место.
1 151
20
📍 Вышел подробный гайд по MCP для локальных LLM Если хотите запускать AI-агентов локально и при этом безопасно подключать их
📍 Вышел подробный гайд по MCP для локальных LLM Если хотите запускать AI-агентов локально и при этом безопасно подключать их к файлам, инструментам и внешним API — стоит обратить внимание на MCP (Model Context Protocol). В руководстве показано, как использовать MCP с моделями Qwen3.6 и Gemma 4 для создания приватных автоматизированных воркфлоу. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 270