ru
Feedback
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Открыть в Telegram

Все самое полезное для дата сайентиста в одном канале. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Для обратной связи: @proglibrary_feeedback_bot РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9

Больше

📈 Аналитический обзор Telegram-канала Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Канал Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение (@dsproglib) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 18 491 подписчиков, занимая 7 262 место в категории Технологии и приложения и 36 536 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 18 491 подписчиков.

Согласно последним данным от 12 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -27, а за последние 24 часа — -3, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 6.77%. В первые 24 часа после публикации контент обычно набирает 4.47% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 1 252 просмотров. В течение первых суток публикация набирает 826 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 5.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как сайентиста, llm, буст, навигация, openai.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
Все самое полезное для дата сайентиста в одном канале. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Для обратной связи: @proglibrary_feeedback_bot РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9

Благодаря высокой частоте обновлений (последние данные получены 13 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

18 491
Подписчики
-324 часа
-137 дней
-2730 день
Привлечение подписчиков
июнь '26
июнь '26
+41
в 0 каналах
май '26
+142
в 1 каналах
Get PRO
апрель '26
+106
в 0 каналах
Get PRO
март '26
+329
в 4 каналах
Get PRO
февраль '26
+154
в 5 каналах
Get PRO
январь '26
+212
в 4 каналах
Get PRO
декабрь '25
+211
в 3 каналах
Get PRO
ноябрь '25
+101
в 1 каналах
Get PRO
октябрь '25
+148
в 5 каналах
Get PRO
сентябрь '25
+105
в 2 каналах
Get PRO
август '25
+103
в 4 каналах
Get PRO
июль '25
+171
в 2 каналах
Get PRO
июнь '25
+185
в 42 каналах
Get PRO
май '25
+319
в 6 каналах
Get PRO
апрель '25
+206
в 18 каналах
Get PRO
март '25
+247
в 53 каналах
Get PRO
февраль '25
+236
в 36 каналах
Get PRO
январь '25
+180
в 41 каналах
Get PRO
декабрь '24
+212
в 42 каналах
Get PRO
ноябрь '24
+217
в 52 каналах
Get PRO
октябрь '24
+224
в 43 каналах
Get PRO
сентябрь '24
+249
в 38 каналах
Get PRO
август '24
+269
в 37 каналах
Get PRO
июль '24
+197
в 37 каналах
Get PRO
июнь '24
+257
в 31 каналах
Get PRO
май '24
+429
в 38 каналах
Get PRO
апрель '24
+339
в 38 каналах
Get PRO
март '24
+437
в 32 каналах
Get PRO
февраль '24
+426
в 32 каналах
Get PRO
январь '24
+473
в 28 каналах
Get PRO
декабрь '23
+604
в 34 каналах
Get PRO
ноябрь '23
+289
в 13 каналах
Get PRO
октябрь '23
+462
в 22 каналах
Get PRO
сентябрь '23
+631
в 0 каналах
Get PRO
август '23
+488
в 0 каналах
Get PRO
июль '23
+420
в 0 каналах
Get PRO
июнь '23
+329
в 0 каналах
Get PRO
май '23
+433
в 0 каналах
Get PRO
апрель '23
+224
в 0 каналах
Get PRO
март '23
+712
в 0 каналах
Get PRO
февраль '23
+249
в 0 каналах
Get PRO
январь '23
+260
в 0 каналах
Get PRO
декабрь '22
+292
в 0 каналах
Get PRO
ноябрь '22
+407
в 0 каналах
Get PRO
октябрь '22
+172
в 0 каналах
Get PRO
сентябрь '22
+209
в 0 каналах
Get PRO
август '22
+287
в 0 каналах
Get PRO
июль '22
+352
в 0 каналах
Get PRO
июнь '22
+407
в 0 каналах
Get PRO
май '22
+166
в 0 каналах
Get PRO
апрель '22
+215
в 0 каналах
Get PRO
март '22
+225
в 0 каналах
Get PRO
февраль '22
+129
в 0 каналах
Get PRO
январь '22
+250
в 0 каналах
Get PRO
декабрь '21
+203
в 0 каналах
Get PRO
ноябрь '21
+253
в 0 каналах
Get PRO
октябрь '21
+237
в 0 каналах
Get PRO
сентябрь '21
+208
в 0 каналах
Get PRO
август '21
+297
в 0 каналах
Get PRO
июль '21
+312
в 0 каналах
Get PRO
июнь '21
+288
в 0 каналах
Get PRO
май '21
+446
в 0 каналах
Get PRO
апрель '21
+446
в 0 каналах
Get PRO
март '21
+429
в 0 каналах
Get PRO
февраль '21
+396
в 0 каналах
Get PRO
январь '21
+351
в 0 каналах
Get PRO
декабрь '20
+12 450
в 0 каналах
Дата
Привлечение подписчиков
Упоминания
Каналы
13 июня+1
12 июня+5
11 июня+3
10 июня+6
09 июня+4
08 июня+6
07 июня+1
06 июня+3
05 июня0
04 июня+8
03 июня+2
02 июня+2
01 июня0
Посты канала
💻 3 курса по цене одного — собери стек для оффера в топовую IT-компанию Для следующего карьерного шага мало писать код. Рабо
💻 3 курса по цене одного — собери стек для оффера в топовую IT-компанию Для следующего карьерного шага мало писать код. Работодатели ждут не только знания языка, но и понимания архитектуры, алгоритмов, автоматизации, AI-инструментов и агентных систем. Одно направление закрывает только часть задачи. Поэтому сейчас мы предлагаем освоить сразу несколько востребованных навыков — выбери любой курс и получи доступ еще к двум бесплатно 🔥 Собери стек навыков под свою цель: 🔹 подготовка к сильным компаниям (алгоритмы, архитектура); 🔹 переход в AI-направление (ИИ-агенты, AgentOps); 🔹 развитие в ML и Data Science (математика, основы ML); 🔹 новый оффер и рост дохода. Полученные знания применяешь в работе уже во время обучения. ⏳ Акция действует 48 часов — 13 и 14 июня. 👉 Переходи на сайт, выбирай курсы и оставляй заявку — за 10 минут поможем собрать комплект под твою цель.

2
Библиотека дата-сайентиста #развлекалово
Библиотека дата-сайентиста #развлекалово
658
3
✳️ 4 библиотеки для полного DS-пайплайна на Polars Polars набирает популярность стремительно — на PyCon US 2026 очередь на подпись книги по Polars растянулась на весь коридор. Но многие останавливаются на вопросе: «А поддерживают ли мои инструменты Polars?» Вот четыре библиотеки которые поддерживают — и закрывают весь пайплайн. 1. pointblank — валидация данных agent = ( pb.Validate(sales_data) .col_vals_not_null(columns="date") .col_vals_between(columns="sales", left=0, right=10000) .col_vals_in_set(columns="region", set=["North", "South", "East", "West"]) .interrogate() ) Проверяет качество данных прямо в Polars DataFrame. Никакого .to_pandas(). 2. Great Tables — публикационные таблицы GT(regional_summary) .fmt_currency(columns=["total_sales"]) .fmt_nanoplot(columns="sales_trend", plot_type="line") .data_color(columns="total_sales", palette=["#f0f0f0", "#447099"]) Форматирование, цвета, мини-графики прямо в таблице. Это дефолтный способ стилизации Polars DataFrame через df.style. 3. plotnine — ggplot2 для Python ggplot(sales_data, aes(x="region", y="sales", fill="product")) + geom_col(position=position_dodge(width=0.8)) + scale_fill_manual(values=product_colors) + theme_minimal() Grammar of graphics в Python. Работает с Polars напрямую — конвертация не нужна. 4. mall — LLM прямо в пайплайне sales_data.llm.use("ollama", "llama3.2") sales_data.llm.classify("sales", ["high", "medium", "low"]) sales_data.llm.sentiment("review_text") sales_data.llm.summarize("description") .llm accessor добавляет LLM-операции к любому Polars DataFrame. Работает с Ollama, OpenAI, Anthropic. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
736
4
🔥 Строишь ИИ-агентов? Руководитель AI/ML-направления Сloud․ru покажет, где большинство архитектур ломаются, и как этого избе
🔥 Строишь ИИ-агентов? Руководитель AI/ML-направления Сloud․ru покажет, где большинство архитектур ломаются, и как этого избежать. 18 июня в 19:00 совместно с Сloud․ru проведём открытый урок «Мультиагентные системы: почему большинство архитектур переусложнены». Спикер — Дмитрий Юдин, эксперт по масштабированию и оптимизации вычислительных ресурсов для ML. Под его руководством развивается Evolution AI Factory — цифровая среда для работы с GenAI. Он занимается развитием сервисов генеративного ИИ, инфраструктуры для обучения больших языковых моделей и внедрением интеллектуальных агентов. Что получишь на уроке: — критерии выбора между одним агентом и мультиагентной системой; — разбор популярных архитектурных ошибок; — реальные ограничения современных ИИ-агентов; — практические рекомендации по проектированию агентных систем. 🎁 Для участников урока подготовили промокод на скидку 10 000 ₽. 🗓️ Когда: 18 июня, 19:00 (МСК) 👉 Занять место на открытом уроке
807
5
CVPR 2026: 16 000 заявок, 4 090 принято. Вот 5, которые стоит прочитать первыми Если вы работаете с VLM или мультимодальными
CVPR 2026: 16 000 заявок, 4 090 принято. Вот 5, которые стоит прочитать первыми Если вы работаете с VLM или мультимодальными пайплайнами — это ваш список на длинные выходные. 1. SAM 3D — лучшая работа конференции «Сегментируй что угодно» теперь в 3D из одного 2D изображения, за один проход. Год назад это назвали бы исследовательским демо. 2. Back to Basics — Tianhong Li & Kaiming He Когда Каiming He публикует «Назад к основам» — читаешь сразу. Оба предыдущих раза он переписывал то, что область считала устоявшимся. 3. TIPSv2 — vision-language pretraining с улучшенным patch-text alignment Поиск на уровне патчей — это следующее поколение image RAG. Здесь оно живёт. 4. INSID3 — сегментация по примерам без обучения, на DINOv3 Никакого файн-тюнинга, никаких меток, oral на CVPR. Training-free подход — тренд, которому поле долго сопротивлялось. 5. A Frame is Worth One Token — дельта-токены для генеративного моделирования мира Токенная эффективность которая изменила LLM-инференс теперь добралась до видео. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
898
6
PyTorch custom operations: когда стандартных слоёв не хватает Иногда нужна операция, которой нет в PyTorch из коробки. Можно написать её на Python, но если нужна скорость — пишут на C++ и CUDA. Разбираем как это устроено. Два способа расширить PyTorch 1. Custom function — stateless операция Реализуется на C++/CUDA, регистрируется через TORCH_LIBRARY_IMPL. PyTorch сам выбирает CPU или CUDA реализацию в зависимости от устройства тензора: # После загрузки .so файла result = torch.ops.my_ops.identity_conv_op(tensor) 2. Custom class — операция с состоянием Если нужно хранить параметры (веса, конфиг) — используют torch::CustomClassHolder. Класс регистрируется и становится доступен из Python: conv = torch.classes.my_ops.IdentityConvClass(channels=3) output = conv.forward(input_tensor) Главная сложность — torch.export Когда модель компилируется для продакшена через torch.export, трассировщик работает с «фейковыми» тензорами — он не запускает реальный C++ код. Поэтому нужно зарегистрировать абстрактную Python-версию каждой операции: @torch.library.register_fake("my_ops::identity_conv_op") def _fake(x: torch.Tensor) -> torch.Tensor: return torch.empty_like(x) # только форма и тип, без вычислений Что в итоге Скомпилированная модель (.pt2 файл) запускается и из Python, и из чистого C++ без зависимости от libpython — удобно для деплоя в продакшен без Python окружения. Схема работы: C++/CUDA код → .so библиотека → регистрация в PyTorch ↓ torch.export → AOTInductor → model.pt2 ↓ Python inference или C++ inference (dlopen) Полный пример с Identity Convolution 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
894
7
✳️Шпаргалка: рабочая станция для AI/ML в 2026 Больше не нужен огромный бюджет на облако. Консьюмерское железо и open-source модели изменили правила. Но покупать нужно стратегически. 🖥 Железо: смотрите на VRAM, не на CPU GPU (RTX 5090): — лучший выбор для дообучения тяжёлых моделей — CUDA незаменима для full fine-tuning — дорого, шумно, энергозатратно NPU + unified memory (Apple M5 Max, Intel Panther Lake): — 64–128 ГБ RAM → большая часть уходит под VRAM — 70B+ моделей локально без облака — тихо, эффективно, достаточно для большинства DS-задач Правило: для инференса и экспериментов — unified memory. Для обучения с нуля — GPU. 📦 Локальные модели: уходите от API-зависимости Лучшие модели для локального запуска в 2026: — DeepSeek V4 — сильный reasoning, хорош для кода — Qwen3-Coder — отличный выбор для задач с данными — Llama 3.3 — универсальный вариант Запуск через Ollama: ollama run qwen3-coder ollama run deepseek-v4 Квантизация — ключевое понятие: Q8 — максимальное качество, нужно много VRAM Q4 — баланс качества и размера (рекомендуется) Q3 — минимум VRAM, качество падает заметно 🔍 Как выбрать модель для задачи — Анализ данных, код → Qwen3-Coder, DeepSeek V4 — Длинный контекст, документы → Gemini 3.1 Pro — Сложные агентные задачи → Claude Opus 4.7 — Быстрый инференс локально → Llama 3.3 Q4 Ориентир для сравнения моделей на реальных задачах с кодом — SWE-bench. ⚙️ Минимальный стек для старта Ollama — локальный запуск моделей LM Studio — GUI для экспериментов LangChain — оркестрация агентов ChromaDB — локальная векторная БД для RAG 💡 Правило выбора — Чувствительные данные → только локально — Разовые тяжёлые задачи → API — Повторяющиеся задачи → локально, окупается быстро 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
929
8
🌳 SuperTree — интерактивная визуализация деревьев решений прямо в Jupyter Notebook Если вы работаете с деревьями решений и а
🌳 SuperTree — интерактивная визуализация деревьев решений прямо в Jupyter Notebook Если вы работаете с деревьями решений и ансамблями, то наверняка сталкивались с тем, что стандартные визуализации быстро становятся неудобными для анализа. SuperTree решает эту проблему, добавляя полноценную интерактивность: ✅ Масштабирование и навигация по дереву ✅ Сворачивание и разворачивание узлов ✅ Отслеживание пути конкретного объекта через дерево ✅ Работа прямо в Jupyter Notebook, JupyterLab и Google Colab Установка: pip install supertree Пример использования: from sklearn.tree import DecisionTreeClassifier from sklearn.datasets import load_iris from supertree import SuperTree iris = load_iris() model = DecisionTreeClassifier(max_depth=3) model.fit(iris.data, iris.target) super_tree = SuperTree( model, iris.data, iris.target, iris.feature_names, iris.target_names ) super_tree.show_tree() 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 124
9
🧠 Google представила Memory-Cached RNN — возможного конкурента Transformers Последние 7 лет практически все крупные языковые
🧠 Google представила Memory-Cached RNN — возможного конкурента Transformers Последние 7 лет практически все крупные языковые модели — ChatGPT, Claude, Gemini, Llama — строились на архитектуре Transformer. Несмотря на впечатляющие результаты, у неё есть фундаментальная проблема: вычислительная сложность внимания растёт квадратично относительно длины контекста. До появления Transformers основой многих нейросетей были RNN (Recurrent Neural Networks). Они обрабатывают последовательности намного эффективнее, но страдают от другой проблемы — ограниченной памяти. При работе с длинными текстами модель постепенно «забывает» информацию из начала последовательности. Исследователи Google предложили новый подход в работе «Memory Caching: RNNs with Growing Memory». 💡 Ключевая идея — добавить RNN механизм кэширования промежуточных состояний. Вместо фиксированной памяти модель сохраняет важные «снимки» своего внутреннего состояния по мере чтения текста. По мере роста последовательности память также может расширяться. Что это даёт: • память растёт вместе с длиной контекста; • вычислительная стоимость остаётся значительно ниже, чем у Transformer; • улучшается работа с длинными документами и задачами на запоминание; • достигается качество, близкое к Transformer, без квадратичного роста вычислений. 🚀 Если результаты подтвердятся на больших языковых моделях промышленного масштаба, в ближайшие годы мы можем увидеть новый класс архитектур, где память растёт динамически, а вычисления остаются линейными по длине последовательности. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 139
10
Библиотека дата-сайентиста #развлекалово
Библиотека дата-сайентиста #развлекалово
1 200
11
🖼️ Как работает сжатие изображений: взгляд Data Scientist Для дата-сайентиста изображение — это не картинка, а матрица чисел
🖼️ Как работает сжатие изображений: взгляд Data Scientist Для дата-сайентиста изображение — это не картинка, а матрица чисел. Сжатие же изображений позволяет уменьшить объём данных, сохранив максимум полезной информации. Классный гид для быстрого понимания темы 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 247
12
🔥 Инженерная методичка по ИИ от Романа Барлоса (Team Lead в Yandex Cloud) Продолжаем делиться экспертизой команды курса «Раз
🔥 Инженерная методичка по ИИ от Романа Барлоса (Team Lead в Yandex Cloud) Продолжаем делиться экспертизой команды курса «Разработка ИИ-агентов». Роман собрал мастхев-инструменты и ключевые работы для тех, кто хочет выйти за рамки вайбкодинга. 🛠️ Полезные инструменты: • Understand Anything — граф знаний по коду и зависимостям. • DeepTutor — open-source платформа для персонализированного обучения. • Superpowers — набор практик для системной разработки с ИИ. • Awesome Agent Skills — коллекция навыков для ИИ-агентов. 📚 Ключевые работы по LLM: • Attention Is All You Need (2017) — архитектура Transformer. • GPT-1 (2018) — начало эпохи GPT. • GPT-2 (2019) — решение новых задач без дообучения. • GPT-3 (2020) — обучение на примерах из запроса. • InstructGPT (2022) — RLHF и современные чат-боты. На курсе Роман выступает консультантом программы: помогает формировать содержание уроков с опорой на актуальные инженерные практики». Занять свое место на потоке: 👉 Курс «Разработка ИИ-агентов»
1 248
13
🤖 Материалы: Awesome Self-Evolving Agents Подборка материалов про самоэволюционирующих AI-агентов и их развитие в последние
🤖 Материалы: Awesome Self-Evolving Agents Подборка материалов про самоэволюционирующих AI-агентов и их развитие в последние годы. Проект систематизирует исследования в области agentic AI и разбивает их на понятную структуру эволюции методов 📍 Навигация: Вакансии • Задачи • Собесы 📍 Как внедрять AI-логику в бэкенд и сохранять стабильность сервиса #буст
1 299
14
🖼️ Как CNN «видят» изображения Сверточные нейронные сети (CNN) лежат в основе множества задач компьютерного зрения — от клас+3
🖼️ Как CNN «видят» изображения Сверточные нейронные сети (CNN) лежат в основе множества задач компьютерного зрения — от классификации изображений до детекции объектов и сегментации. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 460
15
📘 Это классика: Dive into Deep Learning Один из самых популярных open-source учебников по deep learning — «Dive into Deep Learning» от Aston Zhang, Zachary C. Lipton, Mu Li и Alexander J. Smola. Это не просто теория, а практико-ориентированное пособие, которое объясняет ключевые идеи машинного обучения и нейросетей через код и интуицию. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 316
16
😎 Знакомьтесь с экспертом Proglib.academy: Senior Software Engineer и Team Lead в Yandex Cloud Роман Барлос Роман — консульт
😎 Знакомьтесь с экспертом Proglib.academy: Senior Software Engineer и Team Lead в Yandex Cloud Роман Барлос Роман — консультант нашего курса «Разработка ИИ-агентов». Он работает на стыке cloud-native архитектуры и AI, активно внедряя современные ИИ-подходы в реальные процессы разработки. За что его ценит IT-комьюнити? 🟣 Team Lead и AI-евангелист в команде UX Yandex Cloud 14-лет в разработке. Занимается AI-адопшеном в команде Yandex Cloud, проводит мастер-классы и продвигает лучшие практики для повышения эффективности разработчиков. 🟣 Техлид Sourcecraft Code Assistant С сильным практическим бэкграундом принимал участие как технический лид в создании мощного AI-расширения для VS Code. 🟣 Создатель полезного Open Source Разрабатывает утилиты, которые позволяют быстро начать эксперименты с инференсом и агентами в локальном окружении: например, набор скриптов vllm-setup для быстрого запуска окружения и mini-proxy — минималистичный прокси для OpenAI API провайдеров. 🟣 Автор интерактивных ML-визуализаций Объясняет сложные концепции наглядно. Создал серию залипательных обучающих материалов, где можно вживую пощупать работу сетей Хопфилда, машин Больцмана и VC-размерности. Роман регулярно делится инженерными наработками, инсайтами и экспертизой в своем авторском Telegram-канале На курсе Роман выступает консультантом программы: он помогает формировать содержание уроков с опорой на актуальные инженерные практики и жесткие требования индустрии. Узнать больше о программе и разработке автономных систем: 👉 Курс «Разработка ИИ-агентов» Так, продолжаем знакомить вас с командой? 👍 — Да, ждем новых лиц 🔥 — Жду полезные материалы от Романа
1 237
17
Новый open-source проект для тех, кто исследует современные механизмы внимания в трансформерах. attnhut — это коллекция реали
Новый open-source проект для тех, кто исследует современные механизмы внимания в трансформерах. attnhut — это коллекция реализаций различных Attention-механизмов в PyTorch, собранных в одном месте. Вместо того чтобы искать код по десяткам репозиториев, можно быстро изучить и протестировать популярные подходы через единый интерфейс. Что уже доступно: ✅ Standard Multi-Head Attention (Transformer) ✅ Multi-Query Attention (MQA) ✅ Grouped Query Attention (GQA) ✅ Multi-Head Latent Attention (MLA) из DeepSeek ✅ Differential Attention ✅ Delta Attention ✅ DeepSeek Sparse Attention ✅ MiniMax Sparse Attention ✅ BigBird ✅ Slot Attention ✅ Compressed Sparse Attention (DeepSeek V4) ✅ Heavily Compressed Attention Особенность проекта — максимально простой API: from attnhut import GroupedQueryAttention attn = GroupedQueryAttention( dim=512, num_heads=8, num_kv_heads=2 ) y = attn(x) 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 312
18
🚀 MLOps на минималках: разворачиваем production-стек прямо на ноутбуке На инфографике выше представлен подробный пайплайн на
🚀 MLOps на минималках: разворачиваем production-стек прямо на ноутбуке На инфографике выше представлен подробный пайплайн настройки локальной среды для работы с ML-моделями. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 345
19
✔️ Визуальные объяснения по deep learning Идея простая — закреплять знания через активное воспроизведение, а не просто чтение
✔️ Визуальные объяснения по deep learning Идея простая — закреплять знания через активное воспроизведение, а не просто чтение. Это работает: когда объясняешь тему сам себе, пробелы сразу становятся видны. Проект рассчитан на абсолютных новичков — людям с опытом может показаться базовым. Это работа в процессе, новые темы будут добавляться по мере изучения. 🔗 Сайт: https://clc.to/dOkFVQ 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 409
20
Wall Attention — новый механизм внимания который умеет забывать Стандартный attention обрабатывает все токены одинаково — каж
Wall Attention — новый механизм внимания который умеет забывать Стандартный attention обрабатывает все токены одинаково — каждый запрос смотрит на весь контекст с одинаковым «весом памяти». Исследователи решили это исправить. Wall Attention добавляет обучаемый decay в QK скалярное произведение — каждый канал учится забывать с разной скоростью. Если упростить: модель сама решает какая информация из прошлого важна для каждого типа признаков. Технически это выглядит так: # Стандартный attention score(i, j) = sum_n(q[i,n] * k[j,n]) # Wall Attention — добавляем decay между позициями score(i, j) = sum_n(q[i,n] * k[j,n] * decay(i,j,n)) Поддерживает GQA, sliding window, varlen packing, BF16/FP32. При g=0 получаем обычный softmax attention — полная обратная совместимость. Пока исследовательский инструмент, но направление интересное — особенно для задач с длинным контекстом: pip install -e . 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
1 357