Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Все самое полезное для дата сайентиста в одном канале. По рекламе: @proglib_adv Курс по Ai-агентам: https://clc.to/9L0Tqg Для обратной связи: @proglibrary_feeedback_bot РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
إظهار المزيد📈 نظرة تحليلية على قناة تيليجرام Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
تُعد قناة Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение (@dsproglib) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 18 500 مشتركاً، محتلاً المرتبة 7 246 في فئة التكنولوجيات والتطبيقات والمرتبة 36 576 في منطقة روسيا.
📊 مؤشرات الجمهور والحراك
منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 18 500 مشتركاً.
بحسب آخر البيانات بتاريخ 08 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -12، وفي آخر 24 ساعة بمقدار -2، مع بقاء الوصول العام مرتفعاً.
- حالة التحقق: غير موثّقة
- معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 6.73%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 4.37% من ردود الفعل نسبةً إلى إجمالي المشتركين.
- وصول المنشورات: يحصل كل منشور على متوسط 1 245 مشاهدة. وخلال اليوم الأول يجمع عادةً 809 مشاهدة.
- التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 6.
- الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل сайентиста, llm, буст, навигация, openai.
📝 الوصف وسياسة المحتوى
يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“Все самое полезное для дата сайентиста в одном канале.
По рекламе: @proglib_adv
Курс по Ai-агентам: https://clc.to/9L0Tqg
Для обратной связи: @proglibrary_feeedback_bot
РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9”
بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 09 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.
До появления Transformers основой многих нейросетей были RNN (Recurrent Neural Networks). Они обрабатывают последовательности намного эффективнее, но страдают от другой проблемы — ограниченной памяти. При работе с длинными текстами модель постепенно «забывает» информацию из начала последовательности.Исследователи Google предложили новый подход в работе «Memory Caching: RNNs with Growing Memory». 💡 Ключевая идея — добавить RNN механизм кэширования промежуточных состояний. Вместо фиксированной памяти модель сохраняет важные «снимки» своего внутреннего состояния по мере чтения текста. По мере роста последовательности память также может расширяться. Что это даёт: • память растёт вместе с длиной контекста; • вычислительная стоимость остаётся значительно ниже, чем у Transformer; • улучшается работа с длинными документами и задачами на запоминание; • достигается качество, близкое к Transformer, без квадратичного роста вычислений. 🚀 Если результаты подтвердятся на больших языковых моделях промышленного масштаба, в ближайшие годы мы можем увидеть новый класс архитектур, где память растёт динамически, а вычисления остаются линейными по длине последовательности. 📍 Навигация: Вакансии • Задачи • Собесы Библиотека дата-сайентиста #буст
• Understand Anything — граф знаний по коду и зависимостям. • DeepTutor — open-source платформа для персонализированного обучения. • Superpowers — набор практик для системной разработки с ИИ. • Awesome Agent Skills — коллекция навыков для ИИ-агентов.📚 Ключевые работы по LLM:
• Attention Is All You Need (2017) — архитектура Transformer. • GPT-1 (2018) — начало эпохи GPT. • GPT-2 (2019) — решение новых задач без дообучения. • GPT-3 (2020) — обучение на примерах из запроса. • InstructGPT (2022) — RLHF и современные чат-боты.На курсе Роман выступает консультантом программы: помогает формировать содержание уроков с опорой на актуальные инженерные практики». Занять свое место на потоке: 👉 Курс «Разработка ИИ-агентов»
14-лет в разработке. Занимается AI-адопшеном в команде Yandex Cloud, проводит мастер-классы и продвигает лучшие практики для повышения эффективности разработчиков.🟣 Техлид Sourcecraft Code Assistant
С сильным практическим бэкграундом принимал участие как технический лид в создании мощного AI-расширения для VS Code.🟣 Создатель полезного Open Source
Разрабатывает утилиты, которые позволяют быстро начать эксперименты с инференсом и агентами в локальном окружении: например, набор скриптов vllm-setup для быстрого запуска окружения и mini-proxy — минималистичный прокси для OpenAI API провайдеров.🟣 Автор интерактивных ML-визуализаций
Объясняет сложные концепции наглядно. Создал серию залипательных обучающих материалов, где можно вживую пощупать работу сетей Хопфилда, машин Больцмана и VC-размерности.Роман регулярно делится инженерными наработками, инсайтами и экспертизой в своем авторском Telegram-канале На курсе Роман выступает консультантом программы: он помогает формировать содержание уроков с опорой на актуальные инженерные практики и жесткие требования индустрии. Узнать больше о программе и разработке автономных систем: 👉 Курс «Разработка ИИ-агентов» Так, продолжаем знакомить вас с командой? 👍 — Да, ждем новых лиц 🔥 — Жду полезные материалы от Романа
from attnhut import GroupedQueryAttention
attn = GroupedQueryAttention(
dim=512,
num_heads=8,
num_kv_heads=2
)
y = attn(x)
📍 Навигация: Вакансии • Задачи • Собесы
Библиотека дата-сайентиста
#буст# Стандартный attention score(i, j) = sum_n(q[i,n] * k[j,n]) # Wall Attention — добавляем decay между позициями score(i, j) = sum_n(q[i,n] * k[j,n] * decay(i,j,n))Поддерживает GQA, sliding window, varlen packing, BF16/FP32. При g=0 получаем обычный softmax attention — полная обратная совместимость. Пока исследовательский инструмент, но направление интересное — особенно для задач с длинным контекстом:
pip install -e .
📍 Навигация: Вакансии • Задачи • Собесы
Библиотека дата-сайентиста
#бустHelp me build a research blueprint for scouting potential clients for [COMPANY_NAME]. Below is our business profile for context: [INSERT_DESCRIPTION]. The goal is to provide a "discovery checklist" for investigating a specific lead company online. I need a list of sharp questions and data points that will help me understand if they are a fit. Please focus the checklist on: Identifying recent "trigger events" (pivots, new product launches, or leadership changes). Pinpointing current operational friction or visible bottlenecks. Finding JTBD-style insights (what specific "job" is this company currently trying to solve?). The final output should be a structured list of investigation points for a research agent to follow during their deep-dive.Самое забавное, что «ассистентом», который пойдет работать по этой инструкции, будет тот же самый ChatGPT. Итог: нейронка сама пишет себе ТЗ, сама его выполняет, а ты просто забираешь качественный результат. Проблема в том, что люди часто пытаются быть микроменеджерами для ИИ, когда пора переходить на уровень постановки стратегии. Если хочешь перестать просто «переписываться с ботом» и научиться создавать автономные системы, которые реально работают в проде, заглядывай на курс по AgentOps Доверяете нейронке писать инструкции для самой себя? ❤️ - да, она лучше знает свои возможности 🔥 - нет, предпочитаю контролировать каждый символ в промпте 🔹 Курс разработка AI-агентов 🔹 Получить консультацию менеджера 🔹 Сайт Академии 🔹 Сайт Proglib 🏃♀️ Азбука айтишника #магиякода
torch.profiler и понимать, где именно теряется производительность.
1️⃣ Сначала проверьте соотношение CPU и GPU времени
Откройте prof.key_averages().table():
CPU ≫ GPU (ms vs µs) → overhead-bound
- причина: Python-оверhead, dispatch, мелкие операции
- решение: увеличить batch, размер матриц, фьюзинг операций
CPU ≈ GPU (оба в ms) → compute-bound
- это нормальный режим, дальше оптимизация идёт на уровне GPU
2️⃣ Если GPU простаивает — ищите пустые зоны в трейсе
В trace (Perfetto / Chrome):
- задержки между CPU и GPU
- паузы перед cudaLaunchKernel
- разрывы между record_function и aten::*
Чаще всего это связано с:
- lazy инициализацией cuBLAS
- аллокациями памяти
- слишком мелкими kernel’ами
- Python overhead
3️⃣ Обращайте внимание на cudaOccupancyMaxActiveBlocksPerMultiprocessor
Если он присутствует перед kernel’ом:
- это тяжелый kernel (GEMM, conv)
- есть runtime-выбор конфигурации
- cuBLAS подбирает стратегию исполнения
Если его нет — чаще всего это elementwise операция с фиксированной стоимостью запуска.
4️⃣ Warmup обязателен
Без warmup вы фактически измеряете:
- инициализацию CUDA
- загрузку cuBLAS
- первые аллокации
Минимальный вариант:
for _ in range(5):
step()
5️⃣ Маленькие матрицы почти всегда дают искажения
Например:
- 64×64 → GPU почти не загружен
- 4096×4096 → нормальный compute-bound режим
Если кажется, что GPU медленный, сначала увеличьте размер задачи.
6️⃣ Что важно в таблице профайлера
Обращайте внимание на:
- одна операция занимает 80–90% CUDA time → основной bottleneck
- большое число вызовов → кандидат на fusion
- CPU total ≫ self CPU → проблема внутри вложенных операций
📍 Навигация: Вакансии • Задачи • Собесы
Библиотека дата-сайентиста
#буст
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
