Machine learning Interview

Открыть в Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Больше

Сеть:Machinelearning Россия21 939 Технологии и приложения4 569...

📈 Аналитический обзор Telegram-канала Machine learning Interview

Канал Machine learning Interview (@machinelearning_interview) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 30 034 подписчиков, занимая 4 569 место в категории Технологии и приложения и 21 939 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 30 034 подписчиков.

Согласно последним данным от 11 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 39, а за последние 24 часа — 8, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 18.49%. В первые 24 часа после публикации контент обычно набирает 8.84% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 5 554 просмотров. В течение первых суток публикация набирает 2 656 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 39.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как claude, llm, контекст, hermes, nvidia.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

Благодаря высокой частоте обновлений (последние данные получены 12 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

30 034

Подписчики

+824 часа

-117 дней

+3930 день

5 554

Просмотры поста

~ 2 65624 часа

~ 3 84048 часов

18.49%

Коэффициент вовлеченности

~ 1

Постов в день

Ads index

beta

Архив постов

30 032

🗣 Инженер рекомендательных систем рассказал про перспективы развития направления. В подкасте научному изданию N + 1 инженер рекомендательных систем Яндекса Николай Савушкин рассказал про тренд унификации и универсализации технологий. Рекомендации в дальнейшем можно развивать: - как ещё одну модальность LLM; - как агента, который строит дерево вариантов для жизни и карьеры. 📌 Подробнее @machinelearning_interview

30 032

ML-инженеры, какая встреча! 19 июля в Москве снова пройдет Turbo ML Conf от группы Т-Технологий. В этом году — еще масштабнее! В программе 5 тематических потоков, продовые кейсы и технологии. Среди спикеров — эксперты Т-Банка, Сбера, Яндекса и других ведущих специалистов. Будет много нетворкинга, прикладные доклады, настольные игры, лимитированный мерч. Участие бесплатное. Успейте оставить заявку

30 032

Полезный шаблон структуры для любого ИИ‑проекта: готовый к использованию каркас с оптимальными папками, лайфхаками и советами. Навигация — идеально для Cursor и чистого кода. Лучший старт для тех, кто хочет быстро развернуть своё AI‑приложение. Github

30 032

Repost from Machinelearning

✔️ Google Deepmind в списке самых влиятельных компаний 2025 года по версии TIME. Медиагигант TIME включил DeepMind в свой рейтинг TIME100-2025 в категории «Влияние в ИИ». Это отдельная категория признания пяти выдающихся компаний, которые внесли значимый вклад в развитие своих областей. В 2024 году создатели AlphaFold из Google DeepMind получили Нобелевскую премию по химии, но помимо научных достижений, DeepMind активно развивает языковые общедоступные модели: Gemini 2.5 Pro до сих пор лидирует в тестах на «интеллект». CEO Google DeepMind Демис Хассабис мечтает создать «универсального цифрового ассистента», способного не только помогать пользователям, но и проводить самостоятельные научные исследования. time.com ✔️ Новостной чатбот ChatEurope оказался бесполезен. 15 европейских СМИ из 7 стран запустили Chat Europe, платформу на основе ИИ, которая обещает предоставлять новости о ЕС без дезинформации. Проект финансируется ЕС, использует модель Mistral и был разработан румынской компанией DRUID AI. Пользовательские тесты показали проблемы: система часто ссылается на устаревшие данные и дает нерелевантные ответы. Например, запрос о ситуации в Германии выдал устаревшую информацию 2010 года, в то время как ChatGPT с веб-поиском - дал актуальный и всесторонний ответ. Создатели чатбота заявляют непредвзятость сервиса и проверенные источники, но реальность пока не соответствует этим утверждениям. Эксперты ждут улучшений: если чатбот не научится отслеживать события в реальном времени, его польза останется под вопросом. presseportal.de ✔️ OpenAI выходит на рынок корпоративных решений с ценником от $10 млн за проект. OpenAI активно развивает консалтинговое направление для бизнеса, предлагая клиентам персонализацию моделей GPT-4o под их данные и разработку приложений - от чат-ботов до аналитических инструментов. За такие услуги компания запрашивает от $10 млн, ставя себя в один ряд с Palantir и Accenture. Среди клиентов направления - Министерство обороны США и азиатский техногигант Grab. OpenAI явно стремится закрепиться не только как лаборатория для исследований, но и как партнер для масштабных внедрений. theinformation.com ✔️ Huawei открыла доступ к семейству моделей Pangu. Huawei анонсировала открытый доступ к своей серии языковых моделей Pangu: компактной Pangu 7B и флагманской Pangu Pro MoE с 72 миллиардами параметров. Обе модели оптимизированы для инференса на чипах Ascend. Исходный код, веса и инструменты для работы с MoE-архитектурами уже доступны на платформе GitCode. Разработчики получают возможность тестировать решения на чипах Huawei, что актуально в условиях санкций. Меньшая версия Pangu 7B в открытом доступе появится позже. ecns.cn ✔️ Cloudflare вводит контроль над ИИ-краулерами. Cloudflare начал блокировать ИИ-краулеры по умолчанию, теперь новые сайты автоматически получают опцию запрета сканирования без разрешения, а бета-версия сервиса Pay Per Crawl позволит монетизировать доступ. Новый протокол идентификации ботов поможет сайтам отсеивать анонимных скраперов, требуя раскрытия целей сбора данных. Поддержку инициативе выразили крупнейшие медиахолдинги и цифровые площадки, они давно говорят о важности компенсации за использование контента. cloudflare.com @ai_machinelearning_big_data #news #ai #ml

30 032

🍏 Apple выложила исходники FlexTok — нового токенизатора изображений с гибкой длиной FlexTok — это токенизатор, который представляет изображение как последовательность токенов переменной длины, от самых грубых до самых детализированных. В отличие от большинства image tokenizer'ов (где всегда фиксированное число токенов и они жёстко локализованы по патчам), здесь подход коarse-to-fine — как в PCA: - первый токен даёт максимально сжатое представление, - второй — добавляет детали, - третий — ещё больше и т.д. Такой порядок оказывается семантически разумным, хотя обучение шло без языевой подсказки. Получается структура, которую удобно использовать в генерации и понимании изображений. Всё сделано без магии: - используется nested dropout на токенах во время обучения, - архитектура простая, основана на известных компонентах, - токены можно интерпретировать по уровню детализации. 📎 Исходники: https://github.com/apple/ml-flextok 🖼️ Демка: https://huggingface.co/spaces/EPFL-VILAB/FlexTok 📊 Визуализации: https://flextok.epfl.ch Ставь лайк и подписывайся — каждый день публикуем полезные и не банальные советы для разработчиков.

30 032

🚀 Open-source альтернатива Perplexity, собранная одним разработчиком — уже 8.4K звёзд на GitHub! Scira (ранее MiniPerplx) — минималистичный AI-поисковик, который не просто ищет, но и цитирует источники. Работает на Vercel AI SDK, поддерживает Grok 3, GPT‑4o, Claude 4, Gemini и другие модели. 💡 Без логина. Без paywall. 🔎 Ищет по Web, X, Reddit, YouTube, статьям, акциям, погоде, билетам — через 15+ API 🧠 Умеет запускать код, строить графики, использовать память, работать в защищённой RAG-среде GitHub: https://github.com/zaidmukaddam/scira

30 032

💎Открытые уроки для специалистов в компьютерном зрении. В рамках курса «Компьютерное зрение. Advanced» 🎓Урок 1: Инференс без задержек: как ускорить обработку видео для CV-моделей: https://tglink.io/baad53b57904 🔹Считывание видео и преобразование в тензоры для инференса и обучения. 🔹 Фреймворки и библиотеки: NVIDIA DALI, Video Processing Framework, torio, torchvision.io. 🔹 Сборка видеопотока из тензоров и стриминг через RTMP/RTSP — с GPU, без лишних копирований. 🎓Урок 2: YOLO-pose и MediaPipe в деле: распознаём позы и ключевые точки в реальном времени: https://tglink.io/baad53b57904 🔹 Знакомство с библиотекой Ultralytics и моделью YOLO-pose: как использовать её для задач Pose Estimation. 🔹 Разбор MediaPipe: определим лицевые и ручные ключевые точки 🔹 Готовые пайплайны для анализа движений, AR и трекинга 🎓Урок 3: Мультимодальные LLM: https://tglink.io/baad53b57904 🔹 Расскажем, как мультимодальные LLM модели видят изображения и понимают текст ➡️Регистрация: https://tglink.io/baad53b57904?erid=2W5zFHLzbU4 #реклама О рекламодателе

30 032

📌 Sakana AI объявила о выпуске алгоритма AB-MCTS AB-MCTS (Adaptive Branching Monte Carlo Tree Search) — новый алгоритм масштабирования во время инференса, который обеспечивает коллективный интеллект для ИИ, позволяя нескольким передовым моделям (например, Gemini 2.5 Pro, o4-mini и DeepSeek-R1-0528) сотрудничать. Sakana AI вдохновилась принципами коллективного интеллекта, где лучшие решения достигаются через объединение разнообразных мнений. Каждая модель обладает своими сильными сторонами и уникальными свойствами, которые алгоритм использует в качестве ресурсов для совместного решения задач. Ключевые особенности AB-MCTS: • Коллективное сотрудничество моделей — алгоритм объединяет предложения разных моделей, выбирает наиболее многообещающие варианты и проверяет их через симуляции. • Адаптивное ветвление — дерево поиска расширяется динамически там, где это приносит наибольшую пользу. • Высокая эффективность на ARC-AGI-2 — комбинация o4-mini, Gemini 2.5 Pro и R1 0528 показывает значительный прирост по сравнению с каждой моделью в отдельности. Авторы приводят следующие результаты работы алгоритма на 120 задачах ARC-AGI-2: • Repeated Sampling (o4-mini): 23,0 % решённых задач • AB-MCTS (o4-mini): 27,5 % решённых задач (абсолютный прирост +4,5 п.п., относительный +19,6 %) • Multi-LLM AB-MCTS (o4-mini + Gemini 2.5 Pro + DeepSeek-R1-0528): > 30 % решённых задач Sakana AI пытается внедрять принципы эволюции и коллективного интеллекта в разработку передовых ИИ-систем, с целью воплотить командный подход человеческих экспертов в мире искусственного интеллекта. • Исходный код TreeQuest (реализация алгоритма): https://github.com/SakanaAI/treequest • Эксперименты на ARC-AGI-2: https://github.com/SakanaAI/ab-mcts-arc2 • Подробнее в блоге: https://sakana.ai/ab-mcts • Статья: https://arxiv.org/abs/2503.04412 @ai_machinelearning_big_data #Sakana #al #ml #

30 032

Когда с первого взгляда ясно — статья огонь. Baidu выложила сразу 23 модели на Hugging Face размерами — от 0.3B до 424B параметров! 💥 Тех репорт: https://yiyan.baidu.com/blog/publication/ERNIE_Technical_Report.pdf

30 032

💸 Первый автономный ИИ-хедж-фонд запущен! Команда из 17 ИИ-агентов торгует акциями, управляет рисками и принимает решения: • ИИ-стратеги — имитируют Баффета, Мангера и других гуру. • ИИ-аналитики — выбирают топовые акции. • ИИ-рисковики — оценивают риски и задают лимиты. • ИИ-управляющий — финализирует сделки. Разработчики перестраховались: проект только для учёбы. Гайд по установке: тут. #ИИ #Финансы #ХеджФонд

30 032

🤖 Цукерберг идёт ва-банк: ставка на суперИИ и $14.3 млрд за контроль над Scale AI Миллиардер официально заявил о своих амбициях в гонке за суперинтеллектом: 💰 Компания вложила $14.3 млрд в Scale AI и забрала себе не только долю, но и её основателя Александра Ванга — теперь он возглавляет новое стратегическое направление Meta по созданию суперИИ. 👥 Параллельно Цукерберг собирает “звёздную команду” из 50+ топ-исследователей, переманивая людей из OpenAI, DeepMind и других AI-групп с предложениями до $100 млн в опционах. В индустрии это уже называют "Zuck Bucks". 📌 Зачем это всё: • Llama 4 оказался слабее ожиданий • Meta хочет не просто догнать конкурентов, а построить AGI на своих условиях • Scale даёт доступ к инфраструктуре и огромным объёмам размеченных данных ⚠️ Но есть и проблемы: • Google и OpenAI уже свернули сотрудничество со Scale после сделки • Внутри компании есть разногласия — Ян Лекун скептически относится к LLM‑подходу к AGI • На рынке задаются вопросом: зачем строить “суперинтеллект”, если нет killer-продукта? 📉 Это может быть самым амбициозным (или самым дорогим) экспериментом компании со времён метавселенной. @machinelearning_interview #AGI #superintelligence #Zuckerberg #ScaleAI #AI #OpenAI #DeepMind #Llama4

30 032

🧬 Genesys: Language Modeling by Language Models Проект от Allen Institute — Genesys (Genetic Discovery System) — это распределённая эволюционная система, в которой сами языковые модели (LLM) создают и улучшают другие языковые модели. 🛠 Что делает Genesys: • Автоматизирует весь цикл: от генерации идеи до реализации, проверки, обучения и оценки новых моделей • Использует LLM-агентов в роли исследователей и архитекторов • Работает как распределённая система, способная параллельно развивать десятки направлений • Имеет визуальный интерфейс, где можно наблюдать за эволюцией моделей и сравнивать результаты 🌐 Демо-доступ: Доступен онлайн на сайте genesys.allen.ai (первая сборка может загружаться медленно) 📊 Основные разделы интерфейса: • Evolution Statistics — статистика и ход эволюции • Design Viewer — галерея сгенерированных архитектур (можно скачивать) • Design Leaderboard — лидерборд лучших дизайнов по метрикам 🎥 Есть короткое видео-демо, где показаны функции и логика системы 📄 Исходный код и исследовательская статья опубликованы на GitHub и в открытом доступе 🧠 Genesys — это шаг к будущему, где языковые модели смогут исследовать и разрабатывать сами себя 💻 Попробовать: https://genesys.allen.ai 📝 Код https://github.com/allenai/genesys ✍️ Статья: https://arxiv.org/abs/2506.20249

30 032

Repost from Machinelearning

🧠 Как машинное обучение помогло заглянуть за пределы Стандартной модели в физике На одной из самых престижных премий мира Breakthrough Prize 2025 отметили участников эксперимента LHCb на Большом адронном коллайдере — в их числе выпускники Школы анализа данных (ШАД) Яндекса и ученые НИУ ВШЭ. Они применили ML, чтобы улучшить анализ данных с коллайдера и сделать возможным открытие тетракварков и пентакварков — нестабильных частиц, предсказанных теорией. 🟠Роль машинного обучения Для анализа данных эксперимента использовались CatBoost, генеративные нейросети и алгоритмы интеллектуального отбора. Они позволили значительно повысить точность реконструкции траекторий частиц и отбор редких событий среди фона. Эффективность обработки выросла, особенно это заметно при работе с большими потоками коллайдерных данных. 🟠Ключевые открытия Тетракварки и пентакварки — новые экзотические частицы, состоящие из 4 и 5 кварков (в отличие от привычных протонов и нейтронов). Их открытие подтверждает Стандартную модель, но не переворачивает физику. CP-нарушение — обнаружена асимметрия между материей и антиматерией, но ее масштаб недостаточен для объяснения дисбаланса во Вселенной. 🟠Главный вопрос: почему материи больше, чем антиматерии? Ученые подтвердили CP-нарушение, но его недостаточно для полного объяснения асимметрии. Требуется выполнение трёх условий Сахарова, два из которых пока не обнаружены. 🟠Что дальше Новые эксперименты в Дубне (BM@N, MPD, SPD) и возможное строительство коллайдера в Китае. Поиск «новой физики» за пределами Стандартной модели. ⏩Полное интервью @ai_machinelearning_big_data #ML #AI #CatBoost #Physics #LHCb #ШАД #ВШЭ #BreakthroughPrize

30 032

Repost from Machinelearning

🧠 Как машинное обучение помогло заглянуть за пределы Стандартной модели в физике На одной из самых престижных премий мира Breakthrough Prize 2025 отметили участников эксперимента LHCb на Большом адронном коллайдере — в их числе выпускники Школы анализа данных (ШАД) Яндекса и ученые НИУ ВШЭ. Они применили ML, чтобы улучшить анализ данных с коллайдера и сделать возможным открытие тетракварков и пентакварков — нестабильных частиц, предсказанных теорией. 🟠 Роль машинного обучения Для анализа данных эксперимента использовались CatBoost, генеративные нейросети и алгоритмы интеллектуального отбора. Они позволили значительно повысить точность реконструкции траекторий частиц и отбор редких событий среди фона. Эффективность обработки выросла, особенно это заметно при работе с большими потоками коллайдерных данных. 🟠 Ключевые открытия Тетракварки и пентакварки — новые экзотические частицы, состоящие из 4 и 5 кварков (в отличие от привычных протонов и нейтронов). Их открытие подтверждает Стандартную модель, но не переворачивает физику. CP-нарушение — обнаружена асимметрия между материей и антиматерией, но ее масштаб недостаточен для объяснения дисбаланса во Вселенной. 🟠 Главный вопрос: почему материи больше, чем антиматерии? Ученые подтвердили CP-нарушение, но его недостаточно для полного объяснения асимметрии. Требуется выполнение трёх условий Сахарова, два из которых пока не обнаружены. 🟠 Что дальше Новые эксперименты в Дубне (BM@N, MPD, SPD) и возможное строительство коллайдера в Китае. Поиск «новой физики» за пределами Стандартной модели. ⏩Полное интервью #ML #AI #CatBoost #Physics #LHCb #ШАД #ВШЭ #BreakthroughPrize

30 032

🛡️ Исследование Columbia University: LLM-агенты можно взломать через Reddit Учёные из Колумбийского университета показали, что ИИ-агентов на базе LLM можно обмануть, размещая вредоносные ссылки на популярных платформах вроде Reddit. ⚠️ Как это работает: Злоумышленник публикует пост с темой, близкой к интересам агента (например, программирование или финансы), и вшивает в него вредоносные инструкции или ссылки. Агент считает источник доверенным, заходит по ссылке — и может: • раскрыть конфиденциальные данные • отправить фишинговое письмо • выполнить другую вредоносную задачу 🧪 В ходе тестов — 100% агентов попались на уловку. 📚 Подробнее 🤖 Вывод: даже «умные» LLM‑агенты остаются уязвимыми к простым атакам на доверие. Безопасность — это не опция, а необходимость.

30 032

miniDiffusion — упрощённая реализация Stable Diffusion 3.5 на PyTorch 🔹 Этот репозиторий — минималистичный, но рабочий аналог Stable Diffusion: всего ~2800 строк кода, без лишних зависимостей. 📦 Что внутри: • Архитектура DiT (Diffusion Transformer) • Кодировщики: T5 (текст) и CLIP • VAE для генерации изображений • Attention, Noise Scheduler и FID-оценка качества 🧪 Зачем это нужно: • Понять, как работает диффузионная генерация • Экспериментировать с архитектурой • Обучать и тестировать свои модели ▶️ Быстрый старт:


git clone https://github.com/yousef-rafat/miniDiffusion
pip install -r requirements.txt
python3 encoders/get_checkpoints.py

📌 Github

30 032

Repost from Machinelearning

✔️ OpenAI расширяет возможности ChatGPT Pro. OpenAI запустила Search Connectors для ChatGPT Pro и Team, функцию, которая напрямую связывает облачные хранилища (Google Drive, Dropbox и OneDrive) с интерфейсом чата. Теперь пользователи могут искать, анализировать и обобщать документы, не загружая их вручную. Лимит файлов на проект для Pro-подписчиков вырос с 20 до 40, а поддержка охватывает 12 сервисов, включая GitHub, Gmail и Outlook. Пока новинка доступна за пределами ЕС, Великобритании и Швейцарии. Open AI в сети Х ✔️ Google открыла доступ к Imagen 4. Imagen 4, усовершенствованные модели генерации изображений по текстовым запросам, стали доступны в двух версиях: базовая Imagen 4 (4 цента за изображение) для повседневных задач и Imagen 4 Ultra (6 центов) с повышенной детализацией и точностью исполнения инструкций. Обе модели доступны в Gemini API для платных пользователей, а также в ограниченном бесплатном тестировании через Google AI Studio. Разработчики обещают улучшенное отображение текста на картинках и расширение тарифных планов в ближайшие недели. Все сгенерированные изображения получат скрытый цифровой водяной знак SynthID. developers.googleblog.com ✔️ HPE и NVIDIA представили новую линейку решений для корпоративного ИИ. HPE и NVIDIA анонсировали совместные решения для создания «фабрик искусственного интеллекта» на базе модульной инфраструктуры. В линейку вошли серверы HPE ProLiant DL380a Gen12 с GPU NVIDIA RTX PRO 6000 Blackwell, которые предлагают универсальную платформу для генеративного и промышленного ИИ. Также был представлен HPE Private Cloud AI — готовое решение для быстрого внедрения ИИ, совместимое с фреймворком NVIDIA Enterprise AI Factory. Для финансового сектора планируется тестирование агентного ИИ с Accenture, а 26 новых партнеров расширят экосистему HPE, добавив 70 преднастроенных сценариев: от детекции мошенничества до кибербезопасности. Решения доступны для заказа, а система HPE Compute XD690 с GPU Blackwell Ultra начнет отгружаться в октябре. blogs.nvidia.com ✔️ Google DeepMind представила AlphaGenome. AlphaGenome — нейросеть, которая предсказывает, как мутации в ДНК влияют на регуляцию генов. Модель обрабатывает участки длиной до миллиона пар оснований, анализируя их на уровне отдельных «букв» и оценивая тысячи молекулярных свойств: активность генов, сплайсинг РНК, доступность участков ДНК. AlphaGenome сочетает сверточные слои для поиска коротких паттернов и трансформеры для анализа длинных последовательностей. Одна из ключевых особенностей - точное моделирование сплайс-сайтов, важное для изучения редких заболеваний. Модель превзошла аналоги в 22 из 24 тестов, предсказывая как структуру ДНК, так и эффекты вариантов. Доступ к AlphaGenome открыт через API для некоммерческих проектов. deepmind.google ✔️ LongWriter-Zero: модель, которая пишет длинные тексты благодаря RL. Группа исследователей из Сингапура и Китая представила LongWriter-Zero, модель, которая генерирует тексты длиной более 10 тысяч слов, обучаясь только через RL, без использования синтетических данных. Модель опирается на три специализированных «наградных» алгоритма, оценивающих структуру, качество и длину текста, а также уникальный метод «усреднения преимущества», который балансирует приоритеты между ними. LongWriter-Zero использует «промты-размышления»: перед написанием модель планирует структуру текста, улучшая его связность. Бенчмарки показали рост эффективности с 700 до 1200 поинтов Elo. Однако у модели есть слабые места: она склонна к повторам и переиспользованию слов, которые система поощряет в процессе обучения. Модель и датасет доступны на Hugging Face. huggingface.co @ai_machinelearning_big_data #news #ai #ml

30 032

🚦 premier — удобный инструмент для ограничения частоты вызовов в Python Что это такое: premier — это библиотека для контроля скорости вызовов функций в Python. Она помогает ограничить нагрузку на API, базу данных или любой другой ресурс, чтобы не получить отказ или блокировку. 📌 Возможности: • Поддержка популярных алгоритмов: token bucket, fixed window, leaky bucket • Работает как с обычными, так и с асинхронными функциями • Поддерживает Redis и другие хранилища для распределённого ограничения • Гибкая настройка: лимиты, ключи, длительность окна, своя логика • Простое применение через декораторы 🧪 Пример:


from premier import throttler, ThrottleAlgo, RedisHandler

@throttler.fixed_window(quota=3, duration=5)
def request(url: str):
    # максимум 3 вызова каждые 5 секунд
    ...

@throttler.token_bucket(quota=5, duration=60)
async def async_request(...):
    # асинхронный токен-бакет
    ...

🔧 Где применить: • Ограничение частоты запросов к внешним API • Защита от перегрузки микросервисов • Контроль доступа к ресурсам внутри приложения • Настройка rate-limit в фоновом обработчике или очереди ✅ Почему стоит попробовать: premier — лёгкая, понятная и гибкая библиотека. Она упрощает внедрение rate limiting, особенно если нужно масштабироваться или работать в асинхронной среде. Если строишь что-то распределённое или просто не хочешь случайно “положить” сервис из-за частых вызовов — premier отлично подойдёт. 📌 Github @machinelearning_interview

30 032

Уже пользовались GigaChat? Предлагаем принять участие в его разработке! 💻 Сбер приглашает на One Day Offer талантливых DL-инженеров в команду production-внедрения GigaChat. С вас — понимание, как работают модели на уровне математики и аппаратуры, и желание оптимизировать работу LLM моделей, создавать инфраструктуру для нагрузок на кластеры и выводить новые архитектуры в промышленную среду. С нас — интересные задачи, современное железо, график на выбор и классное IT-комьюнити. Встречаемся 28 июня в 10:30, а потом, вполне возможно, и за соседним рабочим столом в офисе! Зарегистрироваться! 👌

30 032

📣 NVIDIA представили NVFP4 — новый 4-битный формат, который переопределяет экономику AI-инференса на базе архитектуры Blackwell. Формат NVFP4 работает на тензорных ядрах 5-го поколения и сочетает: • масштабирование по блокам в формате FP8 (4M3) • масштабирование по тензору в формате FP32 Такой подход позволяет сохранять точность моделей при резком снижении объёма памяти и ускорении вычислений. 🔋 Преимущества: • До 50× выше энергоэффективность • Снижение стоимости владения (TCO) • Повышенная производительность при масштабировании 📦 Поддержка уже реализована в: • TensorRT Model Optimizer • TensorRT-LLM • Интегрируется в vllm project • Поддержка также готовится доя lmsysorg 📌Blog : https://developer.nvidia.com/blog/introducing-nvfp4-for-efficient-and-accurate-low-precision-inference/ 📌 HF: https://huggingface.co/collections/nvidia/model-optimizer-66aa84f7966b3150262481a4