Machine learning Interview

前往频道在 Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

显示更多

网络:Machinelearning 俄罗斯21 939 技术与应用4 569...

📈 Telegram 频道 Machine learning Interview 的分析概览

频道 Machine learning Interview (@machinelearning_interview) 俄语语言赛道中的是活跃参与者。目前社区聚集了 30 034 名订阅者，在 技术与应用 类别中位列第 4 569，并在 俄罗斯 地区排名第 21 939 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 30 034 名订阅者。

根据 11 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 39，过去 24 小时变化为 8，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 18.49%。内容发布后 24 小时内通常能获得 8.84% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 5 554 次浏览，首日通常累积 2 656 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 39。
主题关注点： 内容集中在 claude, llm, контекст, hermes, nvidia 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

凭借高频更新（最新数据采集于 12 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

30 034

订阅者

+824 小时

-117 天

+3930 天

5 554

帖子浏览量

~ 2 65624 小时

~ 3 84048 小时

18.49%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

30 032

🗣 Инженер рекомендательных систем рассказал про перспективы развития направления. В подкасте научному изданию N + 1 инженер рекомендательных систем Яндекса Николай Савушкин рассказал про тренд унификации и универсализации технологий. Рекомендации в дальнейшем можно развивать: - как ещё одну модальность LLM; - как агента, который строит дерево вариантов для жизни и карьеры. 📌 Подробнее @machinelearning_interview

30 032

ML-инженеры, какая встреча! 19 июля в Москве снова пройдет Turbo ML Conf от группы Т-Технологий. В этом году — еще масштабнее! В программе 5 тематических потоков, продовые кейсы и технологии. Среди спикеров — эксперты Т-Банка, Сбера, Яндекса и других ведущих специалистов. Будет много нетворкинга, прикладные доклады, настольные игры, лимитированный мерч. Участие бесплатное. Успейте оставить заявку

30 032

Полезный шаблон структуры для любого ИИ‑проекта: готовый к использованию каркас с оптимальными папками, лайфхаками и советами. Навигация — идеально для Cursor и чистого кода. Лучший старт для тех, кто хочет быстро развернуть своё AI‑приложение. Github

30 032

Repost from Machinelearning

✔️ Google Deepmind в списке самых влиятельных компаний 2025 года по версии TIME. Медиагигант TIME включил DeepMind в свой рейтинг TIME100-2025 в категории «Влияние в ИИ». Это отдельная категория признания пяти выдающихся компаний, которые внесли значимый вклад в развитие своих областей. В 2024 году создатели AlphaFold из Google DeepMind получили Нобелевскую премию по химии, но помимо научных достижений, DeepMind активно развивает языковые общедоступные модели: Gemini 2.5 Pro до сих пор лидирует в тестах на «интеллект». CEO Google DeepMind Демис Хассабис мечтает создать «универсального цифрового ассистента», способного не только помогать пользователям, но и проводить самостоятельные научные исследования. time.com ✔️ Новостной чатбот ChatEurope оказался бесполезен. 15 европейских СМИ из 7 стран запустили Chat Europe, платформу на основе ИИ, которая обещает предоставлять новости о ЕС без дезинформации. Проект финансируется ЕС, использует модель Mistral и был разработан румынской компанией DRUID AI. Пользовательские тесты показали проблемы: система часто ссылается на устаревшие данные и дает нерелевантные ответы. Например, запрос о ситуации в Германии выдал устаревшую информацию 2010 года, в то время как ChatGPT с веб-поиском - дал актуальный и всесторонний ответ. Создатели чатбота заявляют непредвзятость сервиса и проверенные источники, но реальность пока не соответствует этим утверждениям. Эксперты ждут улучшений: если чатбот не научится отслеживать события в реальном времени, его польза останется под вопросом. presseportal.de ✔️ OpenAI выходит на рынок корпоративных решений с ценником от $10 млн за проект. OpenAI активно развивает консалтинговое направление для бизнеса, предлагая клиентам персонализацию моделей GPT-4o под их данные и разработку приложений - от чат-ботов до аналитических инструментов. За такие услуги компания запрашивает от $10 млн, ставя себя в один ряд с Palantir и Accenture. Среди клиентов направления - Министерство обороны США и азиатский техногигант Grab. OpenAI явно стремится закрепиться не только как лаборатория для исследований, но и как партнер для масштабных внедрений. theinformation.com ✔️ Huawei открыла доступ к семейству моделей Pangu. Huawei анонсировала открытый доступ к своей серии языковых моделей Pangu: компактной Pangu 7B и флагманской Pangu Pro MoE с 72 миллиардами параметров. Обе модели оптимизированы для инференса на чипах Ascend. Исходный код, веса и инструменты для работы с MoE-архитектурами уже доступны на платформе GitCode. Разработчики получают возможность тестировать решения на чипах Huawei, что актуально в условиях санкций. Меньшая версия Pangu 7B в открытом доступе появится позже. ecns.cn ✔️ Cloudflare вводит контроль над ИИ-краулерами. Cloudflare начал блокировать ИИ-краулеры по умолчанию, теперь новые сайты автоматически получают опцию запрета сканирования без разрешения, а бета-версия сервиса Pay Per Crawl позволит монетизировать доступ. Новый протокол идентификации ботов поможет сайтам отсеивать анонимных скраперов, требуя раскрытия целей сбора данных. Поддержку инициативе выразили крупнейшие медиахолдинги и цифровые площадки, они давно говорят о важности компенсации за использование контента. cloudflare.com @ai_machinelearning_big_data #news #ai #ml

30 032

🍏 Apple выложила исходники FlexTok — нового токенизатора изображений с гибкой длиной FlexTok — это токенизатор, который представляет изображение как последовательность токенов переменной длины, от самых грубых до самых детализированных. В отличие от большинства image tokenizer'ов (где всегда фиксированное число токенов и они жёстко локализованы по патчам), здесь подход коarse-to-fine — как в PCA: - первый токен даёт максимально сжатое представление, - второй — добавляет детали, - третий — ещё больше и т.д. Такой порядок оказывается семантически разумным, хотя обучение шло без языевой подсказки. Получается структура, которую удобно использовать в генерации и понимании изображений. Всё сделано без магии: - используется nested dropout на токенах во время обучения, - архитектура простая, основана на известных компонентах, - токены можно интерпретировать по уровню детализации. 📎 Исходники: https://github.com/apple/ml-flextok 🖼️ Демка: https://huggingface.co/spaces/EPFL-VILAB/FlexTok 📊 Визуализации: https://flextok.epfl.ch Ставь лайк и подписывайся — каждый день публикуем полезные и не банальные советы для разработчиков.

30 032

🚀 Open-source альтернатива Perplexity, собранная одним разработчиком — уже 8.4K звёзд на GitHub! Scira (ранее MiniPerplx) — минималистичный AI-поисковик, который не просто ищет, но и цитирует источники. Работает на Vercel AI SDK, поддерживает Grok 3, GPT‑4o, Claude 4, Gemini и другие модели. 💡 Без логина. Без paywall. 🔎 Ищет по Web, X, Reddit, YouTube, статьям, акциям, погоде, билетам — через 15+ API 🧠 Умеет запускать код, строить графики, использовать память, работать в защищённой RAG-среде GitHub: https://github.com/zaidmukaddam/scira

30 032

💎Открытые уроки для специалистов в компьютерном зрении. В рамках курса «Компьютерное зрение. Advanced» 🎓Урок 1: Инференс без задержек: как ускорить обработку видео для CV-моделей: https://tglink.io/baad53b57904 🔹Считывание видео и преобразование в тензоры для инференса и обучения. 🔹 Фреймворки и библиотеки: NVIDIA DALI, Video Processing Framework, torio, torchvision.io. 🔹 Сборка видеопотока из тензоров и стриминг через RTMP/RTSP — с GPU, без лишних копирований. 🎓Урок 2: YOLO-pose и MediaPipe в деле: распознаём позы и ключевые точки в реальном времени: https://tglink.io/baad53b57904 🔹 Знакомство с библиотекой Ultralytics и моделью YOLO-pose: как использовать её для задач Pose Estimation. 🔹 Разбор MediaPipe: определим лицевые и ручные ключевые точки 🔹 Готовые пайплайны для анализа движений, AR и трекинга 🎓Урок 3: Мультимодальные LLM: https://tglink.io/baad53b57904 🔹 Расскажем, как мультимодальные LLM модели видят изображения и понимают текст ➡️Регистрация: https://tglink.io/baad53b57904?erid=2W5zFHLzbU4 #реклама О рекламодателе

30 032

📌 Sakana AI объявила о выпуске алгоритма AB-MCTS AB-MCTS (Adaptive Branching Monte Carlo Tree Search) — новый алгоритм масштабирования во время инференса, который обеспечивает коллективный интеллект для ИИ, позволяя нескольким передовым моделям (например, Gemini 2.5 Pro, o4-mini и DeepSeek-R1-0528) сотрудничать. Sakana AI вдохновилась принципами коллективного интеллекта, где лучшие решения достигаются через объединение разнообразных мнений. Каждая модель обладает своими сильными сторонами и уникальными свойствами, которые алгоритм использует в качестве ресурсов для совместного решения задач. Ключевые особенности AB-MCTS: • Коллективное сотрудничество моделей — алгоритм объединяет предложения разных моделей, выбирает наиболее многообещающие варианты и проверяет их через симуляции. • Адаптивное ветвление — дерево поиска расширяется динамически там, где это приносит наибольшую пользу. • Высокая эффективность на ARC-AGI-2 — комбинация o4-mini, Gemini 2.5 Pro и R1 0528 показывает значительный прирост по сравнению с каждой моделью в отдельности. Авторы приводят следующие результаты работы алгоритма на 120 задачах ARC-AGI-2: • Repeated Sampling (o4-mini): 23,0 % решённых задач • AB-MCTS (o4-mini): 27,5 % решённых задач (абсолютный прирост +4,5 п.п., относительный +19,6 %) • Multi-LLM AB-MCTS (o4-mini + Gemini 2.5 Pro + DeepSeek-R1-0528): > 30 % решённых задач Sakana AI пытается внедрять принципы эволюции и коллективного интеллекта в разработку передовых ИИ-систем, с целью воплотить командный подход человеческих экспертов в мире искусственного интеллекта. • Исходный код TreeQuest (реализация алгоритма): https://github.com/SakanaAI/treequest • Эксперименты на ARC-AGI-2: https://github.com/SakanaAI/ab-mcts-arc2 • Подробнее в блоге: https://sakana.ai/ab-mcts • Статья: https://arxiv.org/abs/2503.04412 @ai_machinelearning_big_data #Sakana #al #ml #

30 032

Когда с первого взгляда ясно — статья огонь. Baidu выложила сразу 23 модели на Hugging Face размерами — от 0.3B до 424B параметров! 💥 Тех репорт: https://yiyan.baidu.com/blog/publication/ERNIE_Technical_Report.pdf

30 032

💸 Первый автономный ИИ-хедж-фонд запущен! Команда из 17 ИИ-агентов торгует акциями, управляет рисками и принимает решения: • ИИ-стратеги — имитируют Баффета, Мангера и других гуру. • ИИ-аналитики — выбирают топовые акции. • ИИ-рисковики — оценивают риски и задают лимиты. • ИИ-управляющий — финализирует сделки. Разработчики перестраховались: проект только для учёбы. Гайд по установке: тут. #ИИ #Финансы #ХеджФонд

30 032

🤖 Цукерберг идёт ва-банк: ставка на суперИИ и $14.3 млрд за контроль над Scale AI Миллиардер официально заявил о своих амбициях в гонке за суперинтеллектом: 💰 Компания вложила $14.3 млрд в Scale AI и забрала себе не только долю, но и её основателя Александра Ванга — теперь он возглавляет новое стратегическое направление Meta по созданию суперИИ. 👥 Параллельно Цукерберг собирает “звёздную команду” из 50+ топ-исследователей, переманивая людей из OpenAI, DeepMind и других AI-групп с предложениями до $100 млн в опционах. В индустрии это уже называют "Zuck Bucks". 📌 Зачем это всё: • Llama 4 оказался слабее ожиданий • Meta хочет не просто догнать конкурентов, а построить AGI на своих условиях • Scale даёт доступ к инфраструктуре и огромным объёмам размеченных данных ⚠️ Но есть и проблемы: • Google и OpenAI уже свернули сотрудничество со Scale после сделки • Внутри компании есть разногласия — Ян Лекун скептически относится к LLM‑подходу к AGI • На рынке задаются вопросом: зачем строить “суперинтеллект”, если нет killer-продукта? 📉 Это может быть самым амбициозным (или самым дорогим) экспериментом компании со времён метавселенной. @machinelearning_interview #AGI #superintelligence #Zuckerberg #ScaleAI #AI #OpenAI #DeepMind #Llama4

30 032

🧬 Genesys: Language Modeling by Language Models Проект от Allen Institute — Genesys (Genetic Discovery System) — это распределённая эволюционная система, в которой сами языковые модели (LLM) создают и улучшают другие языковые модели. 🛠 Что делает Genesys: • Автоматизирует весь цикл: от генерации идеи до реализации, проверки, обучения и оценки новых моделей • Использует LLM-агентов в роли исследователей и архитекторов • Работает как распределённая система, способная параллельно развивать десятки направлений • Имеет визуальный интерфейс, где можно наблюдать за эволюцией моделей и сравнивать результаты 🌐 Демо-доступ: Доступен онлайн на сайте genesys.allen.ai (первая сборка может загружаться медленно) 📊 Основные разделы интерфейса: • Evolution Statistics — статистика и ход эволюции • Design Viewer — галерея сгенерированных архитектур (можно скачивать) • Design Leaderboard — лидерборд лучших дизайнов по метрикам 🎥 Есть короткое видео-демо, где показаны функции и логика системы 📄 Исходный код и исследовательская статья опубликованы на GitHub и в открытом доступе 🧠 Genesys — это шаг к будущему, где языковые модели смогут исследовать и разрабатывать сами себя 💻 Попробовать: https://genesys.allen.ai 📝 Код https://github.com/allenai/genesys ✍️ Статья: https://arxiv.org/abs/2506.20249

30 032

Repost from Machinelearning

🧠 Как машинное обучение помогло заглянуть за пределы Стандартной модели в физике На одной из самых престижных премий мира Breakthrough Prize 2025 отметили участников эксперимента LHCb на Большом адронном коллайдере — в их числе выпускники Школы анализа данных (ШАД) Яндекса и ученые НИУ ВШЭ. Они применили ML, чтобы улучшить анализ данных с коллайдера и сделать возможным открытие тетракварков и пентакварков — нестабильных частиц, предсказанных теорией. 🟠Роль машинного обучения Для анализа данных эксперимента использовались CatBoost, генеративные нейросети и алгоритмы интеллектуального отбора. Они позволили значительно повысить точность реконструкции траекторий частиц и отбор редких событий среди фона. Эффективность обработки выросла, особенно это заметно при работе с большими потоками коллайдерных данных. 🟠Ключевые открытия Тетракварки и пентакварки — новые экзотические частицы, состоящие из 4 и 5 кварков (в отличие от привычных протонов и нейтронов). Их открытие подтверждает Стандартную модель, но не переворачивает физику. CP-нарушение — обнаружена асимметрия между материей и антиматерией, но ее масштаб недостаточен для объяснения дисбаланса во Вселенной. 🟠Главный вопрос: почему материи больше, чем антиматерии? Ученые подтвердили CP-нарушение, но его недостаточно для полного объяснения асимметрии. Требуется выполнение трёх условий Сахарова, два из которых пока не обнаружены. 🟠Что дальше Новые эксперименты в Дубне (BM@N, MPD, SPD) и возможное строительство коллайдера в Китае. Поиск «новой физики» за пределами Стандартной модели. ⏩Полное интервью @ai_machinelearning_big_data #ML #AI #CatBoost #Physics #LHCb #ШАД #ВШЭ #BreakthroughPrize

30 032

Repost from Machinelearning

🧠 Как машинное обучение помогло заглянуть за пределы Стандартной модели в физике На одной из самых престижных премий мира Breakthrough Prize 2025 отметили участников эксперимента LHCb на Большом адронном коллайдере — в их числе выпускники Школы анализа данных (ШАД) Яндекса и ученые НИУ ВШЭ. Они применили ML, чтобы улучшить анализ данных с коллайдера и сделать возможным открытие тетракварков и пентакварков — нестабильных частиц, предсказанных теорией. 🟠 Роль машинного обучения Для анализа данных эксперимента использовались CatBoost, генеративные нейросети и алгоритмы интеллектуального отбора. Они позволили значительно повысить точность реконструкции траекторий частиц и отбор редких событий среди фона. Эффективность обработки выросла, особенно это заметно при работе с большими потоками коллайдерных данных. 🟠 Ключевые открытия Тетракварки и пентакварки — новые экзотические частицы, состоящие из 4 и 5 кварков (в отличие от привычных протонов и нейтронов). Их открытие подтверждает Стандартную модель, но не переворачивает физику. CP-нарушение — обнаружена асимметрия между материей и антиматерией, но ее масштаб недостаточен для объяснения дисбаланса во Вселенной. 🟠 Главный вопрос: почему материи больше, чем антиматерии? Ученые подтвердили CP-нарушение, но его недостаточно для полного объяснения асимметрии. Требуется выполнение трёх условий Сахарова, два из которых пока не обнаружены. 🟠 Что дальше Новые эксперименты в Дубне (BM@N, MPD, SPD) и возможное строительство коллайдера в Китае. Поиск «новой физики» за пределами Стандартной модели. ⏩Полное интервью #ML #AI #CatBoost #Physics #LHCb #ШАД #ВШЭ #BreakthroughPrize

30 032

🛡️ Исследование Columbia University: LLM-агенты можно взломать через Reddit Учёные из Колумбийского университета показали, что ИИ-агентов на базе LLM можно обмануть, размещая вредоносные ссылки на популярных платформах вроде Reddit. ⚠️ Как это работает: Злоумышленник публикует пост с темой, близкой к интересам агента (например, программирование или финансы), и вшивает в него вредоносные инструкции или ссылки. Агент считает источник доверенным, заходит по ссылке — и может: • раскрыть конфиденциальные данные • отправить фишинговое письмо • выполнить другую вредоносную задачу 🧪 В ходе тестов — 100% агентов попались на уловку. 📚 Подробнее 🤖 Вывод: даже «умные» LLM‑агенты остаются уязвимыми к простым атакам на доверие. Безопасность — это не опция, а необходимость.

30 032

miniDiffusion — упрощённая реализация Stable Diffusion 3.5 на PyTorch 🔹 Этот репозиторий — минималистичный, но рабочий аналог Stable Diffusion: всего ~2800 строк кода, без лишних зависимостей. 📦 Что внутри: • Архитектура DiT (Diffusion Transformer) • Кодировщики: T5 (текст) и CLIP • VAE для генерации изображений • Attention, Noise Scheduler и FID-оценка качества 🧪 Зачем это нужно: • Понять, как работает диффузионная генерация • Экспериментировать с архитектурой • Обучать и тестировать свои модели ▶️ Быстрый старт:


git clone https://github.com/yousef-rafat/miniDiffusion
pip install -r requirements.txt
python3 encoders/get_checkpoints.py

📌 Github

30 032

Repost from Machinelearning

✔️ OpenAI расширяет возможности ChatGPT Pro. OpenAI запустила Search Connectors для ChatGPT Pro и Team, функцию, которая напрямую связывает облачные хранилища (Google Drive, Dropbox и OneDrive) с интерфейсом чата. Теперь пользователи могут искать, анализировать и обобщать документы, не загружая их вручную. Лимит файлов на проект для Pro-подписчиков вырос с 20 до 40, а поддержка охватывает 12 сервисов, включая GitHub, Gmail и Outlook. Пока новинка доступна за пределами ЕС, Великобритании и Швейцарии. Open AI в сети Х ✔️ Google открыла доступ к Imagen 4. Imagen 4, усовершенствованные модели генерации изображений по текстовым запросам, стали доступны в двух версиях: базовая Imagen 4 (4 цента за изображение) для повседневных задач и Imagen 4 Ultra (6 центов) с повышенной детализацией и точностью исполнения инструкций. Обе модели доступны в Gemini API для платных пользователей, а также в ограниченном бесплатном тестировании через Google AI Studio. Разработчики обещают улучшенное отображение текста на картинках и расширение тарифных планов в ближайшие недели. Все сгенерированные изображения получат скрытый цифровой водяной знак SynthID. developers.googleblog.com ✔️ HPE и NVIDIA представили новую линейку решений для корпоративного ИИ. HPE и NVIDIA анонсировали совместные решения для создания «фабрик искусственного интеллекта» на базе модульной инфраструктуры. В линейку вошли серверы HPE ProLiant DL380a Gen12 с GPU NVIDIA RTX PRO 6000 Blackwell, которые предлагают универсальную платформу для генеративного и промышленного ИИ. Также был представлен HPE Private Cloud AI — готовое решение для быстрого внедрения ИИ, совместимое с фреймворком NVIDIA Enterprise AI Factory. Для финансового сектора планируется тестирование агентного ИИ с Accenture, а 26 новых партнеров расширят экосистему HPE, добавив 70 преднастроенных сценариев: от детекции мошенничества до кибербезопасности. Решения доступны для заказа, а система HPE Compute XD690 с GPU Blackwell Ultra начнет отгружаться в октябре. blogs.nvidia.com ✔️ Google DeepMind представила AlphaGenome. AlphaGenome — нейросеть, которая предсказывает, как мутации в ДНК влияют на регуляцию генов. Модель обрабатывает участки длиной до миллиона пар оснований, анализируя их на уровне отдельных «букв» и оценивая тысячи молекулярных свойств: активность генов, сплайсинг РНК, доступность участков ДНК. AlphaGenome сочетает сверточные слои для поиска коротких паттернов и трансформеры для анализа длинных последовательностей. Одна из ключевых особенностей - точное моделирование сплайс-сайтов, важное для изучения редких заболеваний. Модель превзошла аналоги в 22 из 24 тестов, предсказывая как структуру ДНК, так и эффекты вариантов. Доступ к AlphaGenome открыт через API для некоммерческих проектов. deepmind.google ✔️ LongWriter-Zero: модель, которая пишет длинные тексты благодаря RL. Группа исследователей из Сингапура и Китая представила LongWriter-Zero, модель, которая генерирует тексты длиной более 10 тысяч слов, обучаясь только через RL, без использования синтетических данных. Модель опирается на три специализированных «наградных» алгоритма, оценивающих структуру, качество и длину текста, а также уникальный метод «усреднения преимущества», который балансирует приоритеты между ними. LongWriter-Zero использует «промты-размышления»: перед написанием модель планирует структуру текста, улучшая его связность. Бенчмарки показали рост эффективности с 700 до 1200 поинтов Elo. Однако у модели есть слабые места: она склонна к повторам и переиспользованию слов, которые система поощряет в процессе обучения. Модель и датасет доступны на Hugging Face. huggingface.co @ai_machinelearning_big_data #news #ai #ml

30 032

🚦 premier — удобный инструмент для ограничения частоты вызовов в Python Что это такое: premier — это библиотека для контроля скорости вызовов функций в Python. Она помогает ограничить нагрузку на API, базу данных или любой другой ресурс, чтобы не получить отказ или блокировку. 📌 Возможности: • Поддержка популярных алгоритмов: token bucket, fixed window, leaky bucket • Работает как с обычными, так и с асинхронными функциями • Поддерживает Redis и другие хранилища для распределённого ограничения • Гибкая настройка: лимиты, ключи, длительность окна, своя логика • Простое применение через декораторы 🧪 Пример:


from premier import throttler, ThrottleAlgo, RedisHandler

@throttler.fixed_window(quota=3, duration=5)
def request(url: str):
    # максимум 3 вызова каждые 5 секунд
    ...

@throttler.token_bucket(quota=5, duration=60)
async def async_request(...):
    # асинхронный токен-бакет
    ...

🔧 Где применить: • Ограничение частоты запросов к внешним API • Защита от перегрузки микросервисов • Контроль доступа к ресурсам внутри приложения • Настройка rate-limit в фоновом обработчике или очереди ✅ Почему стоит попробовать: premier — лёгкая, понятная и гибкая библиотека. Она упрощает внедрение rate limiting, особенно если нужно масштабироваться или работать в асинхронной среде. Если строишь что-то распределённое или просто не хочешь случайно “положить” сервис из-за частых вызовов — premier отлично подойдёт. 📌 Github @machinelearning_interview

30 032

Уже пользовались GigaChat? Предлагаем принять участие в его разработке! 💻 Сбер приглашает на One Day Offer талантливых DL-инженеров в команду production-внедрения GigaChat. С вас — понимание, как работают модели на уровне математики и аппаратуры, и желание оптимизировать работу LLM моделей, создавать инфраструктуру для нагрузок на кластеры и выводить новые архитектуры в промышленную среду. С нас — интересные задачи, современное железо, график на выбор и классное IT-комьюнити. Встречаемся 28 июня в 10:30, а потом, вполне возможно, и за соседним рабочим столом в офисе! Зарегистрироваться! 👌

30 032

📣 NVIDIA представили NVFP4 — новый 4-битный формат, который переопределяет экономику AI-инференса на базе архитектуры Blackwell. Формат NVFP4 работает на тензорных ядрах 5-го поколения и сочетает: • масштабирование по блокам в формате FP8 (4M3) • масштабирование по тензору в формате FP32 Такой подход позволяет сохранять точность моделей при резком снижении объёма памяти и ускорении вычислений. 🔋 Преимущества: • До 50× выше энергоэффективность • Снижение стоимости владения (TCO) • Повышенная производительность при масштабировании 📦 Поддержка уже реализована в: • TensorRT Model Optimizer • TensorRT-LLM • Интегрируется в vllm project • Поддержка также готовится доя lmsysorg 📌Blog : https://developer.nvidia.com/blog/introducing-nvfp4-for-efficient-and-accurate-low-precision-inference/ 📌 HF: https://huggingface.co/collections/nvidia/model-optimizer-66aa84f7966b3150262481a4