False Positive

前往频道在 Telegram

PT ML Team

显示更多

俄罗斯316 735 技术与应用40 828

1 011

订阅者

无数据24 小时

+277 天

+4830 天

920

帖子浏览量

~ 35524 小时

~ 44648 小时

91.00%

参与率

无数据

每日帖子数

Ads index

beta

数据加载中...

相似频道

无数据

有任何问题？请刷新页面或联系我们的客服。

进出提及

---

吸引订阅者

七月 '26

+55

在1个频道中

六月 '26

+53

在4个频道中

Get PRO

五月 '26

+206

在7个频道中

Get PRO

四月 '26

+231

在3个频道中

Get PRO

三月 '26

+43

在0个频道中

Get PRO

二月 '26

+22

在0个频道中

Get PRO

一月 '26

在0个频道中

Get PRO

十二月 '25

+18

在1个频道中

Get PRO

十一月 '25

+46

在0个频道中

Get PRO

十月 '25

+232

在1个频道中

Get PRO

九月 '250

在0个频道中

Get PRO

八月 '250

在0个频道中

Get PRO

七月 '25

+172

在3个频道中

日期	订阅者增长	提及	频道
29 七月	0
28 七月	0
27 七月	0
26 七月	+2
25 七月	+25
24 七月	+2
23 七月	+1
22 七月	+1
21 七月	0
20 七月	0
19 七月	+1
18 七月	+1
17 七月	+2
16 七月	0
15 七月	+3
14 七月	+1
13 七月	+3
12 七月	+2
11 七月	0
10 七月	+2
09 七月	0
08 七月	0
07 七月	0
06 七月	+2
05 七月	0
04 七月	+2
03 七月	+1
02 七月	+4
01 七月	0

频道帖子

🎬 Запись встречи, на которой Кирилл Вавилов разобрал какие есть способы виртуализации GPU. #reading_group #mlinfra #benchmark #recording

2	Ураааааа! Мы перевалили за 1000! 🚀 Спасибо всем кто поддержал нас сегодня на Технохаб-конф :) проверили больше сотни ваших МЛ дизайнов - было очень круто) P.S. Самой популярной задачка про фишинг - была выбрана больше 30 раз. Задачки в комментах	480
3	Мы начинаем)	577
4	Поговорим про агентскую разработку в контексте всего SDLC. LLM-агенты уже неплохо ускоряют отдельных инженеров, но рост эффективности в написании кода не означает рост эффективности разработки. Обсудим причины, из-за которых подписка на Claude не помогает ускорить жизненный цикл разработки: - почему локальная оптимизация отдельного разработчика далеко не всегда превращается в оптимизацию всего SDLC; - где сегодня находятся реальные ограничения; - какие агентские паттерны уже начинают появляться вокруг разработки, ревью, тестирования, документации и сопровождения; - какие инфраструктурные изменения потребуются, чтобы агенты стали полноценными участниками процесса, а не просто “умным автокомплитом”; - посмотрим на примеры агентских архитектур. И самое интересное — сколько еще шишек предстоит набить, прежде чем агентская разработка действительно станет новым способом строить инженерные процессы. Формат хочется оставить открытым к обсуждению, чтобы вместе порефлексировать и ответить на вопрос, нужно ли взросление агентской разработки в том виде, в котором оно происходит. 📅 Встречаемся уже сегодня в 15:00 (по МСК). Ссылка для подключения в Толк #reading_group #development #agents	655
5	мы начинаем!	791
6	🎬 Запись встречи, с разбором бенчмарка SecCodeBench-V2. #reading_group #benchmark #recording	850
7	Всем привет! 👋 В эту пятницу на очередной Reading Group поговорим про ML-инфраструктуру, а именно - про виртуализацию GPU. В программе: - NVIDIA Multi-Instance GPU (MIG) - как делить один GPU между несколькими задачами; - HAMi - виртуализация GPU в Kubernetes для AI-инфраструктуры; - MLPerf Inference Benchmark - запустим бенчмарк и разберёмся, как интерпретировать результаты. 📅 Встречаемся в пятницу в 15:00 (по МСК). Ссылка для подключения в Толк. 👈 #reading_group #mlinfra #benchmark	1 374
8	Написали на Хабре как ковался MOLOT https://habr.com/ru/companies/pt/articles/1052206/	665
9	ByteDog наконец в PT Sandbox и PT Email Security! (ссылка) Мы уже рассказывали про саму концепцию байтового подхода, теперь — коротко о том, что под капотом: - Бинарная классификация на сырых байтах. Модель работает без предварительного парсинга, распаковки и ручного выделения признаков. Чтобы обучить сеть в условиях сильного дисбаланса классов, мы кастомизировали функцию потерь под жесткие ограничения на ложноположительные срабатывания (FP). - Трансформер для супердлинных последовательностей. Для обхода квадратичной сложности O(N^2) по памяти на больших файлах используется Windowed Attention. Модель обрабатывает контекст локальными окнами, а размер последовательности дополнительно оптимизируется за счет сжатия избыточных токенов на промежуточных слоях трансформера. - Детерминированный байтовый токенизатор. Работает по фиксированным правилам без предварительного обучения. Он агрегирует байтовый поток в компактные токены, уменьшая исходную длину последовательности еще до передачи в энкодер. - Устойчивое представление файлового пространства. За счет комбинации supervised и self-supervised обучения модель не просто классифицирует файлы, а строит эмбеддинги, где похожие по логике и структуре объекты группируются в кластеры. - Оптимизация инференса. Граф вычислений оптимизирован и скомпилирован в единый артефакт ONNX. Для механизмов self-attention используются аппаратно оптимизированные вычисления. На проде это дает ~30 ms на файл при потреблении памяти в пределах ~200 MB в пике. - Результаты в бою: На реальном потоке это принесло +10% к уникальным детектам когда в продукте используется только статический анализ, +2% в совокупности с поведенческим анализом и 400+ уникальных детектов угроз за первый месяц работы на нашей инфраструктуре. #ml_team	855
10	Мы начинаем)	894
11	Привет! На грядущей РГ снова поговорим про бенчмарки. На этот раз про оценку безопасности кода, который пишут LLM и всеми любимые coding-агенты. Залезем под капот SecCodeBench-V2 от компании Alibaba и выясним: - как устроены задачи и их автоматическая оценка через песочницу, - зачем бенчмарку понадобился подход LLM-as-a-judge, - насколько честно сравнивать модели по итоговому скору, - попрепарируем датасет руками: несостыковки, баги и недочеты, - а также покажем замеры качества на тройке-другой open-source моделей. А еще попытаемся ответить на вопрос, можно ли доверять бенчмарку, который разработчик модели сделал для оценки собственной модели?) Встречаемся как обычно в пятницу в 15:00 по МСК. Link #reading_group #benchmark	1 006
12	На DevFest 2026 Игорь Кабанов рассказал о том, как мы строили MLOps для системы детектирования вредоносного HTTP-трафика. Основная сложность проекта заключалась в том, что решение работает у клиентов on-premise. Это означает, что данные есть, телеметрия есть, а вот прямого доступа к самим данным, на которых будет работать готовая модель, нет. При этом модель нужно регулярно улучшать, контролировать качество детекта и держать под контролем ложные срабатывания. Основные поинты: • ETL для сбора и организации данных из множества источников; • поставка модели в кастомном ONNX с вшитым версионированием; • silent-режим - телеметрия без блокировки; • непрерывный мониторинг нескольких версий моделей одновременно; • анализ ложных срабатываний и процессы переразметки данных совместно с экспертами по кибербезопасности; В докладе описывается, как нам удалось выстроить вокруг этого полноценный MLOps-контур: от данных и обучения до мониторинга, анализа ошибок и безопасной поставки новых версий моделей. Запись доклада	743
13	Тех.репорт по модели MOLOT уже на arxiv 🔥 Мы выпустили MOLOT - трансформер для обнаружения вредоносного кода. Модель вошла в состав релиза 6.0 PT AI, а значит пора делиться техническими подробностями с вами! Полный набор: - arxiv - блог-пост - бенчмарк Для тех, кому нужен gonzo-обзор: ➡️ Поддержка топ-языков для веба: js/ts/py ➡️ До 40% меньше False Positive и F1 на 15% выше чем у open source инструментов ➡️ Ключевые улучшения: нашли и исключили data leakage по файловым названиям из оригинального подхода CEREBRO, расширили цепочку объявлениями литералов и padding активностями ➡️ 90% согласованности с экспертами по вредоносным строкам с помощью перехода к классификации файлов на LLM разметке и кастомный SHAP анализ ➡️ CPU инференс, квартал тестирования внутри контура компании с 90% Precision ➡️ Открытый бенчмарк для подтверждения результатов	2 453
14	Распиаренный WormGPT оказался Mistral-7B с RAG и почему кроме shadow it теперь стоит рассматривать и shadow AI в обзоре от наших аналитиков. https://habr.com/ru/companies/pt/articles/1044158/	805
15	Grafana Dashboard для анализа задач Airflow Когда мы начали искать готовое решение для мониторинга и анализа задач Airflow, выяснилось, что большинство популярных дашбордов на GitHub либо давно не обновлялись, либо покрывают только базовые инфраструктурные метрики. Поэтому мы сделали собственный Grafana dashboard для Airflow, который помогает быстро понять, что происходит с DAG'ами и задачами. С его помощью можно: • Находить самые медленные задачи и DAG'и • Выявлять нестабильные задачи с ошибками и ретраями • Смотреть распределение по операторам и воркерам * Исследовать историю запусков дагов и задач Установка: 1. Скачайте JSON-файл дашборда из репозитория 2. В Grafana откройте Dashboards → New → Import. 3. Импортируйте JSON и выберите PostgreSQL datasource, подключенный к metadata database Airflow. Будем рады issue, pull request'ам и идеям по улучшению=)	851
16	Помните кейс LiteLLM? Мы дропаем OMCBench (Open Malicious-Code Benchmark) - бенчмарк оценки качества по обнаружению вредоносного кода: - 3 языка: Python, JavaScript, TypeScript - 400 вредоносных пакетов, 400 чистых из pypi/npm - пофайловая LLM разметка, о которой говорили на OFFZONE прошлым летом - Открытая лицензия, BSD-2 Открытые решения на нем набирают не больше 75% F1, выдавая ~50% False Positive результатов... Те, кто уже нажал звездочку на гитхабе, могли заметить, что в таблице мы также анонсим MOLOT - нашу модель для решения этого класса задач. Ловите блогпост, а на подходе arxiv статья с подробностями про анализ графов вызовов бертами, LLM разметку и выкатку в prod! Ждите дроп статьи в канале, stay tuned!	3 144
17	Помните нашу игру про аналитика SOC. Вот вам похожее: попробуйте не разрешить агенту лишнего 🙂 https://llmgame.scalex.dev/	8 688
18	🎬 Запись встречи, на которой Дима разобрал какими могут быть последствия использования серых LLM провайдеров. #reading_group #agent #offense #recording	1 127
19	Мы начинаем	904
20	Привет! В этот раз поговорим про серые LLM-роутеры и как они могут незаметно угнать вашего AI-агента. Разберём статью Your Agent Is Mine через путь джуна Феди (скааазочный персонаж), который купился на дешёвый доступ к моделькам и ВНЕЗАПНО обнаружил, что “дёшево” не значит “хорошо”. Посмотрим, как работают атаки на tool-call’ы, при каких триггерах, а также как это касается индустрии перепродажи ключей. Приходите в пятницу в 15:00 - будем разбирать, как не отдать своего агента посреднику. Вот тут 👉 ссылка	1 273

查看所有帖子