Библиотека собеса по Data Science | вопросы с собеседований - آمار و تحلیل کانال تلگرام @ds_interview

4 476

Когда мы подаем картинку в LLM (например, в GPT-4o или Gemini 1.5), модель не видит её как единый файл. Каким образом изображение «разрезается» для обработки трансформером?

Anonymous voting

4 476

При обучении детекторов объектов мы не можем использовать простую MSE для рамок. Используется метрика IoU. Что именно измеряет IoU и почему это критично для оценки точности детектора?

Anonymous voting

4 476

🦾 Почему ваши AI-продукты на базе LLM ломаются (и как это чинить)? Выкатили ИИ-фичу в прод, а она галлюцинирует, падает или выдает мусор? Приглашаем на открытый вебинар, где разберем реальную боль внедрения LLM-агентов и научимся делать так, чтобы «всё работало». 🗓 Когда: 14 мая в 19:00 МСК ⏱️ Формат: 60 минут мяса + 30 минут ответов на ваши вопросы 🧑🏻‍💻 Кто вещает: Эмиль Сатаев — Backend Platform Developer (8+ лет в разработке). Человек, который своими руками внедряет LLM и агентные системы в реальные коммерческие сервисы. 🎁 Главный бонус для онлайна: Только участникам прямого эфира подарим уникальный промокод на скидку 10.000 ₽ на большой курс AgentOps. 👉 Занять место на вебинаре

4 476

YOLOv11 и последующие версии радикально отличаются от классических методов детекции (как R-CNN). Какое архитектурное решение делает YOLO такой быстрой, что она может работать на мобильных процессорах в реальном времени?

Anonymous voting

4 476

Какие именно точки в датасете становятся «опорными векторами» после обучения SVM?

Anonymous voting

4 476

В маркетинге часто используют PSM, чтобы оценить эффект акции, если мы не проводили честный A/B тест. Зачем нам нужно предсказывать вероятность получения скидки (Propensity Score) для каждого клиента, прежде чем сравнивать их покупки?

Anonymous voting

4 476

Современный DS-тренд 2025–2026 годов — поиск «плоских» минимумов (flat minima). Почему плоский минимум функции потерь считается более предпочтительным для финальной модели, чем глубокий и узкий («острый») минимум?

Anonymous voting

4 476

Какая особенность алгоритмов с инерцией (Momentum), таких как Adam или RMSProp, помогает им преодолевать седловые точки быстрее, чем обычному SGD?

Anonymous voting

4 476

В отличие от первых моделей (DDPM), Stable Diffusion работает не с самими пикселями напрямую, а в «латентном пространстве». Какое преимущество дает переход от работы с пикселями к работе с сжатыми латентными представлениями (через VAE)?

Anonymous voting

4 476

В LLM-агентах часто встречается атака типа Indirect Prompt Injection. Каким образом злоумышленник может захватить контроль над чат-ботом, не имея прямого доступа к окну чата пользователя?

Anonymous voting

4 476

В отличие от текста, где токен — это слово, современные модели для рядов (например, PatchTST) не подают каждое число по отдельности. Зачем временной ряд разбивается на «патчи» (группы соседних точек) перед подачей в трансформер?

Anonymous voting

4 476

Вы строите рекомендательную систему друзей. Ваша модель должна предсказать, появится ли ребро между узлами A и B. Какая метрика близости узлов в графе, основанная на «общих соседях», наиболее эффективно учитывает их популярность?

Anonymous voting

4 476

Этот алгоритм во многом вдохновлен Word2Vec, но применяется к узлам графа.Каким образом Node2Vec находит баланс между изучением локального окружения узла (микроструктура) и его роли в глобальном сообществе (макроструктура)?

Anonymous voting

4 476

Осталось всего 4 места на курс по ИИ-агентам. 30 апреля закрываем набор окончательно. В ГС честно рассказали: — Кому курс не подойдет; — Какой хардкор в программе (LangGraph, AutoGen, CrewAI); — Как мы даем токены, чтобы вы не тратили свои деньги. 🏃‍♀️ Записаться, пока есть места

4 476

Представь, что агент играет в шахматы, делает 40 ходов и в конце выигрывает. В чем заключается сложность "Credit Assignment" в этой ситуации?

Anonymous voting

4 476

🏃‍♀️ Как провести вечер вторника с пользой для карьеры? Включайте кружок там личное приглашение от спикера. 👆 Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах. 🤫 Секретный лут: промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир. 👉 Регистрируйтесь на трансляцию

4 476

پیام ویدیو00:16

4 476

🏃‍♀️ Как провести вечер вторника с пользой для карьеры? Включайте кружок там личное приглашение от спикера. 👆 Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах. 🤫 Секретный лут: промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир. 👉 Регистрируйтесь на трансляцию

4 476

Вычислять точное апостериорное распределение для нейросетей математически невозможно. Приходится выбирать метод аппроксимации. В чем заключается основное преимущество Variational Inference перед методами MCMC (Markov Chain Monte Carlo)?

Anonymous voting

4 476

В 2026 году модели обязаны разделять два типа неопределенности. Представь беспилотный автомобиль, который едет в густом тумане. Какая неопределенность здесь является Эпистемической (Epistemic)?

Anonymous voting