es
Feedback
Библиотека собеса по Data Science | вопросы с собеседований

Библиотека собеса по Data Science | вопросы с собеседований

Ir al canal en Telegram

Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

Mostrar más
4 488
Suscriptores
+524 horas
+47 días
+4030 días
Archivo de publicaciones
«Расскажите про ваш опыт с Agentic RAG» — стандартный вопрос собеседования Рынок DS в 2026 году требует большего, чем знание
«Расскажите про ваш опыт с Agentic RAG» — стандартный вопрос собеседования Рынок DS в 2026 году требует большего, чем знание torch и pandas. Компании ищут инженеров, умеющих строить автономные системы, способные решать задачи без участия человека. На курсе мы даём то, что требуют на позициях Senior AI Engineer. Мы разбираем реальные задачи: как оценивать качество генерации (LLM-as-a-Judge), как строить мультиагентные системы и выводить это в прод. Темы для вашего резюме: — Orchestration: LangGraph, LangChain. — Retrieval: Hybrid Search, Reranking, GraphRAG. — Fine-tuning: адаптация моделей под специфику агента. — Evaluation: метрики качества для генеративных моделей. Подготовиться к собеседованиям нового уровня

Ты обучаешь лин.регрессию на данных с огромным количеством признаков, многие из них бесполезны. Нужно, чтобы модель не просто уменьшила веса плохих признаков, а полностью занулила их, выполнив автоматический отбор. Какой тип регуляризации нужно выбрать?
Anonymous voting

Ты обучаешь лин.регрессию на данных с огромным количеством признаков, многие из них бесполезны. Нужно, чтобы модель не просто уменьшила веса плохих признаков, а полностью занулила их, выполнив автоматический отбор. Какой тип регуляризации нужно выбрать?
Anonymous voting

Хард-скилл, который будут спрашивать в 2026 году Умение обучить модель — база. Умение завернуть её в автономного агента, рабо
Хард-скилл, который будут спрашивать в 2026 году Умение обучить модель — база. Умение завернуть её в автономного агента, работающего с инструментами — конкурентное преимущество. Курс «Разработка ИИ-агентов» уже стартовал. Что прокачаем: — построение RAG-систем с векторными БД; — оркестрацию через LangGraph; — понимание агентной архитектуры и ReAct. Первая лекция доступна бесплатно. Отличный шанс подтянуть теорию для собеседований. Записаться Смотреть лекцию

Ты строишь модель, предсказывающую, вернет ли клиент банковский кредит. В твоем наборе данных есть признак «Сумма выплаченных процентов». На обучении модель показывает идеальный результат. Почему этот признак является классическим примером Target Leakage?
Anonymous voting

Вы обучили модель градиентного бустинга предсказывать вероятность поломки. Она показывает отличный ROC-AUC, но бизнес жалуется: модель выдает 0.8, а в реальности поломка происходит в 40%. Какой инструмент позволяет визуально оценить это несоответствие?
Anonymous voting

Проблема A/B-тестов — дисперсия. Пользователи разные: кто-то всегда тратит много, кто-то мало. CUPED использует данные о пользователях, собранные до начала теста. Каким образом он уменьшает дисперсию?
Anonymous voting

Вы проводите тест в online-магазине. В тест группу случайно попал оптовый закупщик, который купил товара на 1000000₽, в то время как обычный чек — 2000₽. Это завысило среднее в группе. Какой метод наиболее корректен для снижения влияния таких выбросов?
Anonymous voting

Ты планируешь A/B-тест. Чтобы убедиться, что твой калькулятор p-value и система сплитования корректны, ты запускаешь A/A-тест: делишь трафик на 2 группы, но обеим показываешь одинаковый вариант сайта. Что является признаком проблемы при анализе A/A-теста?
Anonymous voting

Вопрос с собеседования 2026: RAG vs Agentic RAG На сеньорских позициях теперь спрашивают не просто про векторные базы, а про
Вопрос с собеседования 2026: RAG vs Agentic RAG На сеньорских позициях теперь спрашивают не просто про векторные базы, а про архитектуру агентов. В чём отличие? Обычный RAG: Нашёл документы → Сгенерировал ответ. Agentic RAG (на LangGraph): Оценил вопрос → Спланировал поиск → Проверил найденное → (если плохо) Переформулировал запрос и искал снова. Умение строить такие системы с циклами и состоянием — главный навык года. Мы учим этому на курсе. Записаться на курс Подготовка к вопросам по архитектуре: Смотрите вводный урок бесплатно.

Представь, что у тебя есть выборка из 1000 заказов, и тебе нужно найти 95% доверительный интервал для медианы чека. Математической формулы для интервала медианы «из коробки» (как для среднего) нет. Как работает классический Non-parametric Bootstrap?
Anonymous voting

Ты работаешь с временным рядом ежедневных транзакций банка. Визуально есть тренд. Чтобы применить модель ARIMA, нужно убедиться, что ряд стационарен. Ты запускаешь расширенный тест Дики-Фуллера. Результат: p-value = 0.42. Что нужно сделать следующим?
Anonymous voting

Вопрос на $5k: «Как работает память в AI-агентах?» Если ответите «просто векторная база» — провал. Векторная база — это знани
Вопрос на $5k: «Как работает память в AI-агентах?» Если ответите «просто векторная база» — провал. Векторная база — это знания, а память — это контекст. Правильный ответ включает архитектуру управления состоянием (State Management). В LangGraph это реализовано через граф: — состояние (State) передаётся между узлами; — агент может «забывать» или «резюмировать» контекст; — циклы позволяют уточнять информацию. Разберитесь в деталях на нашем курсе. Записаться на курс Вводная лекция бесплатно

Продажи мороженого растут каждый год, есть сезонность: пик в июле, спад в январе, причём амплитуда сезонных колебаний увеличивается вместе с ростом общего уровня продаж. Какую модель выбрать?
Anonymous voting

Какое априорное распределение обычно берут для вероятности успеха при биномиальных данных, чтобы использовать сопряжённость и получить апостериорное распределение аналитически?
Anonymous voting

Вас точно спросят про AI-агентов на следующем собеседовании В 2026 году знание только градиентного бустинга — это база. Компа
Вас точно спросят про AI-агентов на следующем собеседовании В 2026 году знание только градиентного бустинга — это база. Компании ищут тех, кто умеет внедрять LLM в продакшн через агентские архитектуры и понимает разницу между LangGraph и обычным чейнингом. Подготовьтесь к техническим вопросам на курсе «Углубленные AI-агенты». Что вы добавите в резюме: — навык проектирования мультиагентных систем; — опыт работы с актуальными фреймворками CrewAI и AutoGen; — понимание методов масштабирования ИИ-решений; — готовый сквозной проект в портфолио. Курс уже идет, залетайте, пока есть места. 🚀 Записаться на основной курс Если сомневаетесь — просто посмотрите вводное занятие.

Вы строите логистическую регрессию для предсказания оттока клиентов. В вашем наборе данных есть признаки, которые сильно коррелируют между собой. Вы решаете проверить их с помощью VIF. Для одного из признаков вы получили VIF = 12. Что это означает?
Anonymous voting

Ты участвуешь в Kaggle соревновании. Тебе дали train набор и test. Ты подозреваешь, что данные в тесте «пришли из другого мира» (например, из другого временного периода). Чтобы проверить, ты используешь Adversarial Validation. В чем суть метода?
Anonymous voting

Вопрос на собеседовании: «В чём разница между классическим RAG и Agentic RAG?» Если не знаете ответ — пора на курс. Сегодня в
Вопрос на собеседовании: «В чём разница между классическим RAG и Agentic RAG?» Если не знаете ответ — пора на курс. Сегодня в 19:00 МСК мы начинаем разбирать архитектуру автономных систем с нуля до продакшена. Подготовим вас к сложным вопросам по AI: — механизмы планирования в агентах; — работа с памятью и контекстом; — мультиагентная оркестрация; — методы оценки faithfulness и relevancy ответов. Подготовиться к офферу

Вы строите модель детекции мошеннических транзакций. Класс «мошенничество» встречается редко по сравнению с «легитимными» операциями. Вы решили применить SMOTE. В чем заключается недостаток SMOTE, который приводит к огромному количеству False Positives?
Anonymous voting