Библиотека собеса по Data Science | вопросы с собеседований
الذهاب إلى القناة على Telegram
Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot
إظهار المزيد4 488
المشتركون
+524 ساعات
+47 أيام
+4030 أيام
أرشيف المشاركات
«Расскажите про ваш опыт с Agentic RAG» — стандартный вопрос собеседования
Рынок DS в 2026 году требует большего, чем знание
torch и pandas. Компании ищут инженеров, умеющих строить автономные системы, способные решать задачи без участия человека.
На курсе мы даём то, что требуют на позициях Senior AI Engineer. Мы разбираем реальные задачи: как оценивать качество генерации (LLM-as-a-Judge), как строить мультиагентные системы и выводить это в прод.
Темы для вашего резюме:
— Orchestration: LangGraph, LangChain.
— Retrieval: Hybrid Search, Reranking, GraphRAG.
— Fine-tuning: адаптация моделей под специфику агента.
— Evaluation: метрики качества для генеративных моделей.
Подготовиться к собеседованиям нового уровняТы обучаешь лин.регрессию на данных с огромным количеством признаков, многие из них бесполезны. Нужно, чтобы модель не просто уменьшила веса плохих признаков, а полностью занулила их, выполнив автоматический отбор.
Какой тип регуляризации нужно выбрать?
Ты обучаешь лин.регрессию на данных с огромным количеством признаков, многие из них бесполезны. Нужно, чтобы модель не просто уменьшила веса плохих признаков, а полностью занулила их, выполнив автоматический отбор.
Какой тип регуляризации нужно выбрать?
Хард-скилл, который будут спрашивать в 2026 году
Умение обучить модель — база. Умение завернуть её в автономного агента, работающего с инструментами — конкурентное преимущество. Курс «Разработка ИИ-агентов» уже стартовал.
Что прокачаем:
— построение RAG-систем с векторными БД;
— оркестрацию через
LangGraph;
— понимание агентной архитектуры и ReAct.
Первая лекция доступна бесплатно. Отличный шанс подтянуть теорию для собеседований.
Записаться
Смотреть лекциюТы строишь модель, предсказывающую, вернет ли клиент банковский кредит. В твоем наборе данных есть признак «Сумма выплаченных процентов». На обучении модель показывает идеальный результат. Почему этот признак является классическим примером Target Leakage?
Вы обучили модель градиентного бустинга предсказывать вероятность поломки. Она показывает отличный ROC-AUC, но бизнес жалуется: модель выдает 0.8, а в реальности поломка происходит в 40%.
Какой инструмент позволяет визуально оценить это несоответствие?
Проблема A/B-тестов — дисперсия. Пользователи разные: кто-то всегда тратит много, кто-то мало.
CUPED использует данные о пользователях, собранные до начала теста. Каким образом он уменьшает дисперсию?
Вы проводите тест в online-магазине. В тест группу случайно попал оптовый закупщик, который купил товара на 1000000₽, в то время как обычный чек — 2000₽. Это завысило среднее в группе. Какой метод наиболее корректен для снижения влияния таких выбросов?
Ты планируешь A/B-тест. Чтобы убедиться, что твой калькулятор p-value и система сплитования корректны, ты запускаешь A/A-тест: делишь трафик на 2 группы, но обеим показываешь одинаковый вариант сайта. Что является признаком проблемы при анализе A/A-теста?
Вопрос с собеседования 2026: RAG vs Agentic RAG
На сеньорских позициях теперь спрашивают не просто про векторные базы, а про архитектуру агентов.
В чём отличие?
Обычный RAG: Нашёл документы → Сгенерировал ответ.
Agentic RAG (на
LangGraph): Оценил вопрос → Спланировал поиск → Проверил найденное → (если плохо) Переформулировал запрос и искал снова.
Умение строить такие системы с циклами и состоянием — главный навык года. Мы учим этому на курсе.
Записаться на курс
Подготовка к вопросам по архитектуре: Смотрите вводный урок бесплатно.Представь, что у тебя есть выборка из 1000 заказов, и тебе нужно найти 95% доверительный интервал для медианы чека. Математической формулы для интервала медианы «из коробки» (как для среднего) нет.
Как работает классический Non-parametric Bootstrap?
Ты работаешь с временным рядом ежедневных транзакций банка. Визуально есть тренд. Чтобы применить модель ARIMA, нужно убедиться, что ряд стационарен. Ты запускаешь расширенный тест Дики-Фуллера. Результат: p-value = 0.42. Что нужно сделать следующим?
Вопрос на $5k: «Как работает память в AI-агентах?»
Если ответите «просто векторная база» — провал. Векторная база — это знания, а память — это контекст. Правильный ответ включает архитектуру управления состоянием (State Management).
В LangGraph это реализовано через граф:
— состояние (
State) передаётся между узлами;
— агент может «забывать» или «резюмировать» контекст;
— циклы позволяют уточнять информацию.
Разберитесь в деталях на нашем курсе.
Записаться на курс
Вводная лекция бесплатноПродажи мороженого растут каждый год, есть сезонность: пик в июле, спад в январе, причём амплитуда сезонных колебаний увеличивается вместе с ростом общего уровня продаж.
Какую модель выбрать?
Какое априорное распределение обычно берут для вероятности успеха при биномиальных данных, чтобы использовать сопряжённость и получить апостериорное распределение аналитически?
Вас точно спросят про AI-агентов на следующем собеседовании
В 2026 году знание только градиентного бустинга — это база. Компании ищут тех, кто умеет внедрять LLM в продакшн через агентские архитектуры и понимает разницу между
LangGraph и обычным чейнингом.
Подготовьтесь к техническим вопросам на курсе «Углубленные AI-агенты».
Что вы добавите в резюме:
— навык проектирования мультиагентных систем;
— опыт работы с актуальными фреймворками CrewAI и AutoGen;
— понимание методов масштабирования ИИ-решений;
— готовый сквозной проект в портфолио.
Курс уже идет, залетайте, пока есть места.
🚀 Записаться на основной курс
Если сомневаетесь — просто посмотрите вводное занятие.Вы строите логистическую регрессию для предсказания оттока клиентов. В вашем наборе данных есть признаки, которые сильно коррелируют между собой. Вы решаете проверить их с помощью VIF.
Для одного из признаков вы получили VIF = 12. Что это означает?
Ты участвуешь в Kaggle соревновании. Тебе дали train набор и test. Ты подозреваешь, что данные в тесте «пришли из другого мира» (например, из другого временного периода).
Чтобы проверить, ты используешь Adversarial Validation. В чем суть метода?
Вопрос на собеседовании: «В чём разница между классическим RAG и Agentic RAG?»
Если не знаете ответ — пора на курс. Сегодня в 19:00 МСК мы начинаем разбирать архитектуру автономных систем с нуля до продакшена.
Подготовим вас к сложным вопросам по AI:
— механизмы планирования в агентах;
— работа с памятью и контекстом;
— мультиагентная оркестрация;
— методы оценки
faithfulness и relevancy ответов.
Подготовиться к офферуВы строите модель детекции мошеннических транзакций. Класс «мошенничество» встречается редко по сравнению с «легитимными» операциями. Вы решили применить SMOTE.
В чем заключается недостаток SMOTE, который приводит к огромному количеству False Positives?
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
