Библиотека собеса по Data Science | вопросы с собеседований

Kanalga Telegram’da o‘tish

Вопросы с собеседований по Data Science и ответы на них. Учиться у нас: clc.to/GjjbkQ По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

Ko'proq ko'rsatish

Tarmoq:Книги для программистов Rossiya123 732 Karyera6 876

4 488

Obunachilar

+124 soatlar

-27 kunlar

+2130 kunlar

536

Post ko'rishlar

~ 25424 soatlar

~ 31448 soatlar

11.95%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

4 488

В моделях отбора кандидатов часто используют структуру Two-Tower. Одна «башня» обрабатывает данные пользователя, другая — данные контента (фильма/товара). Какая математическая операция чаще всего выполняется в самом конце над векторами этих двух башен?

Anonymous voting

4 488

Алгоритм замечает, что тебе нравятся видео про котиков, и начинает показывать только их. Через неделю ты больше не видишь ничего другого. Какой метод используется в RecSys для борьбы с этой проблемой, чтобы «подмешивать» пользователю новый контент?

Anonymous voting

4 488

Метрика MAPE (Mean Absolute Percentage Error) очень популярна в бизнесе, потому что выражается в процентах. В каком случае использование MAPE даст крайне искаженный или математически неопределенный результат?

Anonymous voting

4 488

Алгоритмы вроде YOLO часто выдают несколько bounding boxes вокруг одного и того же объекта с разной степенью уверенности. Для очистки используется Non-Maximum Suppression. На основе какого показателя NMS решает, что две рамки относятся к одному объекту?

Anonymous voting

4 488

В оригинальной архитектуре ViT к последовательности патчей изображения добавляется специальный обучаемый вектор — [CLS] token.Какую именно роль он играет при классификации всей картинки, в отличие от векторов отдельных патчей?

Anonymous voting

4 488

Вы готовите временные ряды для предсказания курса акций. Вы решили нормализовать данные (Scaling), вычислив среднее и стандартное отклонение по всему имеющемуся датасету перед разбиением на Train и Test. К какой ошибке в оценке модели это приведет?

Anonymous voting

4 488

При создании Data Lake для обучения моделей почти всегда выбирают Apache Parquet.Какая структурная особенность Parquet делает его на порядки эффективнее для аналитических запросов (например, «посчитать среднюю длину всех постов»)?

Anonymous voting

4 488

Почему практически все современные SOTA-модели используют LR Warmup (постепенное увеличение шага обучения в начале)?

Anonymous voting

4 488

В большинстве современных библиотек (PyTorch, TensorFlow) параметры оптимизатора AdamW отделяют Weight Decay от вычисления градиента. В чем заключается техническая причина появления AdamW вместо обычного Adam с L2-регуляризацией?

Anonymous voting

4 488

🤖 Освойте продвинутые методы NLP и работайте с LLM на высоком уровне Хотите разбираться в архитектуре LLM, дообучать модели под свои задачи и применять самые передовые NLP-методы? Курс «NLP. Advanced» научит вас работать с трансформерными моделями, адаптировать GPT, BERT, LangChain и RAG под реальные бизнес-кейсы, а также развертывать AI-решения. Вы освоите передовые методики машинного обучения для NLP, получите опыт работы с cutting-edge технологиями и расширите карьерные перспективы. 🔥Подайте заявку на курс уже сегодня и получите специальное предложение в честь дня рождения ОТУС: +10% к скидкам на сайте по промокоду birthday до 04.04 +5% по промокоду go_qa5 🎁Соберите скидку до 25% ➡️ Оставьте заявку прямо сейчас и получите скидку на обучение: https://clc.to/fNeiMw Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

4 488

При обучении классификаторов (включая LLM) часто используют Label Smoothing (размытие меток). Какую фундаментальную проблему переобучения решает этот метод?

Anonymous voting

4 488

Вы подаете на вход модели изображение панды, но добавляете к нему микроскопический «шум», невидимый для человеческого глаза. Модель с уверенностью 99% говорит, что это «гиббон». Как называется этот феномен в глубоком обучении?

Anonymous voting

4 488

Модель CLIP от OpenAI стала фундаментом для Stable Diffusion и Midjourney. Как именно она училась понимать связь между картинкой и текстом?

Anonymous voting

4 488

Этот подход считается «золотым стандартом» для автономных агентов. В чем заключается основная петля цикла ReAct?

Anonymous voting

4 488

😱 Если ваш продукт не умеет отдавать данные в формате, понятном AI-агенту, то вас просто не существует Скрипт не будет кликать по красивым кнопкам в браузере, он уйдёт к конкуренту с нормальным API. Перестроить архитектуру под машинных клиентов — это уже не хайп, а необходимое условие сохранения конкурентоспособности. Как адаптировать продукт и не исчезнуть из выдачи: — интегрировать MCP и A2A-взаимодействие, чтобы агенты могли вас читать; — научиться контролировать стоимость (лимиты, кэш, роутинг между моделями); — настроить AgentOps: трейсинг, логирование и отлов регрессий. Всё это ждёт вас на обновлённом курсе «Разработка AI-агентов». Мы специально сделали фокус на утилитарном инжиниринге и production-ready решениях. Кстати, до 29 марта можно забрать курс с большой скидкой, и стоит поторопиться — мест на потоке всё меньше. Зафиксировать цену и начать деплоить агентов без слива бюджета 👈

4 488

Вы выбираете метрику расстояния для своей базы данных эмбеддингов. В каком случае Косинусное сходство (Cosine Similarity) предпочтительнее Евклидова расстояния (L2)?

Anonymous voting

4 488

У вас есть база знаний на 1 ГБ. Вы выбираете между использованием RAG (поиск кусочков) и Long Context (запихнуть всё в одну модель). В каком случае риск «галлюцинации из-за шума» выше?

Anonymous voting

4 488

Многие LLM страдают от «избыточной уверенности» (Overconfidence). Что это означает с точки зрения вероятностей токенов?

Anonymous voting

4 488

Вы обучаете нейронную сеть, где один признак варьируется от 0 до 1, а другой — от 1 000 000 до 10 000 000. Вы забыли сделать Scaling (масштабирование). Как это отразится на процессе обучения?

Anonymous voting

4 488

У вас есть признак «Город проживания» с 500 уникальными значениями. Вы решаете использовать One-Hot Encoding. К какой основной проблеме это приведет при обучении модели (особенно линейной)?

Anonymous voting