Библиотека собеса по Data Science | вопросы с собеседований - Статистика и аналитика Telegram-канала @ds_interview

4 487

🤖 Освойте продвинутые методы NLP и работайте с LLM на высоком уровне Хотите разбираться в архитектуре LLM, дообучать модели под свои задачи и применять самые передовые NLP-методы? Курс «NLP. Advanced» научит вас работать с трансформерными моделями, адаптировать GPT, BERT, LangChain и RAG под реальные бизнес-кейсы, а также развертывать AI-решения. Вы освоите передовые методики машинного обучения для NLP, получите опыт работы с cutting-edge технологиями и расширите карьерные перспективы. 🔥Подайте заявку на курс уже сегодня и получите специальное предложение в честь дня рождения ОТУС: +10% к скидкам на сайте по промокоду birthday до 04.04 +5% по промокоду go_qa5 🎁Соберите скидку до 25% ➡️ Оставьте заявку прямо сейчас и получите скидку на обучение: https://clc.to/fNeiMw Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576

4 487

При обучении классификаторов (включая LLM) часто используют Label Smoothing (размытие меток). Какую фундаментальную проблему переобучения решает этот метод?

Anonymous voting

4 487

Вы подаете на вход модели изображение панды, но добавляете к нему микроскопический «шум», невидимый для человеческого глаза. Модель с уверенностью 99% говорит, что это «гиббон». Как называется этот феномен в глубоком обучении?

Anonymous voting

4 487

Модель CLIP от OpenAI стала фундаментом для Stable Diffusion и Midjourney. Как именно она училась понимать связь между картинкой и текстом?

Anonymous voting

4 487

Этот подход считается «золотым стандартом» для автономных агентов. В чем заключается основная петля цикла ReAct?

Anonymous voting

4 487

😱 Если ваш продукт не умеет отдавать данные в формате, понятном AI-агенту, то вас просто не существует Скрипт не будет кликать по красивым кнопкам в браузере, он уйдёт к конкуренту с нормальным API. Перестроить архитектуру под машинных клиентов — это уже не хайп, а необходимое условие сохранения конкурентоспособности. Как адаптировать продукт и не исчезнуть из выдачи: — интегрировать MCP и A2A-взаимодействие, чтобы агенты могли вас читать; — научиться контролировать стоимость (лимиты, кэш, роутинг между моделями); — настроить AgentOps: трейсинг, логирование и отлов регрессий. Всё это ждёт вас на обновлённом курсе «Разработка AI-агентов». Мы специально сделали фокус на утилитарном инжиниринге и production-ready решениях. Кстати, до 29 марта можно забрать курс с большой скидкой, и стоит поторопиться — мест на потоке всё меньше. Зафиксировать цену и начать деплоить агентов без слива бюджета 👈

4 487

Вы выбираете метрику расстояния для своей базы данных эмбеддингов. В каком случае Косинусное сходство (Cosine Similarity) предпочтительнее Евклидова расстояния (L2)?

Anonymous voting

4 487

У вас есть база знаний на 1 ГБ. Вы выбираете между использованием RAG (поиск кусочков) и Long Context (запихнуть всё в одну модель). В каком случае риск «галлюцинации из-за шума» выше?

Anonymous voting

4 487

Многие LLM страдают от «избыточной уверенности» (Overconfidence). Что это означает с точки зрения вероятностей токенов?

Anonymous voting

4 487

Вы обучаете нейронную сеть, где один признак варьируется от 0 до 1, а другой — от 1 000 000 до 10 000 000. Вы забыли сделать Scaling (масштабирование). Как это отразится на процессе обучения?

Anonymous voting

4 487

У вас есть признак «Город проживания» с 500 уникальными значениями. Вы решаете использовать One-Hot Encoding. К какой основной проблеме это приведет при обучении модели (особенно линейной)?

Anonymous voting

4 487

Вы строите модель для обнаружения редких мошеннических транзакций (0.1% от всех данных). Ваша модель просто всегда говорит «Это не мошенничество». Какая метрика будет абсолютно бесполезной?

Anonymous voting

4 487

Начать рассказывать интервьюеру, как вы ловко дёргаете ручки API через базовый LangChain. Звучит как отличный план, да? Нет, это мгновенный отказ. В свежем отчёте по рынку GPU говорится, что 54% компаний стопают ИИ-внедрения тупо из-за конских затрат на инфраструктуру. На серверах более 70% стоимости — это видеокарты. Поэтому на собесах сейчас спрашивают не про красивые промпты, а про жёсткую экономику агентов. По сути, от вас ждут понимания, как лимитировать ресурсы на лету, роутить запросы и дебажить отказы через механизм time-travel в LangGraph. Если вы до сих пор собираете ботов в ноутбуках, гляньте обновлённый курс «Разработка ИИ-агентов» — фокус там смещён с игрушечных концепций на суровый энтерпрайз. Что требуют от мидлов и выше: — интеграция мультиагентных систем по стандарту MCP; — суровый AgentOps: метрики, трейсинг, защита от деградации пайплайнов; — локальный деплой Open Source под 152-ФЗ (без этого в финтех можно даже не стучаться). Прямо сейчас можно урвать курс с увесистой скидкой (49 000 ₽ 62 990 ₽ за базовый тариф и 99 000 ₽ 124 990 ₽ за продвинутый трек), но стоит поторопиться — на потоке осталось всего 5 мест. 👉 Подтянуть архитектуру до уровня прода

4 487

Почему мы так часто предполагаем, что ошибки в данных распределены нормально? Какое утверждение о ЦПТ верно?

Anonymous voting

4 487

В 2024-2026 годах Flash Attention стала обязательным компонентом любой быстрой модели. За счет чего она ускоряет обучение и работу трансформеров?

Anonymous voting

4 487

Когда модель не влезает в одну видеокарту, её «режут» на части. Если вы разделяете модель по слоям (например, первые 40 слоев на одной GPU, остальные 40 — на другой), как называется такой тип параллелизма?

Anonymous voting

4 487

Многие современные модели показывают аномально высокие результаты на бенчмарке MMLU (Massive Multitask Language Understanding). Часто это происходит не потому, что модель стала умнее, а из-за «загрязнения» данных. Что такое Data Contamination?

Anonymous voting

4 487

Кажется, мы окончательно перешли от игрушек к суровому AgentOps Приглашаем на наш обновлённый курс по разработке ИИ-агентов. Никакой воды про «будущее нейросетей», только инженерный подход. На курсе мы: — пошагово строим готовые системы на LangGraph, CrewAI и MCP; — настраиваем кэширование и роутинг, чтобы бот не сожрал токены; — разбираемся со стейтом, учимся дебажить через time-travel и прикручиваем human-in-the-loop; — выводим RAG в прод так, чтобы безопасники не завернули архитектуру из-за 152-ФЗ. В пекло скучные лекции про общую инфраструктуру — сразу фокусируемся на агентных фреймворках и написании кода. Занятия ведут бывалые лиды из Газпромбанка и Альфы, набившие шишки на реальных задачах.

Кстати, на днях мы пилили агента в прямом эфире, если пропустили — есть запись вебинара.

Сегодня последний день, когда можно забрать курс по старым ценам. Базовый тариф сейчас стоит 49 000 ₽ (вместо 62 990 ₽), продвинутый трек — 99 000 ₽ (вместо 124 990 ₽). Если не хочется отдавать всю сумму сразу, есть рассрочка. Торопитесь — на потоке осталось всего 5 мест! → Зафиксировать цену и перейти к сборке своих агентов

4 487

Вы хотите ускорить генерацию текста в 2–3 раза. Для этого вы запускаете одновременно огромную модель (Target) и крошечную быструю модель (Draft). В чем заключается суть этого метода?

Anonymous voting

4 487

Обычный векторный поиск хорошо ищет похожие по смыслу тексты, но часто ошибается, когда нужно найти точный термин или когда запрос очень короткий. Как называется подход, объединяющий классический поиск по ключевым словам и современный векторный поиск?

Anonymous voting