fa
Feedback
Библиотека собеса по Data Science | вопросы с собеседований

Библиотека собеса по Data Science | вопросы с собеседований

رفتن به کانال در Telegram

Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

نمایش بیشتر
4 487
مشترکین
-124 ساعت
+27 روز
+3430 روز
آرشیو پست ها
Вы строите рекомендательную систему друзей. Ваша модель должна предсказать, появится ли ребро между узлами A и B. Какая метрика близости узлов в графе, основанная на «общих соседях», наиболее эффективно учитывает их популярность?
Anonymous voting

Этот алгоритм во многом вдохновлен Word2Vec, но применяется к узлам графа.Каким образом Node2Vec находит баланс между изучением локального окружения узла (микроструктура) и его роли в глобальном сообществе (макроструктура)?
Anonymous voting

Осталось всего 4 места на курс по ИИ-агентам. 30 апреля закрываем набор окончательно. В ГС честно рассказали: — Кому курс не подойдет; — Какой хардкор в программе (LangGraph, AutoGen, CrewAI); — Как мы даем токены, чтобы вы не тратили свои деньги. 🏃‍♀️ Записаться, пока есть места

Представь, что агент играет в шахматы, делает 40 ходов и в конце выигрывает. В чем заключается сложность "Credit Assignment" в этой ситуации?
Anonymous voting

🏃‍♀️ Как провести вечер вторника с пользой для карьеры? Включайте кружок там личное приглашение от спикера. 👆 Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах. 🤫 Секретный лут: промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир. 👉 Регистрируйтесь на трансляцию

🏃‍♀️ Как провести вечер вторника с пользой для карьеры? Включайте кружок там личное приглашение от спикера. 👆 Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах. 🤫 Секретный лут: промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир. 👉 Регистрируйтесь на трансляцию

Вычислять точное апостериорное распределение для нейросетей математически невозможно. Приходится выбирать метод аппроксимации. В чем заключается основное преимущество Variational Inference перед методами MCMC (Markov Chain Monte Carlo)?
Anonymous voting

В 2026 году модели обязаны разделять два типа неопределенности. Представь беспилотный автомобиль, который едет в густом тумане. Какая неопределенность здесь является Эпистемической (Epistemic)?
Anonymous voting

В Байесовском подходе мы ищем Апостериорное распределение по формуле Байеса. За что именно отвечает «Априорное распределение» (Prior) в процессе обучения модели?
Anonymous voting

В крупных компаниях используют Feature Store (например, Feast или Hopsworks). Какую главную проблему при переходе от обучения (Offline) к работе в реальном времени (Online) решает эта инфраструктура?
Anonymous voting

Git плохо справляется с хранением тяжелых датасетов в несколько терабайт. Инструменты вроде DVC решают эту проблему. Каким образом DVC позволяет версионировать данные, сохраняя при этом легковесность Git-репозитория?
Anonymous voting

Модель предсказания спроса начала ошибаться. Распределение входных признаков сильно изменилось по сравнению с обучающей выборкой, хотя сама логика поведения людей осталась прежней. Как называется этот тип деградации модели и какое действие требуется?
Anonymous voting

При генерации текста (Inference) мы часто настраиваем параметр Temperature (T). Как математически параметр T влияет на распределение вероятностей следующего токена и на итоговый результат?
Anonymous voting

BERT — это «энкодер», а GPT — «декодер». Это определяет способ их обучения. В чем заключается ключевое различие в механизме внимания (Attention) при обучении GPT по сравнению с BERT?
Anonymous voting

PCA проецирует данные на новые оси (главные компоненты). Каким критерием руководствуется PCA при выборе первой главной компоненты (PC1)?
Anonymous voting

Вы используете стандартный feature_importance_ из Random Forest (на основе Gini impurity). В чем заключается главная опасность доверия этому методу при наличии высококоррелированных признаков?
Anonymous voting

LIME (Local Interpretable Model-agnostic Explanations) LIME часто используется для объяснения «черных ящиков». Каким образом LIME строит объяснение для конкретного примера (строки данных)?
Anonymous voting

🤖 Ваш ИИ-агент съедает бюджет на токены и падает при сбоях API? Пора переходить на новый уровень. Открыли продажи курса по AgentOps — управлению ИИ-агентами в рабочих процессах. Рынок требует инженеров, которые умеют: • Контролировать метрики и качество ответов; • Эффективно работать с RAG-архитектурой; • Строить системы, готовые к реальным нагрузкам. Обучение займет 6-12 недель под руководством практиков с опытом в AI и Data Science в крупных IT-компаниях, таких как Яндекс, Сбер, МТС, Huawei, Raft и др. 🎁 Можно подождать, пока про AgentOps начнут говорить все. Или зайти сейчас — НА 30% ДЕШЕВЛЕ!
Работа с AI начинается с систем. Системы — с AgentOps.
🔥 Забрать скидку и изучить программу.

Метод SHAP основан на теории игр и вычисляет вклад каждого признака в итоговое предсказание.Что именно представляет собой «значение Шепли» (Shapley value) для конкретного признака в отдельном предсказании?
Anonymous voting