Библиотека собеса по Data Science | вопросы с собеседований
رفتن به کانال در Telegram
Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot
نمایش بیشتر4 487
مشترکین
-124 ساعت
+27 روز
+3430 روز
آرشیو پست ها
Вы строите рекомендательную систему друзей. Ваша модель должна предсказать, появится ли ребро между узлами A и B.
Какая метрика близости узлов в графе, основанная на «общих соседях», наиболее эффективно учитывает их популярность?
Этот алгоритм во многом вдохновлен Word2Vec, но применяется к узлам графа.Каким образом Node2Vec находит баланс между изучением локального окружения узла (микроструктура) и его роли в глобальном сообществе (макроструктура)?
Осталось всего 4 места на курс по ИИ-агентам. 30 апреля закрываем набор окончательно.
В ГС честно рассказали:
— Кому курс не подойдет;
— Какой хардкор в программе (LangGraph, AutoGen, CrewAI);
— Как мы даем токены, чтобы вы не тратили свои деньги.
🏃♀️ Записаться, пока есть места
Представь, что агент играет в шахматы, делает 40 ходов и в конце выигрывает.
В чем заключается сложность "Credit Assignment" в этой ситуации?
🏃♀️ Как провести вечер вторника с пользой для карьеры?
Включайте кружок там личное приглашение от спикера. 👆
Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах.
🤫 Секретный лут:
промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир.
👉 Регистрируйтесь на трансляцию
🏃♀️ Как провести вечер вторника с пользой для карьеры?
Включайте кружок там личное приглашение от спикера. 👆
Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах.
🤫 Секретный лут:
промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир.
👉 Регистрируйтесь на трансляцию
Вычислять точное апостериорное распределение для нейросетей математически невозможно. Приходится выбирать метод аппроксимации.
В чем заключается основное преимущество Variational Inference перед методами MCMC (Markov Chain Monte Carlo)?
В 2026 году модели обязаны разделять два типа неопределенности. Представь беспилотный автомобиль, который едет в густом тумане.
Какая неопределенность здесь является Эпистемической (Epistemic)?
В Байесовском подходе мы ищем Апостериорное распределение по формуле Байеса.
За что именно отвечает «Априорное распределение» (Prior) в процессе обучения модели?
В крупных компаниях используют Feature Store (например, Feast или Hopsworks).
Какую главную проблему при переходе от обучения (Offline) к работе в реальном времени (Online) решает эта инфраструктура?
Git плохо справляется с хранением тяжелых датасетов в несколько терабайт. Инструменты вроде DVC решают эту проблему.
Каким образом DVC позволяет версионировать данные, сохраняя при этом легковесность Git-репозитория?
Модель предсказания спроса начала ошибаться. Распределение входных признаков сильно изменилось по сравнению с обучающей выборкой, хотя сама логика поведения людей осталась прежней. Как называется этот тип деградации модели и какое действие требуется?
При генерации текста (Inference) мы часто настраиваем параметр Temperature (T).
Как математически параметр T влияет на распределение вероятностей следующего токена и на итоговый результат?
BERT — это «энкодер», а GPT — «декодер». Это определяет способ их обучения.
В чем заключается ключевое различие в механизме внимания (Attention) при обучении GPT по сравнению с BERT?
PCA проецирует данные на новые оси (главные компоненты).
Каким критерием руководствуется PCA при выборе первой главной компоненты (PC1)?
Вы используете стандартный feature_importance_ из Random Forest (на основе Gini impurity).
В чем заключается главная опасность доверия этому методу при наличии высококоррелированных признаков?
LIME (Local Interpretable Model-agnostic Explanations)
LIME часто используется для объяснения «черных ящиков». Каким образом LIME строит объяснение для конкретного примера (строки данных)?
🤖 Ваш ИИ-агент съедает бюджет на токены и падает при сбоях API?
Пора переходить на новый уровень. Открыли продажи курса по AgentOps — управлению ИИ-агентами в рабочих процессах.
Рынок требует инженеров, которые умеют:
• Контролировать метрики и качество ответов;
• Эффективно работать с RAG-архитектурой;
• Строить системы, готовые к реальным нагрузкам.
Обучение займет 6-12 недель под руководством практиков с опытом в AI и Data Science в крупных IT-компаниях, таких как Яндекс, Сбер, МТС, Huawei, Raft и др.
🎁 Можно подождать, пока про AgentOps начнут говорить все. Или зайти сейчас — НА 30% ДЕШЕВЛЕ!
Работа с AI начинается с систем. Системы — с AgentOps.🔥 Забрать скидку и изучить программу.
Метод SHAP основан на теории игр и вычисляет вклад каждого признака в итоговое предсказание.Что именно представляет собой «значение Шепли» (Shapley value) для конкретного признака в отдельном предсказании?
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
