ch
Feedback
Библиотека собеса по Data Science | вопросы с собеседований

Библиотека собеса по Data Science | вопросы с собеседований

前往频道在 Telegram

Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

显示更多
4 488
订阅者
+524 小时
+47
+4030
帖子存档
Почему вас валят на собесах по ML? Чаще всего не из-за незнания fit/predict , а из-за непонимания математики, которая стоит з
Почему вас валят на собесах по ML? Чаще всего не из-за незнания fit/predict , а из-за непонимания математики, которая стоит за этими методами. Мы перезапустили курс с живыми вебинарами, чтобы закрыть эти пробелы. Глубокое погружение в линейную алгебру. Ближайшие темы (Hard Skills):Матрицы: ранг, обратимость, линейные преобразования и решение СЛАУ. — Линейная регрессия: реализация МНК с нуля в NumPy vs scikit-learn , интерпретация коэффициентов. — SVD и Eigenvalues: смысл собственных векторов, снижение размерности и построение рек. систем. Вы научитесь не просто «тюнить параметры», а понимать физический смысл операций. Вход в поток до 9 декабря. https://clc.to/LojFzw

Какой из перечисленных ниже сценариев наиболее явно указывает на то, что ваша модель машинного обучения страдает от сильного переобучения (overfitting)?
Anonymous voting

Вы работаете с категориальным признаком City (Город), который содержит более 1000 уникальных значений. Какой из перечисленных методов кодирования чаще всего используется в Data Science для работы с высококардинальными категориальными признаками
Anonymous voting

В задаче бинарной классификации, что произойдет с метрикой Recall (Полнота) модели, если мы значительно понизим порог классификации (threshold)?
Anonymous voting

Площадь под ROC-кривой (AUC-ROC) для классификатора равна 0.50. Что это означает?
Anonymous voting

🔬 Вы когда-нибудь смотрели на код и думали: «Работает, но почему?» А теперь представьте, что вы: → понимаете, почему модель
🔬 Вы когда-нибудь смотрели на код и думали: «Работает, но почему?» А теперь представьте, что вы: → понимаете, почему модель учится слишком медленно или слишком быстро; → видите, какие данные реально влияют на предсказание, а какие — шум; → знаете, что происходит внутри нейронки. 4 декабря стартует курс «Математика для разработки AI-моделей». Линал, оптимизация, матан, статистика — всё, что происходит внутри модели между input и output. Практика на Python. Живые разборы с экспертами из SberAI, ВШЭ, Wildberries&Russ. 3 задания + финальный проект. Без теории ради теории — только то, что реально используется в моделях. 🎁 Бонус: курс по школьной математике + тест уровня математики 👉 Записаться

Почему Bayesian Neural Networks могут по-прежнему быть плохо откалиброваны?
Anonymous voting

Почему MAE более устойчива к шуму меток, чем MSE, но часто обучается медленнее?
Anonymous voting

Почему даже rolling-window CV может давать leakage?
Anonymous voting

Почему Adam может переобучаться быстрее, чем SGD, на шумных данных при одинаковой архитектуре?
Anonymous voting

🤖 Раньше в AI мог попасть любой, кто осилил пару туториалов. Теперь нужны те, кто может объяснить: → почему эта архитектура
🤖 Раньше в AI мог попасть любой, кто осилил пару туториалов. Теперь нужны те, кто может объяснить: → почему эта архитектура сработает, а та — нет; → что происходит внутри модели, когда она не сходится; → как найти решение, а не перебирать гиперпараметры наугад. Все эти навыки требуют понимания того, как и почему работают модели. А это чистая математика. 🔥 Proglib Academy запускает курс «Математика для разработки AI-моделей». Ведут эксперты из SberAI, ВШЭ, Т-Банк, Wildberries. 📝 Что внутри? → 2 месяца живых занятий с возможностью задавать вопросы напрямую. → Практика на Python. Не теория в вакууме, а применение. → 3 домашних задания + финальный проект с детальным разбором. ⏰ Старт 4 декабря ⌛ Только до конца ноября: → Скидка 40%; → Курс «Школьная математика» в подарок; → Тест на определение уровня математики. 🎄 Сделай себе подарок на Новый год

Модель была идеально откалибрована с помощью temperature scaling на исходном распределении. После дрейфа данных калибровка резко ухудшается, хотя ROC-AUC остаётся прежним. Почему это возможно?
Anonymous voting

Почему обычная k-fold кросс-валидация не подходит для временных рядов?
Anonymous voting

Почему adaptive оптимизаторы (Adam, RMSProp) иногда хуже SGD на тестовой выборке?
Anonymous voting

🎄 С Нового года начну учиться — знакомо? А потом январь — освоюсь после праздников, февраль — доделаю текущие дела... Не отк
🎄 С Нового года начну учиться — знакомо? А потом январь — освоюсь после праздников, февраль — доделаю текущие дела... Не откладывай на следующий год то, что можно начать уже в этом. 🗓️ 4 декабря стартует экспресс-курс «Математика для Data Science»— всё, что нужно для уверенных ответов на собесах: → 2 месяца без воды; → обновлённая программа (ноябрь 2025); → живые вебинары с экспертами; → записи всех занятий; → практика на Python + финальный проект с фидбэком. Формат: 2 месяца интенсива и к началу следующего года ты готов к собесам. Пока другие будут собираться с мыслями после НГ, ты уже будешь на полпути к офферу мечты. 🎁 Только до 30 ноября: → скидка 40% на курс; → курс «Базовая математика» в подарок; → бесплатный тест уровня математики. 👉🏻 Хочешь на курс → пиши менеджеру

Почему использование bidirectional LSTM может быть не всегда полез?
Anonymous voting

Митап RecSys в Питере — must-have для всех, кто создаёт интеллектуальные рекомендательные системы 🧑‍💻 1 декабря встречаемся в инновационном пространстве — Технохабе Сбера (ул. Уральская, д. 1, Литера Ч) — и на стыке науки и бизнеса обсуждаем, как уже сейчас AI меняет подход к персонализации. Вместе с Дмитрием Бугайченко — CDS B2C Сбера — и топовыми экспертами индустрии мы погрузимся в актуальные тренды и технологии RecSys, познакомимся с новыми рекомендациями Самоката и универсальными рекомендациями Okko, а также узнаем о построении рекомендателя в платёжных сервисах ЮMoney. Регистрируйтесь, пока места ещё есть — и готовьтесь к погружению в мир рекомендательных систем!

PCA возвращает ортогональные компоненты. Можно ли утверждать, что они всегда независимы?
Anonymous voting

Почему embeddings дают преимущество над one-hot представлениями при больших словарях?
Anonymous voting

Почему полностью удалять признаки с большим количеством пропусков не всегда лучший выбор?
Anonymous voting