Библиотека собеса по Data Science | вопросы с собеседований

رفتن به کانال در Telegram

Вопросы с собеседований по Data Science и ответы на них. Учиться у нас: clc.to/GjjbkQ По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

نمایش بیشتر

شبکه:Книги для программистов روسيا122 016 حرفه6 857

4 477

مشترکین

-124 ساعت

-57 روز

-2030 روز

404

نمایش های پست

~ 20324 ساعت

~ 23948 ساعت

9.03%

نرخ مشارکت

~ 1

پست های در روز

Ads index

beta

آرشیو پست ها

4 477

Байесовский подход разделяет неопределенность модели на два принципиально разных типа. Какая неопределенность называется Эпистемической (Epistemic Uncertainty) и как дата-сайентист может её снизить?

Anonymous voting

4 477

🤖 Какие задачи можно действительно доверить ИИ? Уже завтра разберём это на открытом уроке «AI-инструменты в разработке: как писать код быстрее с помощью ассистентов». Спикер — Ольга Лукьянова, руководитель команды поиска и навигации по коду в SourceCraft от Яндекса. После урока вы: 🔹 поймёте, какие задачи стоит делегировать AI уже сегодня; 🔹 научитесь быстрее разбираться в новых проектах и кодовой базе; 🔹 увидите, как выглядит современный workflow разработки с AI; 🔹 узнаете, где AI помогает экономить время, а где всё ещё нужен контроль разработчика. На практике разберём путь от получения задачи до готового Pull Request с использованием AI-инструментов и AI-ревью. 🗓️ 23 июня, 19:00 (МСК) ⏱️ 90 минут 👉 Зарегистрироваться и получить рабочий AI-workflow для своих задач

4 477

В стандартном слое nn.Linear в PyTorch каждый синаптический вес — это конкретное скалярное число (например, w=0.345).Как устроены веса в аналогичном слое Байесовской нейронной сети?

Anonymous voting

4 477

🤖 AI пишет код за вас? Это самое скучное, что он умеет Основное время разработчик тратит на другое: разобраться в чужой кодовой базе, найти нужный участок проекта, проверить решение, собрать Pull Request. Вот где AI реально экономит часы — если знать, как им пользоваться. 23 июня Ольга Лукьянова покажет это на практике: как с помощью современных AI-инструментов быстро погружаться в незнакомый проект, находить нужный код, реализовывать задачи и проверять результат до ревью коллег. В итоге вы увидите не отдельные приёмы и промпты, а целостный workflow, который можно встроить в свою работу уже на следующий день 🔥 Чтобы лучше погрузиться в тему: 📺 Выступление про SourceCraft 📖 Статья на Хабре 🗓️ Когда: 23 июня, 19:00 (МСК) 👉 Занять место на открытом уроке

4 477

Вы обучаете модель и хотите оценить влияние каждого признака на предсказание. Для этого используете permutation importance. Один из признаков получает почти нулевую важность. После его удаления качество модели заметно падает. Какое объяснение вероятно?

Anonymous voting

4 477

При обучении модели градиентного бустинга вы заметили, что при увеличении количества деревьев: ошибка на обучающей выборке продолжает уменьшаться, а на валидационной сначала уменьшается, а затем начинает расти. Какое из действий наиболее обоснованно?

Anonymous voting

4 477

⏰ Уже сегодня в 19:00 (МСК) стартует открытый урок! Тема:

«Мультиагентные системы: почему большинство архитектур переусложнены»

🔥 За 90 минут разберёмся, когда действительно стоит строить мультиагентную систему, а когда она только добавляет сложность, расходы и новые точки отказа. Поговорим о критериях выбора архитектуры, типичных ошибках и ограничениях современных ИИ-агентов, которые важно учитывать ещё до внедрения в продукт. 🎙️ Спикер — Дмитрий Юдин, руководитель AI/ML-направления в Сloud․ru. 🎁 Для всех участников подготовили промокод на скидку 10 000 ₽ на курс «Разработка ИИ-агентов». 👉 Успей присоединиться к уроку

4 477

Что произойдет с моделью поиска, если во время обучения в качестве негативных примеров использовать только абсолютно случайные и далекие по смыслу объекты (например, к тексту «Собака» негативом всегда будет «Трактор» или «Пицца»)?

Anonymous voting

4 477

🔥 Чем больше агентов — тем лучше? Не всегда. Уже завтра поговорим о реальных ограничениях на открытом уроке «Мультиагентные системы: почему большинство архитектур переусложнены». Спикер — Дмитрий Юдин, руководитель AI/ML-направления в Сloud․ru. После урока вы: 🔹 будете лучше ориентироваться в выборе между одним агентом и мультиагентной системой; 🔹 поймёте, какие архитектурные ошибки встречаются чаще всего; 🔹 получите практические ориентиры для проектирования и внедрения агентных систем; 🔹 будете лучше понимать возможности и ограничения современных ИИ-агентов. 🗓️ 18 июня, 19:00 (МСК) ⏱️ 90 минут 👉 Зарегистрироваться и получить промокод на 10 000 ₽

4 477

Какую задачу решает этап Калибровки (Calibration) при квантовании весов, чтобы модель не потеряла свой «интеллект»?

Anonymous voting

4 477

Операции в Spark делятся на: узкие и широкие. Какая из следующих операций является Широкой (Wide Transformation) и почему она считается самой «дорогой» и опасной для производительности кластера?

Anonymous voting

4 477

🤖 Большинство материалов по ИИ-агентам устаревают быстрее, чем многие курсы успевают обновить программу Инструменты, подходы и фреймворки меняются постоянно. Поэтому важно не просто собрать демо-агента, а понимать архитектуру, ограничения и практики, которые используются в продакшене. 🚀 30 июня стартует курс «Разработка ИИ-агентов». ⏳ До 20 июня действует сниженная цена. За 8 недель под руководством практиков из бигтеха вы соберёте собственного AI-агента, который работает с API, использует память, подключается к внешним сервисам и решает реальную задачу. Что разберём: 🔹 архитектуру AI-агентов и надёжный вывод; 🔹 LangGraph и оркестрацию workflow; 🔹 MCP и работу с внешними инструментами; 🔹 RAG-системы; 🔹 AgentOps, observability и evals; 🔹 безопасность и защиту от prompt injection; 🔹 мультиагентные системы и A2A. На курсе отдельно разбираем вопросы надёжности, безопасности и контроля агентных систем. 👉 Узнать программу и забронировать место со скидкой

4 477

Что на самом деле делает Spark в тот момент, когда ты запускаешь строчку кода с фильтрацией .filter(df.city == "Москва")?

Anonymous voting

4 477

В теории игр вектор Шепли распределяет выигрыш между игроками, которые объединились в коалицию для достижения общей цели.Как эта экономическая концепция переносится на машинное обучение при расчете SHAP Values?

Anonymous voting

4 477

💻 3 курса по цене одного — собери стек для оффера в топовую IT-компанию Для следующего карьерного шага мало писать код. Работодатели ждут не только знания языка, но и понимания архитектуры, алгоритмов, автоматизации, AI-инструментов и агентных систем. Одно направление закрывает только часть задачи. Поэтому сейчас мы предлагаем освоить сразу несколько востребованных навыков — выбери любой курс и получи доступ еще к двум бесплатно 🔥 Собери стек навыков под свою цель: 🔹 подготовка к сильным компаниям (алгоритмы, архитектура); 🔹 переход в AI-направление (ИИ-агенты, AgentOps); 🔹 развитие в ML и Data Science (математика, основы ML); 🔹 новый оффер и рост дохода. Полученные знания применяешь в работе уже во время обучения. ⏳ Акция действует 48 часов — 13 и 14 июня. 👉 Переходи на сайт, выбирай курсы и оставляй заявку — за 10 минут поможем собрать комплект под твою цель.

4 477

Какую физическую и математическую роль выполняет штраф D(KL) в процессе обучения VAE?

Anonymous voting

4 477

На основе какого математического показателя Adam уменьшает скорость обновления для тех весов, которые постоянно получают огромные градиенты?

Anonymous voting

4 477

Благодаря какому математическому свойству BatchNorm вносит легкий «шум» в процесс обучения, помогая модели обобщать данные?

Anonymous voting

4 477

📊 Хотите войти в Data Science, но математика кажется самым сложным этапом? На практике большинство джунов спотыкаются не о Python, а о математическую базу: ▪️ Теорию вероятностей и статистику ▪️ Линейную алгебру ▪️ Математический анализ ▪️ Комбинаторику Именно на этих темах строятся машинное обучение, аналитика данных и рекомендательные системы. Освойте ключевые разделы математики, которые используются в Data Science и Machine Learning на курсе «Математика для Data Science». Что вас ждет: 🔹 40+ видеолекций и 150+ практических заданий на Python 🔹 Проверка домашних работ и обратная связь от преподавателей 🔹 Подготовка к задачам с технических собеседований 🔹 Программа от преподавателей ВМК МГУ, НИУ ВШЭ и экспертов индустрии Курс подойдет разработчикам, аналитикам и всем, кто планирует развиваться в Data Science и Machine Learning. 👉 Записаться на бесплатный демо-урок