Библиотека собеса по Data Science | вопросы с собеседований

رفتن به کانال در Telegram

Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

نمایش بیشتر

شبکه:Книги для программистов روسيا125 189 حرفه6 930

4 484

مشترکین

+124 ساعت

+47 روز

+4030 روز

541

نمایش های پست

~ 26424 ساعت

~ 32948 ساعت

12.07%

نرخ مشارکت

~ 1

پست های در روز

Ads index

beta

آرشیو پست ها

4 485

🗓 14 мая в 19:00 (Мск) встречаемся в онлайне. Тема: Почему AI-продукты на базе LLM ломаются и как сделать, чтобы работало. В кружке выше Эмиль Сатаев рассказал, какие именно проблемы с LLM в проде будем разбирать. Что в программе:

- Разберем реальные кейсы стартапов и ограничения LLM. - Обсудим рабочие архитектуры: RAG, human-in-the-loop, контроль качества. - Ответим на ваши вопросы и разберем кейсы участников.

🎁 Бонусы: в конце вебинара подарим промокод на скидку 10.000 ₽ на курсы и разыграем подписки на полезные AI-сервисы. 👉 Зарегистрироваться на вебинар

4 485

پیام ویدیو00:40

4 485

Представь, что ты строишь линейную регрессию. У тебя есть два признака: «Общая площадь квартиры» и «Количество квадратных метров жилой площади». Они коррелируют на 0.98.К какому опасному математическому эффекту это приведет при интерпретации весов модели?

Anonymous voting

4 485

Когда мы подаем картинку в LLM (например, в GPT-4o или Gemini 1.5), модель не видит её как единый файл. Каким образом изображение «разрезается» для обработки трансформером?

Anonymous voting

4 485

При обучении детекторов объектов мы не можем использовать простую MSE для рамок. Используется метрика IoU. Что именно измеряет IoU и почему это критично для оценки точности детектора?

Anonymous voting

4 485

🦾 Почему ваши AI-продукты на базе LLM ломаются (и как это чинить)? Выкатили ИИ-фичу в прод, а она галлюцинирует, падает или выдает мусор? Приглашаем на открытый вебинар, где разберем реальную боль внедрения LLM-агентов и научимся делать так, чтобы «всё работало». 🗓 Когда: 14 мая в 19:00 МСК ⏱️ Формат: 60 минут мяса + 30 минут ответов на ваши вопросы 🧑🏻‍💻 Кто вещает: Эмиль Сатаев — Backend Platform Developer (8+ лет в разработке). Человек, который своими руками внедряет LLM и агентные системы в реальные коммерческие сервисы. 🎁 Главный бонус для онлайна: Только участникам прямого эфира подарим уникальный промокод на скидку 10.000 ₽ на большой курс AgentOps. 👉 Занять место на вебинаре

4 485

YOLOv11 и последующие версии радикально отличаются от классических методов детекции (как R-CNN). Какое архитектурное решение делает YOLO такой быстрой, что она может работать на мобильных процессорах в реальном времени?

Anonymous voting

4 485

Какие именно точки в датасете становятся «опорными векторами» после обучения SVM?

Anonymous voting

4 485

В маркетинге часто используют PSM, чтобы оценить эффект акции, если мы не проводили честный A/B тест. Зачем нам нужно предсказывать вероятность получения скидки (Propensity Score) для каждого клиента, прежде чем сравнивать их покупки?

Anonymous voting

4 485

Современный DS-тренд 2025–2026 годов — поиск «плоских» минимумов (flat minima). Почему плоский минимум функции потерь считается более предпочтительным для финальной модели, чем глубокий и узкий («острый») минимум?

Anonymous voting

4 485

Какая особенность алгоритмов с инерцией (Momentum), таких как Adam или RMSProp, помогает им преодолевать седловые точки быстрее, чем обычному SGD?

Anonymous voting

4 485

В отличие от первых моделей (DDPM), Stable Diffusion работает не с самими пикселями напрямую, а в «латентном пространстве». Какое преимущество дает переход от работы с пикселями к работе с сжатыми латентными представлениями (через VAE)?

Anonymous voting

4 485

В LLM-агентах часто встречается атака типа Indirect Prompt Injection. Каким образом злоумышленник может захватить контроль над чат-ботом, не имея прямого доступа к окну чата пользователя?

Anonymous voting

4 485

В отличие от текста, где токен — это слово, современные модели для рядов (например, PatchTST) не подают каждое число по отдельности. Зачем временной ряд разбивается на «патчи» (группы соседних точек) перед подачей в трансформер?

Anonymous voting

4 485

Вы строите рекомендательную систему друзей. Ваша модель должна предсказать, появится ли ребро между узлами A и B. Какая метрика близости узлов в графе, основанная на «общих соседях», наиболее эффективно учитывает их популярность?

Anonymous voting

4 485

Этот алгоритм во многом вдохновлен Word2Vec, но применяется к узлам графа.Каким образом Node2Vec находит баланс между изучением локального окружения узла (микроструктура) и его роли в глобальном сообществе (макроструктура)?

Anonymous voting

4 485

Осталось всего 4 места на курс по ИИ-агентам. 30 апреля закрываем набор окончательно. В ГС честно рассказали: — Кому курс не подойдет; — Какой хардкор в программе (LangGraph, AutoGen, CrewAI); — Как мы даем токены, чтобы вы не тратили свои деньги. 🏃‍♀️ Записаться, пока есть места

4 485

Представь, что агент играет в шахматы, делает 40 ходов и в конце выигрывает. В чем заключается сложность "Credit Assignment" в этой ситуации?

Anonymous voting

4 485

🏃‍♀️ Как провести вечер вторника с пользой для карьеры? Включайте кружок там личное приглашение от спикера. 👆 Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах. 🤫 Секретный лут: промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир. 👉 Регистрируйтесь на трансляцию

4 485

پیام ویدیو00:16