Библиотека собеса по Data Science | вопросы с собеседований
رفتن به کانال در Telegram
Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot
نمایش بیشتر4 484
مشترکین
+124 ساعت
+47 روز
+4030 روز
آرشیو پست ها
🗓 14 мая в 19:00 (Мск) встречаемся в онлайне.
Тема: Почему AI-продукты на базе LLM ломаются и как сделать, чтобы работало.
В кружке выше Эмиль Сатаев рассказал, какие именно проблемы с LLM в проде будем разбирать.
Что в программе:
- Разберем реальные кейсы стартапов и ограничения LLM. - Обсудим рабочие архитектуры: RAG, human-in-the-loop, контроль качества. - Ответим на ваши вопросы и разберем кейсы участников.🎁 Бонусы: в конце вебинара подарим промокод на скидку 10.000 ₽ на курсы и разыграем подписки на полезные AI-сервисы. 👉 Зарегистрироваться на вебинар
Представь, что ты строишь линейную регрессию. У тебя есть два признака: «Общая площадь квартиры» и «Количество квадратных метров жилой площади». Они коррелируют на 0.98.К какому опасному математическому эффекту это приведет при интерпретации весов модели?
Когда мы подаем картинку в LLM (например, в GPT-4o или Gemini 1.5), модель не видит её как единый файл.
Каким образом изображение «разрезается» для обработки трансформером?
При обучении детекторов объектов мы не можем использовать простую MSE для рамок. Используется метрика IoU.
Что именно измеряет IoU и почему это критично для оценки точности детектора?
🦾 Почему ваши AI-продукты на базе LLM ломаются (и как это чинить)?
Выкатили ИИ-фичу в прод, а она галлюцинирует, падает или выдает мусор? Приглашаем на открытый вебинар, где разберем реальную боль внедрения LLM-агентов и научимся делать так, чтобы «всё работало».
🗓 Когда: 14 мая в 19:00 МСК
⏱️ Формат: 60 минут мяса + 30 минут ответов на ваши вопросы
🧑🏻💻 Кто вещает: Эмиль Сатаев — Backend Platform Developer (8+ лет в разработке). Человек, который своими руками внедряет LLM и агентные системы в реальные коммерческие сервисы.
🎁 Главный бонус для онлайна:
Только участникам прямого эфира подарим уникальный промокод на скидку 10.000 ₽ на большой курс AgentOps.
👉 Занять место на вебинаре
YOLOv11 и последующие версии радикально отличаются от классических методов детекции (как R-CNN).
Какое архитектурное решение делает YOLO такой быстрой, что она может работать на мобильных процессорах в реальном времени?
Какие именно точки в датасете становятся «опорными векторами» после обучения SVM?
В маркетинге часто используют PSM, чтобы оценить эффект акции, если мы не проводили честный A/B тест.
Зачем нам нужно предсказывать вероятность получения скидки (Propensity Score) для каждого клиента, прежде чем сравнивать их покупки?
Современный DS-тренд 2025–2026 годов — поиск «плоских» минимумов (flat minima).
Почему плоский минимум функции потерь считается более предпочтительным для финальной модели, чем глубокий и узкий («острый») минимум?
Какая особенность алгоритмов с инерцией (Momentum), таких как Adam или RMSProp, помогает им преодолевать седловые точки быстрее, чем обычному SGD?
В отличие от первых моделей (DDPM), Stable Diffusion работает не с самими пикселями напрямую, а в «латентном пространстве».
Какое преимущество дает переход от работы с пикселями к работе с сжатыми латентными представлениями (через VAE)?
В LLM-агентах часто встречается атака типа Indirect Prompt Injection.
Каким образом злоумышленник может захватить контроль над чат-ботом, не имея прямого доступа к окну чата пользователя?
В отличие от текста, где токен — это слово, современные модели для рядов (например, PatchTST) не подают каждое число по отдельности.
Зачем временной ряд разбивается на «патчи» (группы соседних точек) перед подачей в трансформер?
Вы строите рекомендательную систему друзей. Ваша модель должна предсказать, появится ли ребро между узлами A и B.
Какая метрика близости узлов в графе, основанная на «общих соседях», наиболее эффективно учитывает их популярность?
Этот алгоритм во многом вдохновлен Word2Vec, но применяется к узлам графа.Каким образом Node2Vec находит баланс между изучением локального окружения узла (микроструктура) и его роли в глобальном сообществе (макроструктура)?
Осталось всего 4 места на курс по ИИ-агентам. 30 апреля закрываем набор окончательно.
В ГС честно рассказали:
— Кому курс не подойдет;
— Какой хардкор в программе (LangGraph, AutoGen, CrewAI);
— Как мы даем токены, чтобы вы не тратили свои деньги.
🏃♀️ Записаться, пока есть места
Представь, что агент играет в шахматы, делает 40 ходов и в конце выигрывает.
В чем заключается сложность "Credit Assignment" в этой ситуации?
🏃♀️ Как провести вечер вторника с пользой для карьеры?
Включайте кружок там личное приглашение от спикера. 👆
Уже завтра в прямом эфире, разбираем архитектуру контекста в мультиагентных системах.
🤫 Секретный лут:
промик на 5.000₽. Он достанется только тем, кто придет на прямой эфир.
👉 Регистрируйтесь на трансляцию
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
