fa
Feedback
Библиотека собеса по Data Science | вопросы с собеседований

Библиотека собеса по Data Science | вопросы с собеседований

رفتن به کانال در Telegram

Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

نمایش بیشتر
4 487
مشترکین
-124 ساعت
+27 روز
+3430 روز
آرشیو پست ها
Представь, что ты просишь ИИ решить сложную математическую задачу. Обычная GPT-4o начинает отвечать мгновенно. Но модель с System 2 Thinking (медленным мышлением) берет паузу в 30 секунд. Что именно делает нейросеть в эти 30 секунд «молчания»?
Anonymous voting

Исследователи из Anthropic обнаружили внутри модели миллионы features. Оказалось, что один и тот же нейрон может активироваться и на изображение кошки, и на код на языке Python. Это называется полисемантичностью. Как ученые решили эту проблему?
Anonymous voting

При дообучении модели с помощью учителей-людей используется важный промежуточный этап: создание Reward Model. Вместо того чтобы человек проверял ответ основной нейросети, обучается отдельная нейросеть-судья. Как именно обучается эта модель?
Anonymous voting

В оригинальной архитектуре Transformer (2017 год) использовались синусоидальные позиционные эмбеддинги. Однако современные модели (Llama, Mistral, PaLM) перешли на более продвинутую технологию — RoPE. В чем заключается главное преимущество RoPE?
Anonymous voting

Когда мы дообучаем готовую нейросеть на новых данных, она часто начинает «забывать» то, чему училась раньше. Это катастрофическое забывание. Какая из перечисленных техник является наиболее эффективной для борьбы с этим эффектом в Continual Learning?
Anonymous voting

👍 На курсе по контролируемой разработке AI-агентов мы будем разбирать ровно то, о чём говорит Владислав в голосовом, но уже в формате системной практики. 📅 Старт курса — 20 апреля. Если хотите разобраться, как строить управляемые агентные системы: ➡️ Присоединяйтесь. P.S. С первого занятия будет практика: код и разбор реальных ошибок, а не только теория.

При разработке сложных AI-агентов часто используется техника ReAct. Она позволяет модели не просто выдавать ответ, а взаимодействовать с внешними инструментами. В чем заключается главная особенность цикла работы агента по методу ReAct?
Anonymous voting

В основе диффузионных моделей лежит процесс превращения случайного шума в четкое изображение. Этот процесс называется обратной диффузией. На каждом шаге нейросеть выполняет одну операцию. Что предсказывает нейросеть на каждом шаге обратной диффузии?
Anonymous voting

При обучении LLM инженеры часто сталкиваются с феноменом "Grokking". Это специфический режим обучения, который обычно наблюдается на алгоритмических задачах или модульной арифметике. В чем заключается главная особенность феномена Grokking?
Anonymous voting

В Трансформерах сложность Self-Attention растет квадратично относительно входной последовательности N. В новых моделях вроде Mamba используется State Space Models. Какое математическое свойство позволяет моделям Mamba достигать линейной сложности?
Anonymous voting

Представь, что ты показываешь нейросети видео, где человек плачет, но при этом звучит веселая музыка и текст на экране говорит: «Я так счастлив!». Как мультимодальная модель понимает, что это сарказм, а не просто ошибка?
Anonymous voting

Последний шанс: 3 курса по цене 1 и запуск AI-агентов в продакшн На собеседованиях дата-сайентистов всё больше вопросов про вывод LLM в продакшн. Как превратить «голую» модель в автономную мультиагентную систему с RAG, контролировать затраты на инференс и не нарушить 152-ФЗ? Обновлённая программа делает упор на жёсткий ML-инжиниринг и вывод в прод. Вы научитесь строить ReAct-циклы, работать с LangGraph и AutoGen, внедрять продвинутый RAG, протоколы MCP и AgentOps. Все ключевые навыки в одном месте: измеримость систем, time-travel дебаггинг, управление браузером, human-in-the-loop и развёртывание в закрытых контурах. Почему нельзя откладывать: — масштабная акция «3 курса по цене 1» сгорает уже сегодня; — промокод Agent на скидку 10 000 рублей действует последние часы; — сразу после оформления открываются материалы для подготовки — начать учиться можно прямо сейчас. Забронировать место на курсе и забрать бонусы до конца дня

Когда ты задаешь вопрос нейросети, где-то в дата-центре работают тысячи процессоров. Ученые подсчитали углеродный след от обучения и эксплуатации моделей. Как ты думаешь, что потребляет больше энергии в долгосрочной перспективе?
Anonymous voting

Представь, что ты разрабатываешь систему беспилотного вождения. Тебе нужно научить машину реагировать на очень редкое и опасное событие — например, когда на дорогу в тумане внезапно выбегает лось. Почему в этой ситуации синтетические данные лучше?
Anonymous voting

За год мы провели три потока курса по ИИ-агентам, а теперь запускаем масштабное обновление! В новом, четвёртом потоке мы учли все пожелания студентов, добавили большой блок про AgentOps и сместили фокус с базовых концепций на суровый инжиниринг. Ответить на вопрос про архитектуру трансформеров на собесе легко, а вот выкатить ИИ-агента в прод, чтобы он не сливал бюджет — задача со звёздочкой. В программе: — практика с первого занятия: Jupyter-ноутбуки с автопроверкой; — оркестрация в LangGraph: human-in-the-loop и механизм time-travel; — продвинутый RAG для продакшена и парсинг сложных документов; — контроль экономики агентов: маршрутизация и кеширование запросов; — развёртывание локальных опенсорс-моделей с соблюдением 152-ФЗ. В честь старта продаж действует спецпредложение: 3 курса по цене 1 (два дополнительных курса в подарок). Доступ к материалам для предварительной подготовки откроется сразу после оплаты. По промокоду Agent забирайте скидку 10 000 ₽ (89 000 ₽ вместо 99 000 ₽). Успейте занять место до 28 февраля! 👉 Присоединиться к четвёртому потоку и вывести пайплайны в прод

Представь, что банк обучил модель для выдачи кредитов. В данных за 30 лет мужчины чаще занимали руководящие посты и имели более высокие зарплаты. Модель это заметила и начала занижать кредитный рейтинг всем женщинам. Как называется этот эффект?
Anonymous voting

Чтобы нейросеть «влезла» в микрочип, её нужно сжать. Один из методов называется Квантование (Quantization). Обычно веса нейросети — это дробные числа высокой точности (float32). В чём суть квантования при подготовке модели для Edge-устройства?
Anonymous voting

В GNN используется механизм под названием Message Passing (передача сообщений). Представь, что ты хочешь предсказать, купит ли человек товар, зная только его друзей в соцсети. Как нейронная сеть собирает информацию для конкретного узла на каждом слое?
Anonymous voting

Любой сложный временной ряд (например, продажи мороженого) можно разложить на несколько составляющих. Как называется компонент, который отвечает за регулярные колебания данных в зависимости от времени года, дня недели или часа?
Anonymous voting