Библиотека собеса по Data Science | вопросы с собеседований

前往频道在 Telegram

Вопросы с собеседований по Data Science и ответы на них. Учиться у нас: clc.to/GjjbkQ По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

显示更多

网络:Книги для программистов 俄罗斯121 921 职业6 848

4 474

订阅者

+224 小时

-17 天

-1930 天

413

帖子浏览量

~ 21124 小时

~ 23948 小时

9.22%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

4 474

При обучении LLM инженеры часто сталкиваются с феноменом "Grokking". Это специфический режим обучения, который обычно наблюдается на алгоритмических задачах или модульной арифметике. В чем заключается главная особенность феномена Grokking?

Anonymous voting

4 474

В Трансформерах сложность Self-Attention растет квадратично относительно входной последовательности N. В новых моделях вроде Mamba используется State Space Models. Какое математическое свойство позволяет моделям Mamba достигать линейной сложности?

Anonymous voting

4 474

Представь, что ты показываешь нейросети видео, где человек плачет, но при этом звучит веселая музыка и текст на экране говорит: «Я так счастлив!». Как мультимодальная модель понимает, что это сарказм, а не просто ошибка?

Anonymous voting

4 474

Последний шанс: 3 курса по цене 1 и запуск AI-агентов в продакшн На собеседованиях дата-сайентистов всё больше вопросов про вывод LLM в продакшн. Как превратить «голую» модель в автономную мультиагентную систему с RAG, контролировать затраты на инференс и не нарушить 152-ФЗ? Обновлённая программа делает упор на жёсткий ML-инжиниринг и вывод в прод. Вы научитесь строить ReAct-циклы, работать с LangGraph и AutoGen, внедрять продвинутый RAG, протоколы MCP и AgentOps. Все ключевые навыки в одном месте: измеримость систем, time-travel дебаггинг, управление браузером, human-in-the-loop и развёртывание в закрытых контурах. Почему нельзя откладывать: — масштабная акция «3 курса по цене 1» сгорает уже сегодня; — промокод Agent на скидку 10 000 рублей действует последние часы; — сразу после оформления открываются материалы для подготовки — начать учиться можно прямо сейчас. Забронировать место на курсе и забрать бонусы до конца дня

4 474

Когда ты задаешь вопрос нейросети, где-то в дата-центре работают тысячи процессоров. Ученые подсчитали углеродный след от обучения и эксплуатации моделей. Как ты думаешь, что потребляет больше энергии в долгосрочной перспективе?

Anonymous voting

4 474

Представь, что ты разрабатываешь систему беспилотного вождения. Тебе нужно научить машину реагировать на очень редкое и опасное событие — например, когда на дорогу в тумане внезапно выбегает лось. Почему в этой ситуации синтетические данные лучше?

Anonymous voting

4 474

За год мы провели три потока курса по ИИ-агентам, а теперь запускаем масштабное обновление! В новом, четвёртом потоке мы учли все пожелания студентов, добавили большой блок про AgentOps и сместили фокус с базовых концепций на суровый инжиниринг. Ответить на вопрос про архитектуру трансформеров на собесе легко, а вот выкатить ИИ-агента в прод, чтобы он не сливал бюджет — задача со звёздочкой. В программе: — практика с первого занятия: Jupyter-ноутбуки с автопроверкой; — оркестрация в LangGraph: human-in-the-loop и механизм time-travel; — продвинутый RAG для продакшена и парсинг сложных документов; — контроль экономики агентов: маршрутизация и кеширование запросов; — развёртывание локальных опенсорс-моделей с соблюдением 152-ФЗ. В честь старта продаж действует спецпредложение: 3 курса по цене 1 (два дополнительных курса в подарок). Доступ к материалам для предварительной подготовки откроется сразу после оплаты. По промокоду Agent забирайте скидку 10 000 ₽ (89 000 ₽ вместо 99 000 ₽). Успейте занять место до 28 февраля! 👉 Присоединиться к четвёртому потоку и вывести пайплайны в прод

4 474

Представь, что банк обучил модель для выдачи кредитов. В данных за 30 лет мужчины чаще занимали руководящие посты и имели более высокие зарплаты. Модель это заметила и начала занижать кредитный рейтинг всем женщинам. Как называется этот эффект?

Anonymous voting

4 474

Чтобы нейросеть «влезла» в микрочип, её нужно сжать. Один из методов называется Квантование (Quantization). Обычно веса нейросети — это дробные числа высокой точности (float32). В чём суть квантования при подготовке модели для Edge-устройства?

Anonymous voting

4 474

В GNN используется механизм под названием Message Passing (передача сообщений). Представь, что ты хочешь предсказать, купит ли человек товар, зная только его друзей в соцсети. Как нейронная сеть собирает информацию для конкретного узла на каждом слое?

Anonymous voting

4 474

Любой сложный временной ряд (например, продажи мороженого) можно разложить на несколько составляющих. Как называется компонент, который отвечает за регулярные колебания данных в зависимости от времени года, дня недели или часа?

Anonymous voting

4 474

В RL есть Агент (тот, кто учится), Среда (мир вокруг) и Награда (цель). Главная проблема Агента — это дилемма Exploration vs Exploitation. В чем она заключается?

Anonymous voting

4 474

📊 Промышленный DS: как пройти интервью на позицию AI-разработчика в 2026 году Компании больше не ищут «исследователей», им нужны инженеры, способные запустить агентов в прод. В обновлённом курсе мы даём базу по измеримости, метрикам производительности и экономике моделей. 📚 Ключевые темы для подготовки: — продвинутый RAG: методы оценки качества поиска и подготовки данных; — инжиниринг: как выявлять регрессии и настраивать трассировку в реальных системах; — LangGraph: управление сложными графами и механизмы human-in-the-loop; — управление ресурсами: детальный расчёт токенов и кэширования. Забирайте материалы для предварительной подготовки сразу после оплаты и будьте на шаг впереди конкурентов. ⏳ Специальные условия до 28 февраля: — введите промокод Agent для получения скидки 10 000 рублей**; — участвуйте в **акции «3 курса по цене 1» — выберите два любых курса в дополнение к основному. 👉 Получить доступ к курсу и подаркам

4 474

Представь, что у нейросети есть маленькое «окошко» (фильтр), например, размером 3x3 пикселя. Оно ползает по всей картинке и умножает свои веса на значения пикселей. Зачем нужен этот процесс, вместо того чтобы подать все пиксели в обычную нейросеть?

Anonymous voting

4 474

Почему джуны-датасайентисты не могут вывести LLM в прод? На собеседованиях кандидаты отлично рассказывают про эмбеддинги и трансформеры. Но когда их просят спроектировать отказоустойчивую систему, контролировать бюджет на токены или настроить RAG по сканам — они сыпятся. Мы пересобрали курс по AI-агентам. Фокус смещён с теории на суровый инжиниринг: метрики, предотвращение регрессий и экономику агентов. Это знания, которые сейчас требуют от Middle+ DS. Что в программе для прокачки: 🔹 промышленный RAG: обработка таблиц, сканов и специализированный поиск; 🔹 архитектура агентов: LangGraph, перемотка времени (time-travel) и контрольные точки; 🔹 контроль затрат: ограничение времени исполнения ресурсов, динамический роутинг; 🔹 интеграции: работа агентов с legacy-интерфейсами и браузером; 🔹 комплаенс: развёртывание LLM-решений с соблюдением 152-ФЗ. Забирайте скидку 10 000 рублей по промокоду Agent (до 28 февраля). Используйте акцию «3 курса по цене 1», чтобы забрать ещё два курса бесплатно. Подготовиться к реальному продакшну

4 474

Ваша модель предсказания спроса на куртки стала работать хуже. Вы заметили, что распределение температур в этом году сильно изменилось по сравнению с прошлым. Как называется этот тип деградации?

Anonymous voting

4 474

Как математически изменяется размерность тензора на выходе одного блока Scaled Dot-Product Attention по сравнению с входным тензором (при условии, что d_{model} остается неизменной)?

Anonymous voting

4 474

Вопрос с собеседования: «Как вы обеспечите стабильность AI-агента в проде?» Если вы начнёте говорить про промпт-инжиниринг, вас не наймут. Правильный ответ включает: метрики, трейсинг, RAG-пайплайны и управление ресурсами. Этому мы учим на обновлённом курсе «Разработка AI-агентов». Разбираем на практике: 🔹 Архитектура. LangGraph, state-management, time-travel отладка. 🔹 RAG. Работа со сложными документами и таблицами. 🔹 Ops. Логирование, мониторинг затрат и качества. Стартуй сейчас! Материалы доступны сразу после покупки. 🎟 Промокод Agent — скидка 10 000 ₽ (до 28 февраля). 👉 Подготовиться к реальным задачам

4 474

Главный секрет трансформеров — механизм Self-Attention (внимания к себе). Представь предложение: «Банк закрыли, потому что он был ограблен». Как механизм внимания помогает модели понять, к чему относится слово «он»?

Anonymous voting

4 474

На что потратить 3 000 000 рублей? Именно столько всего заработают победители Data Fusion Contest 2026 — ежегодного соревнования по машинному обучению! Организаторы соревнования — ИТ-холдинг Т1 и ВТБ. ⚡ Формат — онлайн: участвовать можно из любой точки мира. В этом году участникам предстоит выполнить три задачи: ☑️ «Страж» — про вычисление подозрительных операций в банке; ☑️ «Киберполка» — про подбор нужных финансовых продуктов из 41 варианта. ☑️ «Герои» — про создание идеальных маршрутов с учетом времени. 📣 Даты проведения соревнования: с 9 февраля по 30 марта 2026 года. Финалисты смогут презентовать свои решения на конференции Data Fusion 2026 в Москве 8-9 апреля. Там же состоится торжественная церемония награждения победителей. Data Fusion Contest 2026: 🔵 прокачай себя и стань частью комьюнити DS в России; 🔵 попробуй силы в уникальных кейсах, которые выходят за рамки ежедневной рутины; 🔵 получи внушительное денежное вознаграждение. Ну что, хватит читать — пора действовать ➡ жми на ссылку! Информация о рекламодателе