es
Feedback
Библиотека собеса по Data Science | вопросы с собеседований

Библиотека собеса по Data Science | вопросы с собеседований

Ir al canal en Telegram

Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

Mostrar más
4 488
Suscriptores
+524 horas
+47 días
+4030 días
Archivo de publicaciones
Завтра стартуем: курс по разработке ИИ-агентов 📊 Будьте готовы к вопросам по архитектуре автономных пайплайнов. Мы научим пр
Завтра стартуем: курс по разработке ИИ-агентов 📊 Будьте готовы к вопросам по архитектуре автономных пайплайнов. Мы научим проектировать агентные системы на CrewAI, управлять графами в LangGraph и подключать модели к реальным бизнес-инструментам. 👉 Успейте занять место до начала занятий

Как называется статистическое явление, при котором алгоритм A лучше в общей статистике, но хуже алгоритма B в каждом подмножестве данных (например, по устройствам)?
Anonymous voting

На интервью по DS спрашивают про Agentic Workflow, а ты всё ещё «жаришь» промпты? Настоящий Шеф проектирует Систему. В понеде
На интервью по DS спрашивают про Agentic Workflow, а ты всё ещё «жаришь» промпты? Настоящий Шеф проектирует Систему. В понедельник, 26 января, стартует интенсив по разработке ИИ-агентов. Получи знания, которые отличают Middle от Senior. 📊 В программе: — мультиагентные системы в CrewAI: управление пулом агентов; — сложная логика в LangGraph: проектирование стейт-менеджмента; — tool use интеграция: связь моделей с API и базами данных. 🧠 Записаться на курс

Вы используете инициализацию весов He и Batch Normalization после каждого сверточного слоя. Несмотря на это, в ResNet в начале обучения растёт дисперсия активаций с глубиной, что ухудшает сходимость. Какое решение лучше всего устраняет это?
Anonymous voting

Пятница, 19:00. Худшее время для деплоя, но идеальное, чтобы подготовиться к каверзным вопросам про LLM-пайплайны, которые точно зададут на интервью. Вопросы про RAG и Fine-tuning стали стандартом на интервью для ML-инженеров. Приходи разобраться в теме на практике. Разберём на открытом уроке: — выбор между Retrieval-Augmented Generation и дообучением весов; — работа с векторными эмбеддингами (`FAISS`, `Chroma`); — построение продакшн-пайплайна с использованием LangChain. Один из спикеров — Алексей Яндутов, ML-инженер в поиске Яндекса. Это вводное занятие курса «Разработка AI-агентов». Готовьтесь к коду и архитектурным схемам. Записаться на урок

Представь, что ты работаешь в банке. Твоя сложная модель отклонила заявку на кредит. Клиент требует объяснить — почему? Для этого ты используешь SHAP. В чем заключается идея вычисления Shapley values для каждого признака?
Anonymous voting

Вы тестируете систему комп. зрения для беспилотного авто Тесты показали, что можно изменить изображение знака «STOP» так, что человек не заметит разницы, но нейросеть с 99% классифицирует его как «Ограничение скорости». Как называется этот тип атаки?
Anonymous voting

RAG или Fine-tuning: что отвечать на собеседовании? Вопросы по архитектуре LLM-систем становятся стандартом. 23 января в 19:00 на открытом уроке к курсу «Разработка ИИ агентов» разберём матчасть: как работают Retrieval-Augmented Generation и дообучение моделей в реальных проектах. Ведущий — Игорь Стурейко, тимлид в «Газпроме» и AI-архитектор. В своём видеосообщении Игорь делится опытом построения сложных ML-решений и рассказывает о программе подготовки специалистов по агентам. Ключевые концепции: — разница между параметрической и внешней памятью модели; — использование FAISS и Chroma для хранения эмбеддингов; — пайплайны обработки документов с помощью LangChain. 📅 Когда: 23.01 в 19:00 МСК Узнать подробности

В отличие от GAN, где 2 сети соревнуются, диффузионные модели обучаются на процессе постепенного разрушения данных. В процессе обратной диффузии нейросеть получает на вход сильно зашумленное изображение. Какова задача на каждом микро-шаге этого процесса?
Anonymous voting

ViT разбивает изображение на патчи и вычисляет внимание между патчами. Если мы увеличим разрешение фото в 2 раза, количество вычислений вырастет в 16 раз. Для решения проблемы был создан Swin Transformer. Какое нововведение позволяет ему работать быстро?
Anonymous voting

Вы строите корпоративного ассистента, который должен отвечать на вопросы сотрудников по внутренним документам (которые модель никогда не видела при обучении). Вместо Fine-tuning, вы внедряете архитектуру RAG. Как именно работает этот механизм?
Anonymous voting

Вы хотите дообучить модель Llama 3 на своих личных переписках, чтобы она имитировала ваш стиль общения. Вместо того чтобы менять все веса огромных матриц модели, вы решаете использовать LoRA. В чем заключается этот метод?
Anonymous voting

«Этот манёвр будет стоить нам 51 год...» — или потерю шанса на Senior-позицию из-за «поплывшей» математики на тех-интервью. В
«Этот манёвр будет стоить нам 51 год...» — или потерю шанса на Senior-позицию из-за «поплывшей» математики на тех-интервью. В Data Science теоремы и алгоритмы — это фундамент, без которого не построить ни одну серьёзную модель. 19 января в Proglib Academy вырастут цены. Успейте забрать курсы по Math, ML и AI по старой стоимости: — Разработка ИИ-агентов — Математика для разработки AI-моделей — ML для старта в Data Science — Математика для Data Science — Специалист по ИИ — Алгоритмы и структуры данных — Программирование на Python — Основы IT для непрограммистов — Архитектуры и шаблоны проектирования Подготовиться к собеседованиям ⚠️ Стоимость изменится 19 января

Вы разворачиваете модель уровня Llama 3 или GPT-4 для высоконагруженного чат-бота. При генерации длинных ответов VRAM заканчивается очень быстро, а скорость генерации падает. Для решения этой проблемы используется KV Caching. Что именно она делает?
Anonymous voting

Представьте, что у вас есть 10 миллионов фотографий из интернета, но нет ни одной метки. Вы используете SimCLR, чтобы научить модель извлекать полезные признаки. Какая функция потерь в одновременно сближает похожие представления и отталкивает разные?
Anonymous voting

Вы обучаете ViT на маленьком наборе данных (например, 10 000 картинок) и замечаете, что он безнадежно проигрывает старой доброй ResNet той же сложности. Однако на огромном датасете ViT внезапно обходит CNN. В чем основная причина такой динамики?
Anonymous voting

В оптимизаторе AdamW была введена модификация классического Adam. Какую конкретную проблему она решает при использовании L2-регуляризации?
Anonymous voting

При использовании Layer Normalization (LN) в архитектуре Transformer, в чем заключается основное преимущество стратегии 'Pre-LN' (нормализация перед блоком Attention/FFN) по сравнению с оригинальной 'Post-LN'?
Anonymous voting