Библиотека собеса по Data Science | вопросы с собеседований

前往频道在 Telegram

Вопросы с собеседований по Data Science и ответы на них. Учиться у нас: clc.to/GjjbkQ По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

显示更多

网络:Книги для программистов 俄罗斯122 016 职业6 857

4 477

订阅者

-124 小时

-57 天

-2030 天

404

帖子浏览量

~ 20324 小时

~ 23948 小时

9.03%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

4 477

Как BatchNorm вычисляет среднее и дисперсию во время инференса (тестирования), когда на вход модели может прийти всего один объект, а не целый батч?

Anonymous voting

4 477

Какая математическая особенность сигмоиды заставляет градиенты на начальных слоях сети стремиться к нулю во время Backpropagation?

Anonymous voting

4 477

При валидации или инференсе модели в PyTorch код обязательно оборачивают в контекстный менеджер with torch.no_grad():. Какую техническую задачу решает этот шаг и почему его важно использовать в продакшене?

Anonymous voting

4 477

Когда вы пишите код на PyTorch, процесс обучения обычно выглядит так: loss.backward(). Что именно происходит внутри вычислительного графа (Computational Graph) PyTorch в момент вызова этой функции?

Anonymous voting

4 477

Как ведет себя модель с высокой дисперсией (High Variance) при переходе от обучающего набора данных к валидационному?

Anonymous voting

4 477

В машинном обучении часто цитируют теорему No Free Lunch.Какое главное математическое утверждение формулирует эта теорема применительно к алгоритмам оптимизации и обучения?

Anonymous voting

4 477

Каким свойством должна обладать функция агрегации (Aggregate) в GNN, чтобы модель работала корректно независимо от того, в каком порядке мы перечисляем соседей вершины?

Anonymous voting

4 477

⚡️ Продолжаем знакомить вас с экспертами курса AgentOps! — Сергей Нотевский расскажет, как выстроить FinOps для AI-продуктов: оптимизировать затраты на разработку и продакшен, внедрить model routing, semantic cache и систему алертов для контроля расходов — Эмиль Сатаев разберет Context Engineering: управление контекстом, защиту от prompt injection, работу с длинными контекстами и построение безопасного пайплайна входа для AI-систем — Михаил Бондаревский покажет, как подготовить инфраструктуру для AI-агентов: Docker, sandboxing, streaming, docker-compose и воспроизводимое окружение для разработки и продакшена — Мурат Хажгериев расскажет про Enterprise Integrations & MCP: когда MCP действительно нужен, как подключать внешние сервисы и реализовывать интеграции с OAuth2 delegation — Герман Сабиров разберет Governance & Compliance для AI-систем: data flow, audit logs, требования 152-ФЗ, локализацию данных и построение compliance-подхода на уровне архитектуры Курс для backend-разработчиков, тимлидов и LLM инженеров о том, как внедрять AI-логику в бэкенд IT-продуктов и сохранять стабильность сервиса. 👉 Изучить обновленную программу AgentOps и занять место.

4 477

Основная идея GNN заключается в том, что каждая вершина графа должна обновиться, «выслушав» информацию от своих соседей. Этот процесс называется Message Passing. Из каких трех последовательных шагов состоит одна итерация передачи сообщений в GNN?

Anonymous voting

4 477

При настройке векторного индекса нужно выбрать метрику расстояния. В каком случае вычисление Внутреннего произведения будет математически эквивалентно Косинусному расстоянию, но при этом выполнится гораздо быстрее на уровне процессора?

Anonymous voting

4 477

Одной из проблем трансформеров долгое время оставалось ограничение длины контекста. Какая математическая операция внутри механизма Attention вызывает квадратичную сложность O(N2) по памяти и вычислениям от длины текста N?

Anonymous voting

4 477

Почему для аналитического запроса SELECT AVG(salary) FROM employees колоночная база данных отработает в десятки раз быстрее, чем строковая?

Anonymous voting

4 477

Каким образом наличие B-Tree индекса по колонке user_id ускоряет выполнение запроса SELECT * FROM users WHERE user_id = 500?

Anonymous voting

4 477

До 31 мая можно забрать любой курс Proglib Academy со скидкой 40% Если давно хотели прокачаться в Python, ML, алгоритмах или AI-агентах, сейчас самое время выбрать программу и начать обучение по сниженной цене. 🎁 Разработка AI-агентов — от 49.000 ₽ (вместо 69.000 ₽) Практический курс по разработке AI-агентов для автоматизации задач, работы и собственных проектов 🎁 Курс AgentOps — 129.000 ₽ (вместо 149.000 ₽) Для разработчиков и LLM-инженеров, которые хотят внедрять AI-логику в бэкенд и сохранять стабильность сервиса. 🎁 Математика для разработки AI-моделей — 23.990 ₽ (вместо 31.990 ₽) Практическая база по математике для анализа данных, ML и дальнейшего развития в AI. 🎁 Математика для Data Science — от 29.990 ₽ (вместо 39.990 ₽) Курс для тех, кто хочет решать задачи, которые дают на собеседованиях на позицию дата-сайентиста в бигтехе. 🎁 ML для старта в Data Science — 28.990 ₽ (вместо 38.990 ₽) Разберётесь в машинном обучении: от базовых понятий и линейных моделей до ансамблей, бустинга и рекомендательных систем. 🎁 Основы IT для непрограммистов — 16.990 ₽ (вместо 28.990 ₽) Курс для IT-рекрутеров, маркетологов, проджектов, продактов и всех, кто работает с IT, но не пишет код. 🎁 Архитектуры и шаблоны проектирования — 27.990 ₽ (вместо 37.900 ₽) Освоите основные паттерны проектирования и прокачаете навыки архитектора программного обеспечения. 🎁 Специалист по ИИ — 89.000 ₽ (вместо 113.900 ₽) Курс для тех, кто хочет получить профессию в сфере ИИ, собрать портфолио из 5 проектов и научиться разрабатывать сложных AI-агентов. 🎁 Алгоритмы и структуры данных — 33.990 ₽ (вместо 57.990 ₽) Подготовитесь к алгоритмическим собеседованиям, разберёте структуры данных и научитесь писать более эффективный код. 🎁 Программирование на языке Python — 27.990 ₽ (вместо 47.390 ₽) Освоите Python на практике: без сухой теории, с пошаговой прокачкой навыков и итоговым проектом в портфолио. 🙌 Выбирайте курс по ссылке, оставляйте заявку, и менеджер поможет подобрать программу под ваши цели — https://clc.to/SALE40

4 477

Какими свойствами должен обладать временной ряд, чтобы математически считаться стационарным (в широком смысле)?

Anonymous voting

4 477

Repost from Proglib.academy | IT-курсы

✏️ Разбор задачи из высшей математики Условие: Дискретная случайная величина задана своим законом распределения 1️⃣. Нужно найти математическое ожидание, дисперсию, и среднее квадратическое отклонение величины x. Решение: Находим a, cлучайная величина может принять только 5 значений, поэтому их сумма равна единице 2️⃣. Приступаем к заполнению расчетной таблицы 3️⃣. C помощью формулы находим математическое ожидание 4️⃣. Дисперсия вычисляется по формуле 5️⃣. Остается найти среднее квадратическое отклонение 6️⃣ Ответ: M(X) = 20.6; D(X) = 31.64; σ(X) = 5.62 Хотите подготовиться к поступлению или подтянуть знания? Оставляйте заявку на наш курс по математике для Data Science 💙 🔹 Получить консультацию менеджера 🔹 Сайт Академии 🔹 Сайт Proglib 🏃‍♀️ Proglib Academy #буст

4 477

Repost from Proglib.academy | IT-курсы

👀 Краткая выжимка нашей имбовой рассылки по ИИ Ниже — небольшая подборка, а если хотите фулл, то подписывайтесь на рассылку 💬 Новости ▫️ Энтузиасты получили доступ к Anthropic Mythos Группа из Discord-канала, искавшая доступ к ещё не вышедшим моделям, угадала URL Mythos по шаблонам URL других моделей Anthropic и через аккаунт стороннего подрядчика получила доступ к инструменту ▫️ Anthropic тайно устанавливает шпионское ПО при установке Claude Desktop Claude Desktop без спроса прописывает в семь браузеров (Chrome, Brave, Edge, Chromium, Arc, Vivaldi и Opera) Native Messaging bridge, который дает расширению Claude доступ к авторизованным сессиям, DOM и формам за пределами песочницы. Удалить это нельзя — приложение восстанавливает файл с настройками при каждом запуске. ▫️ Три бага, которые сломали Claude Code Сначала снизили режим мышления с high до medium ради скорости, потом словили баг с кешированием, из-за которого модель теряла контекст каждый ход вместо одного раза, а под конец добавили системный промпт с жесткими лимитами на длину ответов — все это вместе выглядело как общая деградация модели, хотя API б 🤖 Инструменты для ИИ Google DESIGN.md — открытый стандарт описания дизайн-систем для UI-агентов designdotmd.directory — каталог DESIGN.md файлов beads — система памяти для агентов swarm-forge — оркестратор агентов, работающих в разных git worktree одного проекта browser-harness — дает агентам полный контроль над браузером agentmako — превращает код в локальную базу знаний и скармливает AI-агентам готовый контекст thonops — cобирает сайт на Next.js, обновляя страницу на лету при любой правке кода и заливая проект на Vercel в пару кликов vibechord — инструмент для запуска нескольких AI-агентов и управления ими из одного места monitorability-evals — открытый датасет от OpenAI для оценки того, насколько хорошо можно отслеживать и контролировать поведение языковых моделей в различных сценариях 🖥 Разбор пяти AI-проектов, набравших тысячи звезд на GitHub: Hermes Agent — самообучающийся ассистент с долгой памятью DeerFlow — мультиагентный фреймворк с изолированными песочницами Multica — аналог Jira для AI-команд Claude Code Game Studios — 48 агентов-коллег для инди-геймдева MarkItDown — конвертер любых документов в Markdown ⚡️ Скиллы ui-skills.com — 12 кураторских скилов для UI Nothing Design Skill — скил для Claude Code по созданию пользовательского интерфейса в дизайн-языке Nothing: монохромный, типографический, индустриальный codex-marketplace.com — каталог плагинов, скилов и хуков для Codex с установкой в одну команду и рейтингом от коммьюнити TBM Recommender — прикручивает к AI-агентам базу рассылки TBM про продукты и менеджмент, вытаскивая релевантные посты через хитрую трехуровневую выборку ради экономии токенов 🔹 Получить консультацию менеджера 🔹 Сайт Академии 🔹 Сайт Proglib 🏃‍♀️ Proglib Academy #буст

4 477

Как функция LogLoss наказывает модель, если реальный ответ равен y=1, а модель предсказала вероятность y=0.001?

Anonymous voting

4 477

Какую именно математическую трансформацию выполняет сигмоида над выходом линейной комбинации признаков?

Anonymous voting