uz
Feedback
Библиотека собеса по Data Science | вопросы с собеседований

Библиотека собеса по Data Science | вопросы с собеседований

Kanalga Telegram’da o‘tish

Вопросы с собеседований по Data Science и ответы на них. По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot Наши каналы: https://t.me/proglibrary/9197

Ko'proq ko'rsatish
4 480
Obunachilar
+224 soatlar
+137 kunlar
+4630 kunlar
Postlar arxiv
Каким свойством должна обладать функция агрегации (Aggregate) в GNN, чтобы модель работала корректно независимо от того, в каком порядке мы перечисляем соседей вершины?
Anonymous voting

⚡️ Продолжаем знакомить вас с экспертами курса AgentOps! — Сергей Нотевский расскажет, как выстроить FinOps для AI-продуктов:
⚡️ Продолжаем знакомить вас с экспертами курса AgentOps!Сергей Нотевский расскажет, как выстроить FinOps для AI-продуктов: оптимизировать затраты на разработку и продакшен, внедрить model routing, semantic cache и систему алертов для контроля расходов — Эмиль Сатаев разберет Context Engineering: управление контекстом, защиту от prompt injection, работу с длинными контекстами и построение безопасного пайплайна входа для AI-систем — Михаил Бондаревский покажет, как подготовить инфраструктуру для AI-агентов: Docker, sandboxing, streaming, docker-compose и воспроизводимое окружение для разработки и продакшена — Мурат Хажгериев расскажет про Enterprise Integrations & MCP: когда MCP действительно нужен, как подключать внешние сервисы и реализовывать интеграции с OAuth2 delegation — Герман Сабиров разберет Governance & Compliance для AI-систем: data flow, audit logs, требования 152-ФЗ, локализацию данных и построение compliance-подхода на уровне архитектуры Курс для backend-разработчиков, тимлидов и LLM инженеров о том, как внедрять AI-логику в бэкенд IT-продуктов и сохранять стабильность сервиса. 👉 Изучить обновленную программу AgentOps и занять место.

Основная идея GNN заключается в том, что каждая вершина графа должна обновиться, «выслушав» информацию от своих соседей. Этот процесс называется Message Passing. Из каких трех последовательных шагов состоит одна итерация передачи сообщений в GNN?
Anonymous voting

При настройке векторного индекса нужно выбрать метрику расстояния. В каком случае вычисление Внутреннего произведения будет математически эквивалентно Косинусному расстоянию, но при этом выполнится гораздо быстрее на уровне процессора?
Anonymous voting

Одной из проблем трансформеров долгое время оставалось ограничение длины контекста. Какая математическая операция внутри механизма Attention вызывает квадратичную сложность O(N2) по памяти и вычислениям от длины текста N?
Anonymous voting

Почему для аналитического запроса SELECT AVG(salary) FROM employees колоночная база данных отработает в десятки раз быстрее, чем строковая?
Anonymous voting

Каким образом наличие B-Tree индекса по колонке user_id ускоряет выполнение запроса SELECT * FROM users WHERE user_id = 500?
Anonymous voting

До 31 мая можно забрать любой курс Proglib Academy со скидкой 40% Если давно хотели прокачаться в Python, ML, алгоритмах или
До 31 мая можно забрать любой курс Proglib Academy со скидкой 40% Если давно хотели прокачаться в Python, ML, алгоритмах или AI-агентах, сейчас самое время выбрать программу и начать обучение по сниженной цене. 🎁 Разработка AI-агентов от 49.000 ₽ (вместо 69.000 ₽) Практический курс по разработке AI-агентов для автоматизации задач, работы и собственных проектов 🎁 Курс AgentOps129.000 ₽ (вместо 149.000 ₽) Для разработчиков и LLM-инженеров, которые хотят внедрять AI-логику в бэкенд и сохранять стабильность сервиса. 🎁 Математика для разработки AI-моделей 23.990 ₽ (вместо 31.990 ₽) Практическая база по математике для анализа данных, ML и дальнейшего развития в AI. 🎁 Математика для Data Scienceот 29.990 ₽ (вместо 39.990 ₽) Курс для тех, кто хочет решать задачи, которые дают на собеседованиях на позицию дата-сайентиста в бигтехе. 🎁 ML для старта в Data Science28.990 ₽ (вместо 38.990 ₽) Разберётесь в машинном обучении: от базовых понятий и линейных моделей до ансамблей, бустинга и рекомендательных систем. 🎁 Основы IT для непрограммистов16.990 ₽ (вместо 28.990 ₽) Курс для IT-рекрутеров, маркетологов, проджектов, продактов и всех, кто работает с IT, но не пишет код. 🎁 Архитектуры и шаблоны проектирования27.990 ₽ (вместо 37.900 ₽) Освоите основные паттерны проектирования и прокачаете навыки архитектора программного обеспечения. 🎁 Специалист по ИИ89.000 ₽ (вместо 113.900 ₽) Курс для тех, кто хочет получить профессию в сфере ИИ, собрать портфолио из 5 проектов и научиться разрабатывать сложных AI-агентов. 🎁 Алгоритмы и структуры данных 33.990 ₽ (вместо 57.990 ₽) Подготовитесь к алгоритмическим собеседованиям, разберёте структуры данных и научитесь писать более эффективный код. 🎁 Программирование на языке Python27.990 ₽ (вместо 47.390 ₽) Освоите Python на практике: без сухой теории, с пошаговой прокачкой навыков и итоговым проектом в портфолио. 🙌 Выбирайте курс по ссылке, оставляйте заявку, и менеджер поможет подобрать программу под ваши цели — https://clc.to/SALE40

Какими свойствами должен обладать временной ряд, чтобы математически считаться стационарным (в широком смысле)?
Anonymous voting

✏️ Разбор задачи из высшей математики Условие: Дискретная случайная величина задана своим законом распределения 1️⃣. Нужно на
✏️ Разбор задачи из высшей математики Условие: Дискретная случайная величина задана своим законом распределения 1️⃣. Нужно найти математическое ожидание, дисперсию, и среднее квадратическое отклонение величины x. Решение: Находим a, cлучайная величина может принять только 5 значений, поэтому их сумма равна единице 2️⃣. Приступаем к заполнению расчетной таблицы 3️⃣. C помощью формулы находим математическое ожидание 4️⃣. Дисперсия вычисляется по формуле 5️⃣. Остается найти среднее квадратическое отклонение 6️⃣ Ответ: M(X) = 20.6; D(X) = 31.64; σ(X) = 5.62 Хотите подготовиться к поступлению или подтянуть знания? Оставляйте заявку на наш курс по математике для Data Science 💙 🔹 Получить консультацию менеджера 🔹 Сайт Академии 🔹 Сайт Proglib 🏃‍♀️ Proglib Academy #буст

👀 Краткая выжимка нашей имбовой рассылки по ИИ Ниже — небольшая подборка, а если хотите фулл, то подписывайтесь на рассылку
👀 Краткая выжимка нашей имбовой рассылки по ИИ Ниже — небольшая подборка, а если хотите фулл, то подписывайтесь на рассылку 💬 Новости ▫️ Энтузиасты получили доступ к Anthropic Mythos Группа из Discord-канала, искавшая доступ к ещё не вышедшим моделям, угадала URL Mythos по шаблонам URL других моделей Anthropic и через аккаунт стороннего подрядчика получила доступ к инструменту  ▫️ Anthropic тайно устанавливает шпионское ПО при установке Claude Desktop Claude Desktop без спроса прописывает в семь браузеров (Chrome, Brave, Edge, Chromium, Arc, Vivaldi и Opera) Native Messaging bridge, который дает расширению Claude доступ к авторизованным сессиям, DOM и формам за пределами песочницы. Удалить это нельзя — приложение восстанавливает файл с настройками при каждом запуске. ▫️ Три бага, которые сломали Claude Code Сначала снизили режим мышления с high до medium ради скорости, потом словили баг с кешированием, из-за которого модель теряла контекст каждый ход вместо одного раза, а под конец добавили системный промпт с жесткими лимитами на длину ответов — все это вместе выглядело как общая деградация модели, хотя API б 🤖 Инструменты для ИИ Google DESIGN.md — открытый стандарт описания дизайн-систем для UI-агентов designdotmd.directory — каталог DESIGN.md файлов beads — система памяти для агентов swarm-forge — оркестратор агентов, работающих в разных git worktree одного проекта browser-harness — дает агентам полный контроль над браузером agentmako — превращает код в локальную базу знаний и скармливает AI-агентам готовый контекст thonops — cобирает сайт на Next.js, обновляя страницу на лету при любой правке кода и заливая проект на Vercel в пару кликов vibechord — инструмент для запуска нескольких AI-агентов и управления ими из одного места monitorability-evals — открытый датасет от OpenAI для оценки того, насколько хорошо можно отслеживать и контролировать поведение языковых моделей в различных сценариях 🖥 Разбор пяти AI-проектов, набравших тысячи звезд на GitHub: Hermes Agent — самообучающийся ассистент с долгой памятью DeerFlow — мультиагентный фреймворк с изолированными песочницами Multica — аналог Jira для AI-команд Claude Code Game Studios — 48 агентов-коллег для инди-геймдева MarkItDown — конвертер любых документов в Markdown ⚡️ Скиллы ui-skills.com — 12 кураторских скилов для UI Nothing Design Skill — скил для Claude Code по созданию пользовательского интерфейса в дизайн-языке Nothing: монохромный, типографический, индустриальный codex-marketplace.com — каталог плагинов, скилов и хуков для Codex с установкой в одну команду и рейтингом от коммьюнити TBM Recommender — прикручивает к AI-агентам базу рассылки TBM про продукты и менеджмент, вытаскивая релевантные посты через хитрую трехуровневую выборку ради экономии токенов 🔹 Получить консультацию менеджера 🔹 Сайт Академии 🔹 Сайт Proglib 🏃‍♀️ Proglib Academy #буст

Как функция LogLoss наказывает модель, если реальный ответ равен y=1, а модель предсказала вероятность y=0.001?
Anonymous voting

Какую именно математическую трансформацию выполняет сигмоида над выходом линейной комбинации признаков?
Anonymous voting

Иерархические методы строят дерево кластеризации снизу вверх. Какую практическую пользу несет в себе визуализация этого процесса — Дендрограмма — для дата-сайентиста при исследовании структуры данных?
Anonymous voting

С какой фундаментальной проблемой столкнется K-Means, если реальные кластеры в данных имеют форму вытянутых эллипсов, полумесяцев или вложенных друг в друга колец?
Anonymous voting

В русскоязычной и международной DS-литературе часто разделяют термины Блендинг и Стекинг, хотя их математическая суть близка. В чем заключается организационное отличие Блендинга от классического Стекинга с точки зрения разбиения данных?
Anonymous voting

⚡️ Главные ИИ-новости недели: от громкого трансфера Карпати до бесплатного ChatGPT для целой страны 1. Андрей Карпати перешел
+6
⚡️ Главные ИИ-новости недели: от громкого трансфера Карпати до бесплатного ChatGPT для целой страны 1. Андрей Карпати перешел в Anthropic. 2. Anthropic впервые обогнала OpenAI по бизнес-адопции: 34.4% и 32.3% соответственно. (см. 2) 3. Codex теперь доступен в мобильном приложении ChatGPT 4. xAI запустила Grok Build — CLI-агент для кодинга с субагентами, plan-режимом, headless и ACP. Пока бета, только для SuperGrok Heavy. (см. 4) 5. Cursor выпустил модель Composer 2.5 (на основе Kimi K2.5): стоит в 10 раз дешевле и работает на уровне Opus 4.7. (см. 5) 6. Google релизнула модель Gemini 3.5 Flash Модель Gemini 3.5 Flash, которая обходит Gemini 3.1 Pro на агентских и кодинговых бенчмарках при 4-кратной скорости вывода. Вместе с ней появился персональный агент Gemini Spark, работающий круглосуточно, а 3.5 Pro ожидается в следующем месяце. (см. 6) 7. Alibaba выпустила Qwen 3.7 Max Preview (заняла 13 место в Text Arena) и Plus Preview (16 место в Vision Arena). (см. 7) 8. Moonshot AI выпустила Kimi WebBridge Расширение для браузера, которое дает агенту доступ к вашим учетным записям, файлам cookie и авторизованным сессиям, чтобы он мог сам кликать, скроллить и заполнять формы от вашего имени на любых сайтах. 9. Мальта договорилась с OpenAI и раздает всем своим гражданам годовую подписку ChatGPT Plus 📬 Понравился дайджест? Это лишь 20% от того, что мы отправляем нашим подписчикам каждую субботу. 👉 Подписаться на еженедельную ИИ-рассылку

В простом ансамбле (Voting) мы можем просто усреднить предсказания трех моделей. В стекинге же мы строим двухслойную архитектуру: базовые модели (Level 0) и мета-модель (Level 1). Что именно подается на вход мета-модели во время обучения и инференса?
Anonymous voting

Библиотека CatBoost завоевала огромную популярность в DS. Какую уникальную математическую фичу использует CatBoost под капотом, чтобы кодировать категории?
Anonymous voting