Библиотека собеса по Data Science | вопросы с собеседований
Kanalga Telegram’da o‘tish
Вопросы с собеседований по Data Science и ответы на них. Курс по Ai-агентам: https://clc.to/9L0Tqg По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot
Ko'proq ko'rsatish4 487
Obunachilar
-124 soatlar
+27 kunlar
+3430 kunlar
Postlar arxiv
Почему для аналитического запроса SELECT AVG(salary) FROM employees колоночная база данных отработает в десятки раз быстрее, чем строковая?
Каким образом наличие B-Tree индекса по колонке user_id ускоряет выполнение запроса SELECT * FROM users WHERE user_id = 500?
До 31 мая можно забрать любой курс Proglib Academy со скидкой 40%
Если давно хотели прокачаться в Python, ML, алгоритмах или AI-агентах, сейчас самое время выбрать программу и начать обучение по сниженной цене.
🎁 Разработка AI-агентов — от 49.000 ₽ (вместо 69.000 ₽)
Практический курс по разработке AI-агентов для автоматизации задач, работы и собственных проектов
🎁 Курс AgentOps — 129.000 ₽ (вместо 149.000 ₽)
Для разработчиков и LLM-инженеров, которые хотят внедрять AI-логику в бэкенд и сохранять стабильность сервиса.
🎁 Математика для разработки AI-моделей — 23.990 ₽ (вместо 31.990 ₽)
Практическая база по математике для анализа данных, ML и дальнейшего развития в AI.
🎁 Математика для Data Science — от 29.990 ₽ (вместо 39.990 ₽)
Курс для тех, кто хочет решать задачи, которые дают на собеседованиях на позицию дата-сайентиста в бигтехе.
🎁 ML для старта в Data Science — 28.990 ₽ (вместо 38.990 ₽)
Разберётесь в машинном обучении: от базовых понятий и линейных моделей до ансамблей, бустинга и рекомендательных систем.
🎁 Основы IT для непрограммистов — 16.990 ₽ (вместо 28.990 ₽)
Курс для IT-рекрутеров, маркетологов, проджектов, продактов и всех, кто работает с IT, но не пишет код.
🎁 Архитектуры и шаблоны проектирования — 27.990 ₽ (вместо 37.900 ₽)
Освоите основные паттерны проектирования и прокачаете навыки архитектора программного обеспечения.
🎁 Специалист по ИИ — 89.000 ₽ (вместо 113.900 ₽)
Курс для тех, кто хочет получить профессию в сфере ИИ, собрать портфолио из 5 проектов и научиться разрабатывать сложных AI-агентов.
🎁 Алгоритмы и структуры данных — 33.990 ₽ (вместо 57.990 ₽)
Подготовитесь к алгоритмическим собеседованиям, разберёте структуры данных и научитесь писать более эффективный код.
🎁 Программирование на языке Python — 27.990 ₽ (вместо 47.390 ₽)
Освоите Python на практике: без сухой теории, с пошаговой прокачкой навыков и итоговым проектом в портфолио.
🙌 Выбирайте курс по ссылке, оставляйте заявку, и менеджер поможет подобрать программу под ваши цели — https://clc.to/SALE40
Какими свойствами должен обладать временной ряд, чтобы математически считаться стационарным (в широком смысле)?
Repost from Proglib.academy | IT-курсы
✏️ Разбор задачи из высшей математики
Условие: Дискретная случайная величина задана своим законом распределения 1️⃣. Нужно найти математическое ожидание, дисперсию, и среднее квадратическое отклонение величины x.
Решение: Находим a,
cлучайная величина может принять только 5 значений, поэтому их сумма равна единице 2️⃣.
Приступаем к заполнению расчетной таблицы 3️⃣.
C помощью формулы находим математическое ожидание 4️⃣. Дисперсия вычисляется по формуле 5️⃣. Остается найти среднее квадратическое отклонение 6️⃣
Ответ: M(X) = 20.6; D(X) = 31.64; σ(X) = 5.62
Хотите подготовиться к поступлению или подтянуть знания? Оставляйте заявку на наш курс по математике для Data Science 💙
🔹 Получить консультацию менеджера
🔹 Сайт Академии 🔹 Сайт Proglib
🏃♀️ Proglib Academy
#буст
Repost from Proglib.academy | IT-курсы
👀 Краткая выжимка нашей имбовой рассылки по ИИ
Ниже — небольшая подборка, а если хотите фулл, то подписывайтесь на рассылку
💬 Новости
▫️ Энтузиасты получили доступ к Anthropic Mythos
Группа из Discord-канала, искавшая доступ к ещё не вышедшим моделям, угадала URL Mythos по шаблонам URL других моделей Anthropic и через аккаунт стороннего подрядчика получила доступ к инструменту
▫️ Anthropic тайно устанавливает шпионское ПО при установке Claude Desktop
Claude Desktop без спроса прописывает в семь браузеров (Chrome, Brave, Edge, Chromium, Arc, Vivaldi и Opera) Native Messaging bridge, который дает расширению Claude доступ к авторизованным сессиям, DOM и формам за пределами песочницы. Удалить это нельзя — приложение восстанавливает файл с настройками при каждом запуске.
▫️ Три бага, которые сломали Claude Code
Сначала снизили режим мышления с high до medium ради скорости, потом словили баг с кешированием, из-за которого модель теряла контекст каждый ход вместо одного раза, а под конец добавили системный промпт с жесткими лимитами на длину ответов — все это вместе выглядело как общая деградация модели, хотя API б
🤖 Инструменты для ИИ
Google DESIGN.md — открытый стандарт описания дизайн-систем для UI-агентов
designdotmd.directory — каталог DESIGN.md файлов
beads — система памяти для агентов
swarm-forge — оркестратор агентов, работающих в разных git worktree одного проекта
browser-harness — дает агентам полный контроль над браузером
agentmako — превращает код в локальную базу знаний и скармливает AI-агентам готовый контекст
thonops — cобирает сайт на Next.js, обновляя страницу на лету при любой правке кода и заливая проект на Vercel в пару кликов
vibechord — инструмент для запуска нескольких AI-агентов и управления ими из одного места
monitorability-evals — открытый датасет от OpenAI для оценки того, насколько хорошо можно отслеживать и контролировать поведение языковых моделей в различных сценариях
🖥 Разбор пяти AI-проектов, набравших тысячи звезд на GitHub:
Hermes Agent — самообучающийся ассистент с долгой памятью
DeerFlow — мультиагентный фреймворк с изолированными песочницами
Multica — аналог Jira для AI-команд
Claude Code Game Studios — 48 агентов-коллег для инди-геймдева
MarkItDown — конвертер любых документов в Markdown
⚡️ Скиллы
ui-skills.com — 12 кураторских скилов для UI
Nothing Design Skill — скил для Claude Code по созданию пользовательского интерфейса в дизайн-языке Nothing: монохромный, типографический, индустриальный
codex-marketplace.com — каталог плагинов, скилов и хуков для Codex с установкой в одну команду и рейтингом от коммьюнити
TBM Recommender — прикручивает к AI-агентам базу рассылки TBM про продукты и менеджмент, вытаскивая релевантные посты через хитрую трехуровневую выборку ради экономии токенов
🔹 Получить консультацию менеджера
🔹 Сайт Академии 🔹 Сайт Proglib
🏃♀️ Proglib Academy
#буст
Как функция LogLoss наказывает модель, если реальный ответ равен y=1, а модель предсказала вероятность y=0.001?
Какую именно математическую трансформацию выполняет сигмоида над выходом линейной комбинации признаков?
Иерархические методы строят дерево кластеризации снизу вверх.
Какую практическую пользу несет в себе визуализация этого процесса — Дендрограмма — для дата-сайентиста при исследовании структуры данных?
С какой фундаментальной проблемой столкнется K-Means, если реальные кластеры в данных имеют форму вытянутых эллипсов, полумесяцев или вложенных друг в друга колец?
В русскоязычной и международной DS-литературе часто разделяют термины Блендинг и Стекинг, хотя их математическая суть близка.
В чем заключается организационное отличие Блендинга от классического Стекинга с точки зрения разбиения данных?
Repost from Proglib.academy | IT-курсы
⚡️ Главные ИИ-новости недели: от громкого трансфера Карпати до бесплатного ChatGPT для целой страны
1. Андрей Карпати перешел в Anthropic.
2. Anthropic впервые обогнала OpenAI по бизнес-адопции: 34.4% и 32.3% соответственно. (см. 2)
3. Codex теперь доступен в мобильном приложении ChatGPT
4. xAI запустила Grok Build — CLI-агент для кодинга с субагентами, plan-режимом, headless и ACP. Пока бета, только для SuperGrok Heavy. (см. 4)
5. Cursor выпустил модель Composer 2.5 (на основе Kimi K2.5): стоит в 10 раз дешевле и работает на уровне Opus 4.7. (см. 5)
6. Google релизнула модель Gemini 3.5 Flash
Модель Gemini 3.5 Flash, которая обходит Gemini 3.1 Pro на агентских и кодинговых бенчмарках при 4-кратной скорости вывода. Вместе с ней появился персональный агент Gemini Spark, работающий круглосуточно, а 3.5 Pro ожидается в следующем месяце. (см. 6)
7. Alibaba выпустила Qwen 3.7 Max Preview (заняла 13 место в Text Arena) и Plus Preview (16 место в Vision Arena). (см. 7)
8. Moonshot AI выпустила Kimi WebBridge
Расширение для браузера, которое дает агенту доступ к вашим учетным записям, файлам cookie и авторизованным сессиям, чтобы он мог сам кликать, скроллить и заполнять формы от вашего имени на любых сайтах.
9. Мальта договорилась с OpenAI и раздает всем своим гражданам годовую подписку ChatGPT Plus
📬 Понравился дайджест? Это лишь 20% от того, что мы отправляем нашим подписчикам каждую субботу.
👉 Подписаться на еженедельную ИИ-рассылку
В простом ансамбле (Voting) мы можем просто усреднить предсказания трех моделей. В стекинге же мы строим двухслойную архитектуру: базовые модели (Level 0) и мета-модель (Level 1). Что именно подается на вход мета-модели во время обучения и инференса?
Библиотека CatBoost завоевала огромную популярность в DS.
Какую уникальную математическую фичу использует CatBoost под капотом, чтобы кодировать категории?
Классический метод OneHotEncoder превращает колонку «Страна» в набор бинарных колонок (0 или 1) для каждой страны.
В каком случае использование One-Hot Encoding станет катастрофой для модели случайного леса (Random Forest) или градиентного бустинга?
Вы прогнозируете ежедневный спрос на товары. У вас есть выбор между двумя метриками для оптимизации: MAE и RMSE.Как именно математическая разница между этими метриками влияет на то, какую модель вы получите в итоге?
Ты строишь модель, которая предсказывает вероятность дефекта детали на заводе по фотографиям. В датасете есть много фотографий одной и той же детали с разных ракурсов.
Какой тип валидации нужно выбрать?
Вы получили в тесте p-value=0.03 при выбранном уровне значимости α=0.05. Вы отклоняете нулевую гипотезу (H0 ).
Какое определение p-value является единственно верным с точки зрения математической статистики?
Вы провели A/B-тест нового дизайна кнопки и хотите сравнить средний чек в двух группах. Вы собираетесь использовать классический независимый t-test. Какое из следующих условий является обязательным для того, чтобы его результаты были корректными?
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
