Библиотека собеса по Data Science | вопросы с собеседований

Kanalga Telegram’da o‘tish

Вопросы с собеседований по Data Science и ответы на них. Учиться у нас: clc.to/GjjbkQ По рекламе: @proglib_adv Учиться у нас: https://proglib.io/w/7dfb7235 Для обратной связи: @proglibrary_feeedback_bot

Ko'proq ko'rsatish

Tarmoq:Книги для программистов Rossiya122 465 Karyera6 884

4 476

Obunachilar

-124 soatlar

-157 kunlar

-1130 kunlar

431

Post ko'rishlar

~ 21924 soatlar

~ 27248 soatlar

9.63%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

4 476

🔥 Курс «Разработка ИИ-агентов» стартовал, но вы еще успеваете присоединиться! Мы только начали, а первый практический воркшоп пройдет только 23 июля. До этого времени вы спокойно успеете изучить материалы и нагнать группу. 💼 Главная фишка: финальный проект в портфолио:

В финальном проекте вы сможете выбрать один из двух вариантов: реализовать свою идею или решить задачу от партнера курса — крупной российской финтех-компании. Вы будете работать с датасетом, построенным по реальным сценариям, получите бизнес-контекст и продовые ограничения. В результате соберете AI-агента, который станет сильным проектом для портфолио.

🎁 Упомяните менеджеру специальное предложение «3 курса по цене 1»: Берете VIP-тариф — получаете курс «Разработка ИИ-агентов», хардкорный «AgentOps» и ещё один курс на выбор. Выгода 129.000 ₽! Двери потока вот-вот закроются окончательно. Успейте забрать стек курсов и начать работу над реальным проектом 🔗 Занять место и забрать 3 курса

4 476

Какую двойственную оптимизационную задачу решает метод Information Bottleneck?

Anonymous voting

4 476

🔥 Стартуем СЕГОДНЯ! Новый поток курса «Разработка ИИ-агентов» открыт По этому поводу мы решили выложить закрытую запись одного из уроков из программы. Найти её в поиске YouTube нельзя — она доступна только по ссылке и всем, кто будет на курсе. Внутри глубокий разбор LLM от Алексея Яндутова (Senior ML-инженер, развивал ответы «Алисы» и «Нейро» в Яндексе). Учимся получать точный результат без галлюцинаций. Что внутри урока:

- Устройство LLM. - Рабочие шаблоны промптов (Persona, Chain-of-Thought и др.). - Разбор реального кейса Яндекса. Как автоматизировать разметку, обойти качество людей на 5% и срезать косты на 60%.

После просмотра вы поймете, когда хватает промпт-инжиниринга, а когда нужен RAG или fine-tuning. 👉Смотреть закрытый урок на YouTube Понравился урок? Переходите на новый уровень! Оставляйте заявку на курс, чтобы научиться проектировать надежные автономные системы. Обучение началось, но вы еще успеваете присоединиться. 🔗 Занять место на курсе

4 476

Представь два распределения вероятностей, которые не пересекаются. Мы хотим сдвинуть одно распределение к другому с помощью градиентного спуска. Как ведут себя градиенты KL-дивергенции и метрики Васерштейна в такой ситуации?

Anonymous voting

4 476

🚀 Уже завтра стартует новый поток курса «ИИ-агенты»! Мы собрали мощнейший состав преподавателей. Учить вас проектировать архитектуру и собирать продакшн-агентов будут инженеры и исследователи из топовых IT-компаний. Старт уже завтра! Сомневаетесь, подойдет ли вам программа и подача? Начните с бесплатного демо-урока! Всего за 2 часа вы заглянете под капот ИИ-агента, поймете, чем мышление модели отличается от ее ответа, и научите систему чинить собственный код. Это идеальный способ протестировать нашу платформу перед покупкой. 🔗 Пройти демо-урок и занять место на курсе

4 476

Как применяется принцип ортогональности при обучении нескольких LoRA-адаптеров под разные задачи на одной базовой модели?

Anonymous voting

4 476

Для поиска направлений, которые нельзя менять, алгоритм собирает информацию о поведении сети на старых данных. Какая математическая структура анализируется для определения базиса «неприкосновенного» подпространства?

Anonymous voting

4 476

🤨 Как заставить AI-агента не ломать архитектуру, а нормально писать код? Мы привыкли общаться с ИИ промптами, но для автономных систем это путь к бесконечным циклам и сливу бюджета. Чтобы убрать хаос, инженеры переходят на Spec-Driven Development (SDD). Вот как этот подход меняет работу агента на практике: 🔹Контракт вместо текста. Сначала пишется строгая спецификация (JSON-схема/OpenAPI) и автотесты. Агент зажат в рамки интерфейсов, за которые физически не может выйти. 🔹Контроль на шагах. Внутри петли Think-Act-Observe агент сверяет действия со спецификацией. 🔹Саморефлексия. Если ИИ нарушил типы или «додумал» лишнее, тест падает. Агент получает ошибку в контекст и сам правит код, не выходя за рамки ТЗ. Это лишь база того, как укротить ИИ-разработку. Если вы хотите глубоко внедрить эту методологию, научиться проектировать архитектурные контракты и собирать отказоустойчивые системы —оставляйте заявку на наш новый курс по Spec-Driven Development. Стартуем совсем скоро🙂

4 476

Чтобы модель не забывала задачу A во время обучения на задаче B, алгоритм OGD модифицирует вектор градиента g B перед обновлением весов. В какое подпространство OGD проецирует градиент новой задачи?

Anonymous voting

4 476

🔥 Как перестать слепо доверять ИИ и начать им управлять? 1–2 августа на «ИИ-выходных» вы научитесь проектировать архитектуру автономных AI-агентов и контролировать их работу. Что будет в вашем портфолио после обучения: — Вы выйдете с готовым профилем AI-инженера (отлично дополнит ваши LinkedIn и GitHub). — Освоите связку Python, FastAPI, OpenAI API, Docker и PostgreSQL. — Соберете полноценный AI-сервис под вашу личную задачу. Для кого: junior-middle разработчики. Вы пишете на Python, работаете с Git и терминалом (с нуля не подойдет, темп очень быстрый!). 👨‍💻 Спикер: Алексей Жиряков (Сбер, GenAI). Места строго ограничены! 👉 Изучить программу и занять место

4 476

DPO имеет слабость по сравнению с PPO: он обучается на фиксированном датасете пар. К какому негативному эффекту это может приводить, если модель в процессе DPO-обучения начинает генерировать ответы, уходящие далеко в сторону от обучающей выборки?

Anonymous voting

4 476

Мы восстанавливаем пропущенные элементы в матрице (Matrix Completion), представив её как произведение двух глубоких линейных слоев W=W2W1, и обучаем градиентным спуском. Какое неявное структурное ограничение накладывает SGD на итоговую матрицу W?

Anonymous voting

4 476

📹 Из чего на самом деле состоит ИИ-агент? Прикрепили для вас свежую вырезку из вебинара. Внутри, что прячется под капотом агентных систем: от LLM-ядра до вызова внешних инструментов. Обсуждаем, какими бывают агенты (спойлер: далеко не только автономными) и когда какой подход использовать. Готовы перейти от видео к практике и собрать свой первый продакшн-кейс? Прямо сейчас у нас действует акция «3 курса по цене 1»:

🔹 При покупке VIP-тарифа нового потока «Разработка ИИ-агентов» вы получаете в подарок хардкорный курс «AgentOps» + ещё один любой курс Академии на ваш выбор! 🔹 Ваша чистая экономия — 129 000 ₽! Два топовых курса по созданию и контролю агентов обойдутся вам всего в 134 000 ₽ вместо 263 000 ₽. Плюс третий курс бонусом (например, «Математика для AI»).

Сомневаетесь, подойдет ли вам формат? Оставьте заявку и пройдите бесплатный демо-урок, чтобы протестировать платформу перед покупкой. 👉 Пройти демо-урок и забрать 3 курса по цене 1

4 476

💰 Почему одним Data Scientist платят больше, чем другим? Дело не только в знании Python и ML-библиотек. Во многих компаниях уровень специалиста оценивают по математической подготовке: теории вероятностей, статистике, линейной алгебре и математическому анализу. Именно эти знания помогают понимать модели, решать более сложные задачи и претендовать на позиции с более высокой оплатой. На курсе «Математика для Data Science» вы изучите разделы, которые используются в работе Data Scientist и ML Engineer. Что вас ждёт: 🔹 40+ видеолекций и 150+ практических заданий на Python 🔹 Проверка домашних работ и обратная связь от преподавателей 🔹 Подготовка к техническим собеседованиям 🔹 Программа от преподавателей ВМК МГУ, НИУ ВШЭ и экспертов индустрии 👉 Записаться на бесплатный демо-урок

4 476

На практике замечено, что модели, обученные с большим шагом обучения и маленьким размером батча, обобщают данные лучше, чем модели, обученные на огромных батчах с крошечным шагом. Какова математическая природа этого феномена в ландшафте функции потерь?

Anonymous voting

4 476

🔥 Открытое занятие по AgentOps — курс стартовал! Сегодня в 19:00 по МСК пройдет первое занятие нового потока, на которое может прийти каждый. Оцените пользу нашего подхода на ретрансляции урока в VK! 👨‍💻 Спикер: Андрей Носов Тема: Архитектура управления: state machine для AI-агентов Будем разбираться, как использовать State machine в качестве главного оружия против стохастики (непредсказуемости) LLM. Что в программе: ● State machine: инварианты и терминальные состояния; ● Паттерны маршрутизации: Supervisor, ReAct, Plan-and-Solve; ● Детекция циклов и настройка аварийных выходов; ● Абстракция от модели: как сделать каркас, который переживет смену LLM/провайдера; ● Адаптация графов под ограничения локальных моделей; ● Версионирование графов и миграции стейта. Результат занятия: Вы поймете, как спроектировать надежный каркас агента с жестким контролем исполнения и переходов. 👉 Подписывайтесь на нашу группу ВКонтакте, чтобы не пропустить старт трансляции!

4 476

Если данные линейно разделимы, и мы обучаем логистическую регрессию с помощью SGD до бесконечности (пока лосс не устремится к нулю), веса растут по модулю. Вдоль какого направления будут бесконечно расти веса модели, согласно теории неявного смещения?

Anonymous voting

4 476

Если убрать негативные примеры из функции потерь и учить сеть выдавать похожие эмбеддинги для двух разных аугментаций одной картинки, модель быстро найдет «хак». В чем заключается суть коллапса представлений при наивном обучении без негативных примеров?

Anonymous voting

4 476

🎬 Как ИИ ускоряет разработку и где ломаются архитектуры Мы провели открытый вебинар, где разобрали реальные боли проектирования автономных систем. Ольга Лукьянова на практическом кейсе показала, как использовать ИИ-ассистентов для реальных задач. Вы просили запись встречи — она уже в открытом доступе! Что внутри: — Как с помощью ИИ быстрее разбираться в незнакомом коде и готовить пулл-реквесты; — Критерии выбора между одним агентом и мультиагентной системой; — Разбор популярных архитектурных ошибок и ограничений современных ИИ; — Практические рекомендации по проектированию и внедрению облачных агентов. 👉 Посмотреть полную запись можно тут: ● VK ● YouTube 🚀 Хотите пойти дальше открытого вебинара? Если вы готовы перейти от простых промптов к проектированию надежных, отказоустойчивых ИИ-систем, которые не сливают бюджет компании на API, приходите на курс AgentOps. Поток уже стартовал, но двери еще приоткрыты! 👉 Успеть на курс AgentOps

4 476

При добавлении каждого нового слоя в стандартной GCN нам нужно собирать информацию от соседей наших соседей. К какому вычислительному кризису это приводит на реальных графах (например, с топологией «тесного мира»)?

Anonymous voting