Data Science | Вопросы собесов
Open in Telegram
Cайт easyoffer.ru Реклама @easyoffer_adv ВП @easyoffer_vp Тесты t.me/+Kn2WW6VoGrZkNzky Вакансии t.me/+Ir52wMvyEgo5YWIy
Show more4 938
Subscribers
+124 hours
-37 days
-2730 days
Data loading in progress...
Similar Channels
Tags Cloud
Incoming and Outgoing Mentions
---
---
---
---
---
---
Attracting Subscribers
June '26
June '26
+24
in 0 channels
May '26
+32
in 0 channels
Get PRO
April '26
+55
in 0 channels
Get PRO
March '26
+58
in 0 channels
Get PRO
February '26
+115
in 0 channels
Get PRO
January '26
+100
in 0 channels
Get PRO
December '25
+62
in 0 channels
Get PRO
November '25
+110
in 0 channels
Get PRO
October '25
+132
in 1 channels
Get PRO
September '25
+75
in 0 channels
Get PRO
August '25
+82
in 0 channels
Get PRO
July '25
+125
in 0 channels
Get PRO
June '25
+127
in 0 channels
Get PRO
May '25
+124
in 1 channels
Get PRO
April '25
+166
in 0 channels
Get PRO
March '25
+598
in 5 channels
Get PRO
February '25
+332
in 4 channels
Get PRO
January '25
+201
in 53 channels
Get PRO
December '24
+120
in 0 channels
Get PRO
November '24
+162
in 1 channels
Get PRO
October '24
+310
in 40 channels
Get PRO
September '24
+408
in 249 channels
Get PRO
August '24
+181
in 1 channels
Get PRO
July '24
+342
in 54 channels
Get PRO
June '24
+924
in 244 channels
Get PRO
May '24
+999
in 191 channels
Get PRO
April '24
+689
in 23 channels
| Date | Subscriber Growth | Mentions | Channels | |
| 17 June | 0 | |||
| 16 June | +2 | |||
| 15 June | 0 | |||
| 14 June | +1 | |||
| 13 June | +1 | |||
| 12 June | 0 | |||
| 11 June | +2 | |||
| 10 June | 0 | |||
| 09 June | +2 | |||
| 08 June | +3 | |||
| 07 June | +1 | |||
| 06 June | +1 | |||
| 05 June | +1 | |||
| 04 June | +2 | |||
| 03 June | +2 | |||
| 02 June | +5 | |||
| 01 June | +1 |
Channel Posts
🤔 Какие магические методы в python знаешь?
Магические методы в Python — это специальные методы, которые начинаются и заканчиваются двойным подчеркиванием. Примеры включают `__init__` (конструктор класса), `__str__` (представление объекта в виде строки), `__len__` (возвращает длину объекта) и `__getitem__` (обращение к элементам по индексу). Также есть методы, такие как `__add__` для перегрузки операторов и `__call__`, позволяющий объекту вести себя как функция. Эти методы позволяют кастомизировать поведение объектов Python.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний
| 2 | 🤔 В чем разница между командами делит и транткейп?
Команды DELETE и TRUNCATE в SQL используются для удаления данных из таблиц, но они работают по-разному и подходят для разных задач.
🚩Команда DELETE
Используется для удаления определённых записей из таблицы. Можно указать условие с помощью WHERE, чтобы удалить только нужные строки. Например
DELETE FROM employees WHERE department = 'HR';
🟠Характеристики
Удаление происходит построчно. Логируется каждая удалённая запись (затратно по производительности при больших объёмах данных). Можно откатить изменения с помощью транзакций, если используются BEGIN TRANSACTION и ROLLBACK.
🟠Где применять
Когда нужно удалить часть данных, а не все записи. Например, удаление сотрудников только из определённого отдела.
🚩Команда TRUNCATE
🟠Описание
Используется для полного очищения таблицы. Удаляет все строки в таблице без возможности указания условия. Например:
TRUNCATE TABLE employees;
🟠Характеристики
Работает быстрее, чем DELETE, так как не записывает подробный лог изменений. Удаляет данные "в обход" построчного удаления, очищая всю структуру. Нельзя откатить изменения, так как эта операция не поддерживает транзакции в большинстве СУБД.
🟠Где применять
Когда нужно быстро очистить таблицу перед новой загрузкой данных. Например, перед массовой загрузкой обновлённых данных.
🚩Пример для сравнения
DELETE
-- Удалить только сотрудников из отдела HR
DELETE FROM employees WHERE department = 'HR';
TRUNCATE
-- Очистить таблицу сотрудников полностью
TRUNCATE TABLE employees;
Ставь 👍 и забирай 📚 Базу знаний | 174 |
| 3 | Онлайн-демо вендоров ВКС-оборудования
✅Как выбрать ВКС-комплект для переговорной и не ошибиться с интеграцией?
Для ИТ-руководителя это не всегда просто: одна переговорная маленькая, другая — на 20 человек, нужны чистый звук, видеосвязь без сбоев, корректная интеграция в ИТ-инфраструктуру и соответствие требованиям безопасности.
💻 Чтобы не тратить недели на изучение характеристик и сравнение вендоров, приходите на 40-минутную онлайн-экскурсию МТС Линк по готовым решениям для переговорных и конференц-залов.
За 40 минут экскурсии вы получите:
— обзор и сравнение готовых решений от ведущих вендоров Yealink, Lumien и IPVS;
— рекомендации по интеграции;
— разбор требований к безопасности;
— примеры комплектов для переговорных разного размера.
🎓Получите запись онлайн-экскурсии бесплатно
Получить предложение
#реклама 16+
mts-link.ru
О рекламодателе | 193 |
| 4 | 🤔 Как использовать P-value, когда мы проверяем гипотезу?
P-value показывает вероятность получения текущих результатов при условии, что нулевая гипотеза верна. Если P-value ниже уровня значимости, нулевая гипотеза отвергается.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 230 |
| 5 | Аренда VPS/VDS-сервера.
Виртуальные выделенные серверы в дата-центрах уровня Tier III — 7 готовых конфигураций от 200 ₽/мес.
Преимущества аренды:
- Выделенные ресурсы без переплаты;
- KVM-виртуализация;
- Быстрые NVMe SSD;
- Соответствие 152-ФЗ, PCI DSS;
- Бесплатная защита от DDoS;
- Управление через панель, API и Terraform;
- Техподдержка 24/7.
Запустите сервер за несколько минут!
Попробовать
#реклама 16+
selectel.ru
О рекламодателе | 281 |
| 6 | 🤔 Почему в картинках используют Standard Scaling вместо MinMax Scaling?
Standard Scaling (z-score normalization) чаще используется для обработки изображений, поскольку:
1. Он центрирует данные вокруг нуля и масштабирует их на основе стандартного отклонения, что улучшает производительность моделей, чувствительных к масштабам.
2. MinMax Scaling, преобразующий значения в диапазон [0, 1], может терять информацию о дисперсии пикселей.
3. Standard Scaling более устойчив к изменению контрастности и яркости изображений.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 262 |
| 7 | 🤔 Зачем нужен метод dir для объектов?
Метод dir() используется для автоматического перечисления атрибутов, методов и других идентификаторов, которые доступны для любого объекта. Это полезный инструмент для исследования и интерактивного программирования, особенно когда вы работаете с новыми библиотеками или объектами, структура и свойства которых вам не полностью известны.
🚩Зачем нужен dir()
🟠Интроспекция
Используется для интроспекции объектов, то есть для определения, какие свойства и методы они имеют. Это особенно полезно в средах разработки, где вы можете не знать точной структуры объекта.
🟠Отладка
Помогает понять объекты, с которыми они работают, что может значительно облегчить отладку кода, позволяя быстро проверить, какие методы и атрибуты доступны для объекта.
🟠Рефлексия
Это свойство, позволяющее программе манипулировать своими частями. С помощью dir() можно получить список, содержащий имена всех атрибутов, которые доступны в объекте, что может быть использовано для рефлексивного доступа к атрибутам и методам.
🚩Как она работает
Когда вы вызываете dir() для объекта, возвращает список строк. Каждая строка — это имя атрибута или метода, доступного для объекта. Если вызвать dir() без аргументов, то будет возвращен список имен в текущей локальной области видимости.
class Car:
def __init__(self, make, model):
self.make = make
self.model = model
def start(self):
print("Машина заведена")
car = Car("Toyota", "Corolla")
# Выведем список всех атрибутов и методов объекта car
print(dir(car))
Ставь 👍 и забирай 📚 Базу знаний | 287 |
| 8 | 🤔 Какие проблемы могут возникнуть при прогнозе LTV на полгода вперед?
Основные проблемы при прогнозе LTV (Lifetime Value) на длительный срок включают в себя высокую неопределённость в поведении пользователей, изменение рыночных условий и устаревание данных. Кроме того, прогнозы могут быть неточными из-за сезонных изменений или новых факторов, которые не были учтены в модели. Также возможна недостаточность данных для точного прогнозирования поведения пользователей на долгий срок. Модели могут переоценивать или недооценивать реальные значения LTV.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 276 |
| 9 | 🤔 Расскажи о квантизации
Квантизация (Quantization) — это процесс приближенного представления данных или параметров модели с меньшей разрядностью (например, перевод 32-битных чисел в 8-битные). Это уменьшает размер модели и ускоряет вычисления, особенно на мобильных устройствах и встраиваемых системах.
🚩Зачем нужна квантизация?
🟠Снижение потребления памяти
уменьшает размер модели, что важно для мобильных устройств.
🟠Ускорение вычислений
операции с меньшими разрядностями выполняются быстрее.
🟠Оптимизация для аппаратного обеспечения
некоторые процессоры (например, TPU, NPU) лучше работают с низкоразрядными числами.
🚩Виды квантизации
🟠Посттренировочная квантизация (Post-Training Quantization, PTQ)
Производится после обучения модели. Преобразует веса и (иногда) активации в более низкую разрядность.
import tensorflow as tf
# Загружаем обученную модель
model = tf.keras.models.load_model("model.h5")
# Создаём конвертер для TFLite
converter = tf.lite.TFLiteConverter.from_keras_model(model)
converter.optimizations = [tf.lite.Optimize.DEFAULT] # Включаем квантизацию
tflite_model = converter.convert()
# Сохраняем сжатую модель
with open("model_quantized.tflite", "wb") as f:
f.write(tflite_model)
🟠Квантизация во время обучения (Quantization-Aware Training, QAT)
Модель учится с учетом квантизации, что позволяет адаптировать веса.
import torch
import torchvision.models as models
from torch.quantization import quantize_dynamic
# Загружаем модель
model = models.resnet18(pretrained=True)
model.eval()
# Применяем квантизацию
quantized_model = quantize_dynamic(model, {torch.nn.Linear}, dtype=torch.qint8)
# Сохраняем модель
torch.save(quantized_model.state_dict(), "resnet18_quantized.pth")
Ставь 👍 и забирай 📚 Базу знаний | 294 |
| 10 | 🤔 Что такое мультиколлинеарность?
Это ситуация, когда признаки сильно коррелируют друг с другом.
- Это вызывает нестабильность линейных моделей, так как коэффициенты могут становиться большими и неинтерпретируемыми.
- Решения: удаление зависимых признаков, PCA, L1-регуляризация (Lasso).
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 300 |
| 11 | Не грузится? Понимаем.
Бесплатный мессенджер для вашей компании - Битрикс24.
Личные и групповые чаты, видеозвонки, каналы и нейросеть. Всё привычно и удобно.
Можно перенести рабочие чаты и файлы из Telegram в Битрикс24.
Начните работать на бесплатном тарифе уже сейчас.
Узнать больше
#реклама 16+
bitrix24.ru
О рекламодателе | 250 |
| 12 | 🤔 Что такое ROC/AUC?
Это инструменты для оценки качества бинарных классификаторов. Они помогают визуально и количественно оценить, насколько хорошо модель разделяет два класса.
🚩Что такое ROC-кривая
Это график, показывающий соотношение между истинно положительными и ложноположительными срабатываниями классификатора при различных порогах классификации.
🟠Истинно положительные срабатывания (True Positive Rate, TPR)
Доля правильно предсказанных положительных примеров из всех положительных примеров (также называется чувствительность или recall).
\text{TPR} = \frac{\text{TP}}{\text{TP} + \text{FN}}
🟠Ложноположительные срабатывания (False Positive Rate, FPR)
Доля неправильно предсказанных положительных примеров из всех отрицательных примеров.
\text{FPR} = \frac{\text{FP}}{\text{FP} + \text{TN}}
🚩Построение
Строится путем изменения порога классификации модели от 0 до 1 и вычисления TPR и FPR для каждого значения порога. График строится с FPR по оси X и TPR по оси Y.
🚩Что такое AUC
Это площадь под ROC-кривой. Значение AUC варьируется от 0 до 1 и интерпретируется следующим образом:
🟠AUC = 0.5
Модель не лучше случайного угадывания.
🟠AUC < 0.5
Модель хуже случайного угадывания (что редко случается в практике).
🟠AUC > 0.5
Модель лучше случайного угадывания.
🟠AUC = 1
Идеальная модель.
Пример
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import roc_curve, roc_auc_score
# Пример данных
y_true = [0, 0, 1, 1] # Истинные значения
y_scores = [0.1, 0.4, 0.35, 0.8] # Предсказанные вероятности
# Вычисление ROC-кривой
fpr, tpr, thresholds = roc_curve(y_true, y_scores)
roc_auc = roc_auc_score(y_true, y_scores)
# Построение графика
plt.figure()
plt.plot(fpr, tpr, color='darkorange', lw=2, label=f'ROC-кривая (AUC = {roc_auc:.2f})')
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.0])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC-кривая')
plt.legend(loc="lower right")
plt.show()
Ставь 👍 и забирай 📚 Базу знаний | 293 |
| 13 | Хочешь начать карьеру в ИТ на оплачиваемой стажировке?
Присоединяйся к ИТ-лагерю Т1 для студентов вузов технических и ИТ-специальностей. Теперь в обновлённом формате: ещё больше практики, доступ к платформам Т1, а участие — оплачивается и оформляется как стажировка.
За 2,5 месяца вместе с проектной командой ты пройдешь полный цикл создания ИТ-продукта: от идеи до разработки прототипа и финальной защиты. Превратить идею в проект помогут мастер-классы, общение с экспертами и погружение в процессы Т1.
Направления подготовки:
✅ ручное тестирование;
✅ прикладное администрирование (DevOps);
✅ системный анализ;
✅ фронтенд-разработка (React);
✅ бэкэнд-разработка (Java).
Подай заявку до 30 июня! Старт — в июле.
Узнать больше
#реклама 16+
career.t1.ru
О рекламодателе | 224 |
| 14 | 🤔 Какая скорость поиска в хэш-таблице
Скорость поиска в хэш-таблице (например, HashMap) в среднем составляет O(1), так как ключи напрямую отображаются в индекс с помощью хэш-функции. В худшем случае, при коллизиях, время поиска может увеличиваться до O(n), если хэш-таблица не оптимизирована или используется неэффективная стратегия разрешения коллизий. Однако в большинстве случаев эффективные хэш-функции и методы обработки коллизий поддерживают близкую к O(1) скорость.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 290 |
| 15 | 🤔 Как работает деревянный регрессор?
Это статистическая модель, используемая для прогнозирования количественного ответа (непрерывной переменной), основанного на одной или нескольких предикторных переменных (факторах). Метод основан на серии вопросов, которые разделяют данные на более мелкие группы, и каждый раздел строится таким образом, чтобы он был как можно более однородным в отношении ответа.
🚩Как оно работает
🟠Выбор признака для разделения
На каждом этапе дерево решений выбирает лучший признак и пороговое значение для разделения данных на две группы. "Лучший" означает минимизацию внутригрупповой дисперсии ответов, что делает группы как можно более однородными по ответу.
🟠Рекурсивное разбиение
Этот процесс повторяется для каждой полученной подгруппы до тех пор, пока не будет достигнут критерий остановки, такой как максимальная глубина дерева, минимальное количество точек в листе или минимальное улучшение в однородности.
🟠Прогнозирование
После построения дерева прогноз для новых данных делается путем прохождения по дереву до листа, соответствующего значениям признаков этого наблюдения. Прогнозируемое значение — это среднее значение ответов в листе.
import numpy as np
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# Генерация данных
X = np.linspace(0, 10, 100).reshape(-1, 1)
y = np.sin(X).ravel() + np.random.normal(0, 0.1, 100) # sin(x) с шумом
# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Создание и обучение модели
regressor = DecisionTreeRegressor(max_depth=5)
regressor.fit(X_train, y_train)
# Предсказание и оценка
y_pred = regressor.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print("MSE:", mse)
Ставь 👍 и забирай 📚 Базу знаний | 358 |
| 16 | 🤔 За что мэп штрафует больше: за перепрогноз или недопрогноз?
MAP (Mean Average Precision) больше штрафует за недопрогноз (упущенные релевантные элементы), так как метрика ориентирована на точность в верхней части ранжированного списка.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 365 |
| 17 | 🤔 Почему считается, что случайный лес не переобучается?
Считается, что случайный лес не склонен к переобучению, потому что он усредняет предсказания большого количества деревьев решений, каждое из которых обучается на случайной подвыборке данных и случайных признаках. Этот процесс помогает уменьшить влияние отдельных переобученных деревьев на финальное предсказание. В результате модель становится более устойчивой к ошибкам и шуму в данных. Кроме того, случайный лес не сильно зависит от малозначимых признаков, так как случайные выборки уменьшают их влияние.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 422 |
| 18 | 🤔 В чем разница между метрикой качества и функцией потери при обучении?
Метрика качества оценивает, насколько хорошо модель работает, сравнивая её предсказания с реальными данными (например, Accuracy, Precision, ROC AUC). Функция потери измеряет ошибку модели и используется во время обучения для минимизации этой ошибки (например, MSE, Cross-Entropy). Метрика качества часто применяется на тестовых данных, а функция потери — на этапе оптимизации модели
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 459 |
| 19 | Как усилить вовлечение коллег в корпоративное обучение
📚Сотрудники включают обучающие вебинары фоном, пролистывают курсы и проходят тесты с помощью ИИ?
18 июня на вебинаре эксперты МТС Линк и ProctorEdu разберут, как выстроить онлайн-обучение с контролем знаний, вовлечением слушателей и достоверной проверкой результатов.
✅Вы узнаете, как:
• организовать эффективное асинхронное обучение с использованием ИИ;
• заменить «говорящую голову» на более вовлекающие форматы;
• контролировать использование ИИ, переключение на другие вкладки и смартфоны для прохождения тестирований;
• использовать онлайн-оценки для управленческих и кадровых решений.
💻 Вебинар будет полезен:
— директорам по персоналу;
— менеджерам по обучению и развитию сотрудников;
— руководителям корпоративных университетов.
Регистрируйтесь по ссылке
Зарегистрироваться
#реклама 16+
my.mts-link.ru
О рекламодателе | 287 |
| 20 | 🤔 При свёртке картинки HxW матрицей 3x3, что получится в итоге?
Результирующий размер изображения будет (H−2)×(W−2)(H-2) \times (W-2), если не использовать дополнение, так как свёртка "обрезает" края.
Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний | 518 |
Available now! Telegram Research 2025 — the year's key insights 
