Machine learning Interview
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz
Больше📈 Аналитический обзор Telegram-канала Machine learning Interview
Канал Machine learning Interview (@machinelearning_interview) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 30 037 подписчиков, занимая 4 590 место в категории Технологии и приложения и 21 932 место в регионе Россия.
📊 Показатели аудитории и динамика
С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 30 037 подписчиков.
Согласно последним данным от 15 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 21, а за последние 24 часа — -2, при этом общий охват остаётся высоким.
- Статус верификации: Не верифицирован
- Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 20.95%. В первые 24 часа после публикации контент обычно набирает 7.07% реакций от общего числа подписчиков.
- Охват публикаций: В среднем каждый пост получает 6 292 просмотров. В течение первых суток публикация набирает 2 123 просмотров.
- Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 39.
- Тематические интересы: Контент сосредоточен на ключевых темах, таких как claude, llm, контекст, hermes, nvidia.
📝 Описание и контентная политика
Автор описывает ресурс как площадку для выражения субъективного мнения:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!
Вопросы - @workakkk
РКН: clck.ru/3FmwRz”
Благодаря высокой частоте обновлений (последние данные получены 16 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.
P(A) = вероятность дождя = 25%
P(B) = вероятность того, что все 3 друга говорят, что идет дождь
P(A|B) вероятность того, что идет дождь, если все друзья говорят, что идет дождь
P(B|A) вероятность того, что все 3 друга говорят, что идет дождь, если идет дождь = (2/3)³ = 8/27
Шаг 1: Найдем P(B)
P(B) = P(B | A) * P(A) + P(B | не A) * P(не A)
P(B) = (2/3)³ * 0.25 + (1/3)³ * 0.75 = 0.25 * 8/27 + 0.75 * 1/27
Шаг 2: Теперь вычислим P(A|B)
P(A | 😎 = P(B | A) * P(A) / P(B),
P(A | 😎 = 0,25 * (8/27) / (0,25 * 8/27 + 0,75 * 1/27)
P(A | 😎 = 8 / (8 + 3) = 8/11
Поэтому, если все трое друзей говорят, что идет дождь, то есть шанс 8/11, что на самом деле идет дождь.
@machinelearning_interviewpred_valid_template.csv (в архиве с data) и залить его с тем же именем (см. notebooks/GettingStarted.ipynb);
- html страницу с предсказанием модели для всех картинок из real_test и папку с используемыми картинками в этой html странице для её просмотра. Создать zip файл c html и изображениями и залить его в папку results.
Также необходимо:
- подготовить код (сам репозиторий) для проверки (докстринги, PEP8);
- создать отчет (можно прямо в ноутбуке) с описанием Вашего исследования, предобработки, постобработки, проверямых гипотез, используемых моделей, описание лучшего подхода и т.п. (он должен лежать в папке notebooks);
Рекомендуемый pipeline решения:
Предполагается следующий pipeline решения поставленной задачи:
- fork данного репозитория;
- ознакомиться с критериями;
- скачать данные;
ознакомиться с notebooks/GettingStarted.ipynb;
ознакомиться с данными, разобраться с их форматом;
ознакомиться с базовой статьей;
- провести анализ данных;
- написать методы аугментации данных;
- реализовать нейросеть/нейросети (необязательно с нуля);
- провалидировать модели;
- выбрать лучшую модель на val и посчитать для нее метрики;
- получить результаты на реальных изображениях real_test и сохранить их;
проанализировать результаты, сформулировать проблемы модели.
Критерии
При оценке решения этой задачи акцент будет делаться на (в порядке приоритета):
1. Качество исследования в jupyter notebook и чистота кода. В этот критерий входит читаемость и адекватность кода, содержательность комментариев, правильное оформление графиков (если таковые будут), отсутствие смысловых ошибок в коде. Наличие docstrings к написаным функциям приветствуется. Также будет оцениваться демонстрация предпринятых шагов и структурирование кода (разные по смыслу куски кода разделены по пакетам).
2. Анализ данных и подходы к аугментации. Оригинальность, эффективность и количество идей. Использование неочевидных шагов в решении, которые улучшают качество, будет хорошим плюсом. Наличие нескольких подходов также будет ценится выше, чем один подход.
3. Значение метрик на контрольной выборке и общая адекватность модели.
4. Обоснование выбора моделей (процесс выбора моделей).
5.Анализ результатов итоговой модели.
@machinelearning_interview
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
