Machine learning Interview
前往频道在 Telegram
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz
显示更多📈 Telegram 频道 Machine learning Interview 的分析概览
频道 Machine learning Interview (@machinelearning_interview) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 30 033 名订阅者,在 技术与应用 类别中位列第 4 585,并在 俄罗斯 地区排名第 21 928 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 30 033 名订阅者。
根据 14 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 41,过去 24 小时变化为 -8,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 20.73%。内容发布后 24 小时内通常能获得 7.14% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 6 226 次浏览,首日通常累积 2 143 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 39。
- 主题关注点: 内容集中在 claude, llm, контекст, hermes, nvidia 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!
Вопросы - @workakkk
РКН: clck.ru/3FmwRz”
凭借高频更新(最新数据采集于 15 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
30 033
订阅者
-824 小时
-97 天
+4130 天
帖子存档
⭐️ Материалы для подготовки к интервью по направлению data science:
- тестовые задания
- задачи по математике, теории вероятностей и - линейной алгебре
- задачи на логику
- примеры live coding с собеседований на Python
- разбор задач собеседований и их аналогов на LeetCode
Для тех, кто готовится к собесу в области data science, этот всеобъемлющий набор материалов, чтобы помочь вам успешно пройти интервью.
• Разбор алгоритмических задач
• Разбор leetcode задач с собеседований
• Примеры заданий по live coding c решениями с собеседований
• В этой папке вы найдете серию Jupyter Notebook, охватывающих широкий спектр задач, в области математики.
• Задачи по статистике
• Тестовые задания ds
@machinelearning_interview
+1
📌Вопросы для собеседования на позицию ML-инженера
Неплохой список вопросов, вот некоторые из них:
🟡Расскажи о типах задач в машинном обучении.
🟡Остатки регрессии должны быть гомоскедастичными или гетероскедастичными?
🟡Что такое регуляризация модели линейной регрессии?
Также тут встречаются вопросы по SQL, потому что 100% ML-инженеру, работающему с большим объёмом данных, это понадобится
📎 Вопросы и ответы
@machinelearning_interview
+3
💡 YandexART обновился до версии 1.3
В статье на Хабре старший разработчик в команде компьютерного зрения рассказывает о переходе на новую технологию латентной диффузии и увеличении датасета в 2,5 раза, а также объясняет, зачем в новой версии используются два текстовых энкодера. Интересно, что по результатам SBS-замеров асессорами Яндекса, нейросеть YandexART 1.3 выигрывает не только у модели-предшественницы, но и в 57 процентах случаев в сравнении с Midjourney V5.2.
📎 Статья
@machinelearning_interview
📈 Одна из важных тем при подготовке к собеседованию, на которой стоит сосредоточиться это статистика.
В конечном итоге, дата-сайентист - это современный статистик, а машинное обучение - это современный термин для статистики.
Если у вас есть время, я рекомендую пройти курс "Математическая статистика" от Computer Science Center и "Статистические методы" от Джорджии Тек, который охватывает основы вероятности, случайные величины,ы распределение вероятностей, тестирование гипотез и многое другое.
▪Статистика Вопросы для собеседования
▪ Top 75 Statistics Interview Questions
▪Шпаргалка дата-сайентистов описательная статитска
▪Машинное обучение для решения прикладных задач
▪Основы статистики конспект лекций
▪Разбор ОТВЕТОВ на вопросы (Python, SQL, ТЕРВЕР, статистика)
▪Statistics Interview Questions & Answers for Data Scientists
▪40 вопросов по статистике с собеседований на должность Data Scientist
@machinelearning_interview
Приглашаем выпускников и студентов старших курсов программ бакалавриата по математике и IT испытать себя сложными математическими задачами машинного обучения в рамках олимпиады «Математика машинного обучения».
Победители олимпиады получат призы и могут быть зачислены на совместную магистратуру Сколтеха и НИУ ВШЭ «Математика машинного обучения» (победа в олимпиаде приравнивается к успешному прохождению конкурсного отбора).
Регистрация открыта до 5 мая, успейте подать заявку и загрузить все документы
🎲 Теория вероятностей пронизывает все сферы науки о данных.
Вероятностные модели и используются практически во всех алгоритмах машинного обучения.
Функции штрафа в задачах регрессии или ошибок классификации основаны на понятии математического ожидания, закона больших чисел, а центральная предельная теорема служит основанием для доказательства сходимости и состоятельности многих алгоритмов и методов анализа данных.
Полезные материалы для подготовки к вопросам по терверу:
▪ Теория вероятностей (на основе программы для поступления в ШАД)
▪Самые популярные ЗАДАЧИ на ТЕРВЕР на собеседовании АНАЛИТИКА
▪ R для теории вероятностей и математической статистики"
▪Книга: Математика в машинном обучении
▪Статистика для экспериментов от Harvard University
▪Учебное пособие Математическая статистика
▪Наука о данных 19 вопросов с Интервью по терверу
@machinelearning_interview
📌Вкатываемся в Machine Learning с нуля за ноль рублей: что, где, в какой последовательности изучить
Нереально полезная статья с огромным количеством полезных ссылок, ресурсов и всего остального
⏩План статьи
Предварительные знания
├╼ 1.1. Математика: линал, матанализ, матстатистика
╰╼ 1.2. Python, C++, SQL, другие ЯП; алгоритмы и структуры данных
Классическое машинное обучение
Глубокое машинное обучение
├╼ 3.1. Основные материалы
├╼ 3.2. Дополнительные материалы
╰╼ 3.3. Если все же хочется пройти платный курс по Deep Learning...
Инструменты для конкретной роли (вакансии)
Поиск работы
├╼ 5.1. CV / резюме
├╼ 5.2. Где искать вакансии
╰╼ 5.3. Как готовиться к собеседованию
📎 Статья
@machinelearning_interviewПокори цифровой мир и забери крутые призы, но сначала — окажись на код впереди!
Залетай на «Цифровой марафон» от Сбера и «Школы 21» — бесплатный конкурс, который подойдёт новичкам, исследователям и опытным профи. Для разных уровней подготовки будут свои задания и награды: от мерча и гаджетов до поездок на премиум-курорты и миллиона рублей! Участвовать могут все, кому уже исполнилось 18 лет.
В программе: онлайн-игра, тестирование, цифровой диктант и финал в Москве с церемонией награждения победителей. Проверь логику, память и мягкие навыки в онлайн-игре. Выбери свой уровень перед онлайн-тестированием — «Новичок», «Исследователь» или «Эксперт» — и зарабатывай очки на ответах. На цифровом диктанте напиши код решения на языке программирования, который знаешь лучше всего. Далее «Новички» заканчивают марафон и получают призы, а лучшие участники среди «Исследователей» и «Экспертов» попадают в финал.
Успей на проверку своих цифровых навыков — регистрация заканчивается уже 20 апреля. Присоединяйся!
📌Подготовка к собеседованию по ML: ответы на основные вопросы
Неплохая шпаргалка с ответами на популярные вопросы с собеседований по Machine Learning.
Вот некоторые из вопросов, которые тут затрагиваются:
⏩Какие популярные модели ML ты знаешь?
⏩Какие метрики используются в ML для оценки производительности моделей?
⏩Как строится ROC-AUC? В чем суть ROC-AUC?
⏩Расскажи о разделении данных train/test split , а также об использовании кросс-валидации
📎 Ответы на вопросы
@machinelearning_interview
24 апреля приглашаем в кампус Сколтеха, чтобы обсудить актуальные направления исследований в области интеллектуальной, промышленной, коллаборативной и мобильной робототехники, а также компьютерного моделирования и виртуального прототипирования, VR и хаптики и искусственного интеллекта в робототехнике.
Во время мероприятия разберем программы магистратуры, которые готовят будущих специалистов в робототехнике: Инженерные системы, Науки о данных, Передовые производственные технологии.
По традиции покажем кампус, проведём в лаборатории, познакомим с профессорами и ответим на все вопросы о Сколтехе.
Регистрируйтесь
🖥 Решение задач с помощью SQL является важным навыком для дата-саентиста по нескольким причинам:
1. Обработка данных: SQL позволяет эффективно извлекать, фильтровать и обрабатывать данные из баз данных.
2. SQL предоставляет возможность проводить аналитические запросы к данным, выявлять закономерности, тренды и паттерны, что помогает в принятии бизнес-решений.
3. Часто данные хранятся в различных базах данных или системах. Знание SQL помогает дата-саентисту объединять данные из разных источников для создания цельных наборов данных.
4. Написание оптимизированных SQL-запросов позволяет ускорить обработку данных и повысить производительность аналитических процессов.
В целом, знание SQL позволяет дата-саентисту эффективно работать с данными, проводить анализ и извлекать ценные инсайты для бизнеса.
Предлагаю немного попрактиковаться и порешать задачи на знание SQl.
🖇 Решение заданий из тренажера SQL Academy
🖇 Вводный Курс с задачами по работе с Базами данных
🖇В репозитории представлены проекты курса Аналитик данных
🖇Решение задач hackerrank по SQL
🖇100 ключевых Вопросов с собеседований
@machinelearning_interview
⚡ Data Structures Reference
Если вы собираетесь на техническое собеседование, то не забудьте повторить структуры данных и алгоритмы.
Здесь собраны все структуры данных с краткими определениями и красивой визуализацией.
Помимо всего прочего, в гайде перечислены сильные и слабые стороны каждой структуры, трюки и связанные алгоритмы.
Поэтому держите годную статью, для подготовки.
🔗 Гайд
@machinelearning_interview
🌟 Введение в машинное обучение (классические методы машинного обучения)
курс "Введение в машинное обучение" для студентов третьего курса ЭФ ЭМИТ РАНХиГС. В курсе расмотрены практические аспекты классических методов машинного обучения.
▪ Github
@machinelearning_interview
ML-специалисты тут? Вас уже ждут в Тинькофф!
Вместе с результативной командой вы будете:
- Генерировать гипотезы и ставить на их основе эксперименты;
- улучшать качество моделей и ускорять их работу в различных сценариях;
- оформлять эксперименты в воспроизводимые пайплайны;
- создавать масштабные ИТ-продукты.
Откликайтесь на вакансию, а компания обеспечит комфортные условия для работы и возможность воплотить ваши идеи в больших ИТ-проектах вместе с командой единомышленников.
АО «Тинькофф Банк», ИНН 7710140679
🔥 Решение тестового задания на стажировку в Контур Data Science
В данном задании предлагается вам сделать модель, которая поможет отделу госзакупок извлекать нужный кусок текста из документа для того, чтобы сформировать анкету заявки.
То, какой именно фрагмент текста нужно извлечь, зависит от пункта анкеты, соответствующего документу.
Всего в каждом документе, с которыми вы будет работать, есть 1 из 2-х пунктов анкеты, по которым необходимо извлекать кусочки из текста:
▪обеспечение исполнения контракта
▪обеспечение гарантийных обязательств
Соответственно, ваша модель, принимая на вход текст документа и наименование одного из двух пунктов, должна возвращать соответствующий кусочек текста из текста документа.
Тестовое задание
Для выполнения тестового задания требуется разработать модель, которая будет способна по паре текст документа и пункт анкеты извлекать из текста документа нужный фрагмент текста. Обучив модель, добавьте в файл test.json поле extracted_part в том же формате, что и в файле train.json.
Новый файл назовите predictions.json
Подсказка: изучив данные, вы можете заметить, что у части наблюдений отсутствует фрагмент текста к извлечению (пустая строка внутри поля extracted_part с answer_start и answer_end равными нулю). Это означает, что в тексте документа нет нужного фрагмента текста, соответствующего пункту анкеты. Учтите это в обучении вашей модели и при формировании файла с ответами.
Тестовое задание
Для выполнения тестового задания требуется разработать модель, которая будет способна по паре текст документа и пункт анкеты извлекать из текста документа нужный фрагмент текста. Обучив модель, добавьте в файл test.json поле extracted_part в том же формате, что и в файле train.json. Новый файл назовите predictions.json
Подсказка: изучив данные, вы можете заметить, что у части наблюдений отсутствует фрагмент текста к извлечению (пустая строка внутри поля extracted_part с answer_start и answer_end равными нулю).
Это означает, что в тексте документа нет нужного фрагмента текста, соответствующего пункту анкеты. Учтите это в обучении вашей модели и при формировании файла с ответами.
▪Dataset
▪Решение
▪Github
@machinelearning_interview
Хотите углубить свои знания в Data Science? Освойте технологию многоруких бандитов в задаче рекомендаций
Приходите на открытый практический урок от OTUS. Спикер Андрей Канашов — Senior Data Scientist.
На вебинаре вы:
- узнаете про алгоритмы многоруких бандитов и как они применяются на практике для решения задачи рекомендательных систем;- изучите основные алгоритмы UCB и Tompson Sampling;- получите практический опыт применения многоруких бандитов для задачи рекомендации фильмов.
Встречаемся 22 апреля в 19:00 мск в рамках курса «Рекомендательные системы». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджеров OTUS!
Регистрируйтесь прямо сейчас, чтобы не пропустить урок: https://clck.ru/3A7fP3?erid=LjN8KUvNK
🌟 Universal-1 от AssemblyAI превзошел* Whisper от OpenAI
⏩Почти год Whisper от OpenAI удерживал лидерство среди открытых решений для распознавания речи, но теперь пальму первенства среди API сервисов перехватила новая модель Universal-1 от AssemblyAI. Обученная на более чем 12,5 миллионах часов многоязычных аудиоданных, Universal-1 превосходит предыдущего лидера - Whisper от OpenAI, а также другие коммерческие решения по ключевым параметрам.
⏩Universal-1 отличается высоким качеством распознавания речи, обеспечивая на 10% и более точные результаты на английском, испанском и немецком языках по сравнению с лучшими протестированными аналогами. При этом модель генерирует на 30% меньше некорректных вставок слов на обычной речи и на 90% - на фоновых шумах.
*это зависит от конкретных задач, но в некоторых он реально лучше Whisper
📎 Подробнее
@machinelearning_interview
⚡️ 4 Репозитория на Github для подготовки к 4 различным типам собеседований по разработке программного обеспечения:
1. Собеседования по системному дизайну: https://github.com/ashishps1/awesome-system-design-resources
2. Собеседования по низкоуровневому проектированию: https://github.com/ashishps1/awesome-low-level-design
3. Собеседования по программированию: https://github.com/ashishps1/awesome-leetcode-resources
4. Поведенческое собеседование: https://github.com/ashishps1/awesome-behavioral-interviews
@machinelearning_interview
📌Держите 14 типичных вопросов с собеседования по ML
— Как работает градиентный бустинг?
— Почему бустинг градиентный?
— Расскажи про свой опыт?
— Что такое Uplift-моделирование?
— Что за классы трансформируются в Uplift - моделировании?
— Что будешь делать, когда маркетолог попросит сделать модель оттока?
— Какие метрики знаешь для дисбаланса классов?
— Как подобрать отсчеку при перехода с Presicion на Recall?
— Как работает бустрап?
— Как оценить доверительный интервал площади?
— Как оценить метрику, если есть только модели и их оценки?
— Какие бывают схемы кросс-валидации?
— Как по другому называется точность оценки?
— Какая система валидации нужна оценке финального качества модели?
📎 О том, где искать ответы на эти вопросы, можно почитать тут
@machinelearning_interview
18 апреля, 18:00
MLечный путь 2024
Коллеги из @Selectel проводят свой ежегодный митап MLOps и ML-инженеров, на котором обсуждаю инфраструктуру для ML, разбирают сложности, тренды и инструменты построения production ML-систем.
В этом году особое внимание будет уделено актуальному тренду — LLM. Будут доклады про тренды развития генеративного ИИ, перспективы Feast в качестве Feature store, оптимизацию моделей, обеспечение безопасности LLM и сокращение расходов на их инференс. На митапе выступят эксперты из Selectel, СберМаркета, Dstack, Axenix, MIL Team, Raft AI.
Всех участников оффлайн-митапа в Санкт-Петербурге будет ждать неформальное общение со спикерами и экспертами, стенды с GPU-картами, розыгрыш мерча, знакомства и пицца после окончания докладов. Для тех, кто не сможет присоединиться оффлайн, коллеги подготовили онлайн-трансляцию.
Выбирайте подходящий формат участия и регистрируйтесь на мероприятие: https://slc.tl/2a0kk
Реклама ООО «Селектел» erid 2VtzqwGrk2B
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
