Machine learning Interview

前往频道在 Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

显示更多

网络:Machinelearning 俄罗斯21 921 技术与应用4 579...

📈 Telegram 频道 Machine learning Interview 的分析概览

频道 Machine learning Interview (@machinelearning_interview) 俄语语言赛道中的是活跃参与者。目前社区聚集了 30 045 名订阅者，在 技术与应用 类别中位列第 4 579，并在 俄罗斯 地区排名第 21 921 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 30 045 名订阅者。

根据 13 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 40，过去 24 小时变化为 8，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 21.14%。内容发布后 24 小时内通常能获得 7.35% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 6 350 次浏览，首日通常累积 2 208 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 40。
主题关注点： 内容集中在 claude, llm, контекст, hermes, nvidia 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

凭借高频更新（最新数据采集于 14 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

30 045

订阅者

+824 小时

-77 天

+4030 天

6 350

帖子浏览量

~ 2 20824 小时

~ 2 64848 小时

21.14%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

30 037

⚡️ Кластерная якорная регуляризация в рекомендательных системах Интересный разбор от ML-специалистов Яндекса метода регуляризации в рекомендательных системах. Изначально метод Cluster Anchor Regularization предложили ресерчеры из DeepMind. В посте подробно рассказывается про иерархическую кластеризацию и якорную регуляризацию. 🟡 Cluster Anchor Regularization to Alleviate Popularity Bias in Recommender Systems 🟡 Разбор статьи @machinelearning_interview

30 037

⚡️ Бесплатный курс по фундаментальным моделям от Университета Ватерлоо Курс охватывает обширный круг тем, связанных с глубоким обучением и его практическими приложениями. Вот краткий обзор тем: 🔘 Рекуррентные и свёрточные нейронные сети (RNN и CNN). 🔘 Обработка естественного языка (NLP) и компьютерное зрение (CV). 🔘 Механизмы внимания и трансформеры. 🔘 Предобучение языковых моделей. 🔘 Обучение с подкреплением через обратную связь (RLHF). 🔘 Создание мультимодальных моделей. 🔘 Диффузионные модели и генерация изображений. 📌 Курс @machinelearning_interview #datascience #python #machinelearning

30 037

Repost from Machinelearning

🌟 Command-r и Command-r-plus: Обновление 08-2024 мультиязычных LLM. Command-r (35B) и Command-r-plus(104B) редакции 08-2024 - это мультиязычные (23 языка, включая русский) модели с контекстным окном 128К и навыками в генерации текста, переписывании и объяснении программного кода и, особенно, для использования в RAG-конфигурациях. Разработчиками было уделено отдельное внимание обучению генерации ответов по фрагментам документов с цитированием источника, точному обобщению документов и возможности применения в качестве последнего узла RAG-системы. Command-r-08-2024 : повышена производительность при многоязычной генерации с расширенным поиском (RAG), лучше справляется с математикой, кодом и рассуждениями. Она конкурирует по показателям с предыдущей версией Command R+ и показывает на 50 % большую пропускную способность и на 20 % меньшую задержку по сравнению с предыдущей версией Command-r Сommand-r-plus-08-2024 обеспечивает примерно на 50 % большую пропускную способность и на 25 % меньшую задержку по сравнению с предыдущей версией Command-p-plus на идентичной аппаратной платформе. ✔️ Отличия от предыдущей версии и особенности обновления: 🟢улучшение процесса принятия решений о том, какой инструмент использовать в том или ином контексте, а также о том, стоит ли использовать тот или иной инструмент; 🟢улучшенная инструкция, следующая в преамбуле; 🟢улучшен многоязычный поиск RAG на языке пользователя; 🟢улучшенный анализ структурированных данных для манипулирования; 🟢повышена устойчивость к несемантическим изменениям подсказки, таким как пробелы или новые строки; 🟢модели будут отказываться от вопросов, на которые невозможно ответить; 🟢моделям подняли уровень качества цитирования, добавили возможность отключать цитирование для RAG; 🟢в Command-r перенастроен контроль длины рассуждений и форматирования; 🟢новая функция "Режимы безопасности" - строгий и контекстный, оба режима доступны к ручному управлению пользователю (переключение или отключение). Этот режим не отключает встроенную в модель базовую цензуру, он работает как дополнительный цензор. Более подробно про новый режим безопасности можно почитать в документации. Обе модели доступны для скачивания на Huggingface, онлайн через API в Cohere’s hosted API и в Amazon Sagemaker. ▶️Стоимость API: 🟠Command-r-08-20240 : $0.15/1M Input Tokens | $0.60/1M Output Tokens. 🟠Command-r-plus-08-2024 : $2.50/1M Input Tokens | $10.00/1M Output Tokens. 📌Лицензирование : CC-BY-NC-SA-4.0 License + соблюдение C4AI's Acceptable Use Policy. 🟡Demo 🟡Документация 🟡Модель Command R 🟡Модель Command R+ @ai_machinelearning_big_data #AI #CommandR #Cohere #LLM

30 037

🐈‍⬛ A Comprehensive Benchmark of Machine and Deep Learning Across Diverse Tabular Datasets В новом обзоре алгоритмов машинного обучения были проанализированы 20 моделей на 111 датасетах, охватывающих задачи классификации и регрессии. CatBoost, относящийся к группе моделей Tree-based Ensemble (TE), занял первое место, продемонстрировав лучшие результаты на 19 из 111 наборов данных. В то же время XGBoost оказался на 10-й позиции. 🔗 Подробности

30 037

🌟 Опубликована программа конференции Practical ML Conf, которая пройдет 14 сентября Доклады экспертов, заслуживающие отдельного внимания: — Виктор Плошихин, руководитель ML-лаборатории в Yandex Platform Engineering — «AI-инструмент для разработчика: как мы обучали LLM работе с кодом». — Ирина Барская, руководитель службы аналитики и исследований – «Человек и LLM. Как оценивать качество моделей и строить их метрики качества». — Екатерина Глазкова, тимлид команды алайнмента VLM службы компьютерного зрения — «Адаптация VLM под продуктовые требования — как сервис Нейро делали мультимодальным». — Савва Степурин, старший разработчик команды рекомендаций — «Как улучшить знакомые подходы для рекомендации незнакомого — как умная система рекомендаций помогает пользователям Яндекс Музыки открывать новые треки и артистов». — Степан Комков, старший разработчик службы синтеза речи — «Синтез выразительной речи для аудиокниг, прошлое, настоящее и будущее — как GPT и диффузионные модели произвели революции в синтезе речи и как мы это используем». 📎 Можно посетить мероприятие офлайн в Москве или присоединиться онлайн, необходима предварительная регистрация. @machinelearning_interview

30 037

📶 Главные темы линейной алгебры для специалиста по машинному обучению 📌 Крутейшие Стэнфордские материалы по линейной алгебре @machinelearning_interview

30 037

⚡️ LinkedIn_AIHawk — это утилита на основе ИИ, созданная пользователем Reddit, для быстрого поиска работы. Программа адаптирует ваше резюме под описания вакансий и автоматически рассылает их. Результаты впечатляют: за сутки автор отправил 1000 резюме, что привело к 50 приглашениям на собеседования. Бот не только корректирует резюме, но и самостоятельно отвечает на вопросы HR-менеджеров от вашего имени. Установка:


bash
$ git clone https://github.com/feder-cr/LinkedIn_AIHawk_automatic_job_application
$ cd LinkedIn_AIHawk_automatic_job_application
$ pip install -r requirements.txt

▪ Github @machinelearning_interview

30 037

Вот что ждет в Т-Банке ML-разработчиков, кроме ДМС, крутых офисов и других плюшек: Актуальный стек. Здесь следят за трендами и быстро внедряют новое. Общение на «ты». Так проще. Прозрачная система роста. Вы всегда будете знать, какие навыки нужно подтянуть и как получить повышение. Вы окажетесь среди профессионалов, у которых можно многому научиться. А если захотите — можете стать ментором для младших коллег. Больше о вакансиях ML-разработчиков — здесь. Erid:2VtzqvsAxnZ

30 037

📌Полный курс лекций по ML с упором на практические примеры Помимо подробной теории по ML здесь приводятся лабораторные работы с решениями 🟡 Practical Machine Learning @machinelearning_interview

30 037

💪Вам нужен надёжный API! 👉Узнайте как создавать надежные API с проверкой параметров запроса и валидацией сложных данных на бесплатном вебинаре онлайн-курса «Python Developer. Professional» - «FastAPI - валидация параметров запроса с помощью Pydantic»: регистрация На бесплатном вебинаре мы: - Рассмотрим, как FastAPI и Pydantic работают вместе для валидации данных; - Научимся создавать и использовать Pydantic модели для валидации параметров запроса; - Рассмотрим как валидировать сложные и вложенные структуры данных в запросах. Занятие будет полезно Python разработчикам, которым необходимо создавать надежные API с проверкой параметров запроса и валидацией сложных данных. 🤝Понравится урок — продолжите обучение на курсе по спеццене и даже в рассрочку! erid: LjN8K5jmV

30 037

⚡️ Как выбрать Фреймворк для инференса. Полезный чек-лист вопросов для выбора мл фреймворка для настройки моделей. 📌 Github @machinelearning_interview

30 037

Что такое API модели и какие существуют инструменты для его создания? 🔹Разберёмся на практическом открытом уроке «Развертывания моделей машинного обучения - создание API». Рассмотрим как перейти от модели в Jupyter notebook к модели, подготовленной для внедрения ✅ Практика: Реализуем API нашей модели с использованием фреймворка FastAPI и запустим ее в виде web-сервиса. Урок приурочен продвинотому курсу «Machine Learning. Advanced» от Otus. 👉 Регистрация и подробности: https://otus.pw/cpwbO/?erid=LjN8K58gj

30 037

🌟 OmniCast — технология, где нейросети делают более точный прогноз погоды На Хабр вышла статья-разбор новой технологии Яндекс Погоды, работающей на основе нейросетей. OmniCast улучшает локальный прогноз за счет новых источников данных — любительских метеостанций. Благодаря этому сервис стал в 36 раз чаще получать данные о температуре и обновлять прогноз каждые пять минут. 📎 Статья @machinelearning_interview

30 037

🌟 Xorbits — масштабируемый Python фреймворк для задач ML и DS, ориентированный на скорость Xorbits позволяет, к примеру, легко использовать данные для обучения генеративных моделей а также разворачивать обученные модели в своей инфраструктуре. Xorbits может использовать несколько ядер/GPU, может работать на 1 машине или масштабироваться до тысяч машин для поддержки обработки терабайтов данных. Xorbits предоставляет набор полезных библиотек для анализа данных и ML. 🖥 GitHub 🟡 Доки @machinelearning_interview

30 037

🔥Осваиваем алгоритмы обучения с подкреплением и получаем ценные навыки в ML! ⚡29 августа в 20:00 мск. приглашаем на открытый урок "Основные алгоритмы обучения с подкреплением SARSA и Q-learning", где мы разберём: - обучение с подкреплением и его отличия от других подходов ML; - функцию ценности состояния и ценности действия-состояния, их связь и как они помогают агенту учиться; - уравнение Беллмана; - метод SARSA;- метод Q-learning. На практической части мы на Python, «с нуля», без использования каких-либо фреймворков, реализуем два алгоритма обучения с подкреплением и убедимся, что наш агент успешно обучается. 👉Регистрация https://otus.pw/q3nn/?erid=LjN8JyJVr Встречаемся в преддверии старта курса «Reinforcement Learning» в OTUS. Все участники вебинара получат специальную цену на обучение!

30 037

🌟 Упражнения в использовании R для ML Держите несколько практических заданий по ML и их решение на R. Вот некоторые из заданий: — кластеризация и классификация — работа с текстом — определение выбросов в датасете — проведение статистических тестов 🟡 ML exercises @machinelearning_interview

30 037

🌟 Инструмент для ускорения обучения LLM YaFSDP Алгоритм YaFSDP позволяет существенно ускорить процесс обучения больших языковых моделей. Руководитель группы претрейна YandexGPT рассказал, как команда работала над созданием библиотеки, были ли референсы и сложности в процессе. 📎 Ссылка @machinelearning_interview

30 037

Repost from Machinelearning

⚡️ Mistral-NeMo-Minitron-8B-Base: Базовая Minitron 8B от Nvidia NVIDIA и Mistral AI представили модель Mistral-NeMo-Minitron 8B, одну из наиболее точных открытых моделей в своем классе для генерации текста. Mistral-NeMo-Minitron-8B-Base получена в результате обрезки (pruning) и дистилляции Mistral-NeMo 12B. В процессе создания была урезана размерность эмбеддинга и промежуточная размерность MLP (с 14336 до 11520). Комбинация применяемых методов позволила оставить количество attention heads и слоев неизменным. После обрезки было продолжено обучение с дистилляцией, используя корпус данных от Nemotron-4 15B размером 380 миллиардов токенов для получения окончательной модели, что примерно в 40 раз меньше, чем необходимо для тренировки модели такой же плотности с нуля. Корпус обучения (набор данных) по структуре точно такой же, как в недавно представленной другой модели, собранной по такой же методике обрезки и дистилляции. Дата актуальности корпуса обучения - июнь 2023 года. При создании Mistral-NeMo-Minitron 8B использованы техники Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE). Архитектурные характеристики: 🟢total params - 8B; 🟢active non-embedding params - 7.3B; 🟢embedding size - 4096; 🟢attention heads - 32; 🟢MLP intermediate dimension - 11520; 🟢number of layers - 40; 🟢input context - 8000. Поддержка Mistral-NeMo-Minitron-8B-Base в Hugging Face Transformers будет реализована в ближайшем обновлении. Для инференса модели выполните рекомендованные разработчиками инструкции или запустите модель в NeMo v.24.05 Есть неофициальные квантованные (imatrix) GGUF - версии модели в 8 разрядностях, от 1-bit (2. 12 Gb) до 16-bit (16.08 Gb). 📌Лицензирование : NVIDIA Open Model License. 🟡Страница проекта 🟡Модель 🟡Набор GGUF 🟡Arxiv 🟡Demo @ai_machinelearning_big_data #AI #NVIDIA #LLM #ML #Minitron

30 037

🌟 Создание технологии эмоционального синтеза в Алисе Читаем статью о том, как виртуального ассистента Яндекса Алису научили понимать и выражать голосом различные эмоции. Также Алиса может постепенно менять оттенки эмоций в рамках одного диалога с пользователем. Технология доступна в новой колонке Станции Лайт 2. Разработчики рассказали, как создавали подходящую для новых возможностей модель синтеза речи. 🟡 Хабр @machinelearning_interview

30 037

🤗 Hugging Face выпустили пошаговый гайд по созданию и обучению своей личной робо-руки. Компания Hugging Face опубликовала подробную инструкцию по созданию и обучению роботизированной руки. В ней подробно рассказывается, где приобрести необходимые компоненты, как настроить нейронную сеть, а также приведены лекции, иллюстрирующие процесс сборки. Крутой бесплатный курс - рекомендуем) @machinelearning_interview