Machine learning Interview
前往频道在 Telegram
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz
显示更多📈 Telegram 频道 Machine learning Interview 的分析概览
频道 Machine learning Interview (@machinelearning_interview) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 30 037 名订阅者,在 技术与应用 类别中位列第 4 573,并在 俄罗斯 地区排名第 21 935 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 30 037 名订阅者。
根据 12 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 33,过去 24 小时变化为 -3,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 20.97%。内容发布后 24 小时内通常能获得 8.31% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 6 297 次浏览,首日通常累积 2 497 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 40。
- 主题关注点: 内容集中在 claude, llm, контекст, hermes, nvidia 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно!
Вопросы - @workakkk
РКН: clck.ru/3FmwRz”
凭借高频更新(最新数据采集于 13 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
30 037
订阅者
-324 小时
-167 天
+3330 天
帖子存档
Какие методы машинного обучения применяются для дизайна белков?
Расскажем на открытом уроке, посвященному курсу «Искусственный интеллект в медицине»
Узнаете, как современные алгоритмы помогают моделировать, предсказывать и оптимизировать структуру и функции белков.
Разберете основные подходы, включая языковые модели для белковых последовательностей и методы генеративного дизайна.
✅ Практика: Знакомство с современными инструментами и библиотеками, используемыми в белковой инженерии
👉 Регистрация и подробности:
https://otus.pw/drg4/?erid=2W5zFJUS6YG
#реклама
О рекламодателе
✔️ Визуализация 2х архитектур нейронных сетей: классический «ванильный» Transformer (слева) и вариант с «Mixture of Experts» (справа).
В обоих случаях есть базовые элементы вроде входных эмбеддингов, механизмов самовнимания (self-attention) и последовательного наложения блоков (N слоёв), но в «Mixture of Experts» внутри каждого блока появляется «router» (маршрутизатор).
Этот маршрутизатор решает, какие «эксперты» (специализированные подмодули) должны обработать текущие данные.
Таким образом, в отличие от обычного Transformer’а, где у нас один набор весов на слой, в «Mixture of Experts» несколько разных «экспертов» конкурируют или дополняют друг друга для более гибкой и точной обработки информации.
Для канала https://t.me/machinelearning_interview
⚡️ Вебинар «ML-инженер в 2025 году: навыки, тренды, спрос»
Выглядит многообещающе: основатель karpov. courses Анатолий Карпов и сооснователь AI Talent Hub Дмитрий Ботов расскажут о трендах в ML-индустрии и навыках, которые необходимы всем спецам для развития в этой сфере.
Вебинар пройдет 26 февраля в 18:00 по московскому времени. Регистрируйтесь здесь.
Реклама. Университет ИТМО ИНН:7813045547 erid:2VtzqvpioNN
✔️ OpenAI запускает deep research.
OpenAI полностью откроет улучшенную и обновленную функцию deep research для пользователей ChatGPT Plus, Team, Edu и Enterprise. Вместе с анонсом опубликована карта deep research системы, в которой подробно рассказывается о том, как OpenAI проводили глубокие исследования, оценивали их возможности и риски, а также повышали уровень безопасности.
Новая версия поддерживает обработку изображений и улучшает возможности понимания и цитирования загруженных файлов. Пользователи Plus, Team, Enterprise и Edu могут использовать 10 deep research запросов в месяц, а на тарифе Pro месячная квота составит 120 запросов.
OpenAI в X
@machinelearning_interview
📌Открытый вебинар «MLFlow — полный контроль над ML-экспериментами»
📚Вы узнаете:
1️⃣ Что такое MLFlow и какие компоненты он содержит;
2️⃣ Как отслеживать и управлять экспериментами с помощью MLFlow;
3️⃣ Как интегрировать MLFlow в ваш ML-пайплайн и ускорить вывод моделей в продакшн;
4️⃣ Возможности MLFlow: трекинг экспериментов, управление моделями и воспроизводимость;
5️⃣ Как эффективно работать с артефактами и версиями моделей.
🎁 Проведем живую демонстрацию, где шаг за шагом внедрим MLFlow в ML-проект!
Спикер: Игорь Стурейко — PhD Physical and Mathematical Sciences и опытный руководитель команд.
📅 Дата: 27 февраля в 20:00 (мск)
🆓 Бесплатно. Вебинар в рамках курса «MLOps»
👉 Регистрация открыта: https://otus.pw/NlfR/?erid=2W5zFJ8zWun
#реклама
О рекламодателе
Repost from Machinelearning
+2
✔️ 3 день недели Опенсорса от DeepSeek
⭐️ DeepGEMM — это не просто очередная библиотека для матричных умножений, а настоящий «мастер-класс» по оптимизации FP8 GEMM для новейших GPU.
Проект написан на CUDA и рассчитан исключительно на использование тензорных ядер архитектуры NVIDIA Hopper, что уже само по себе делает его очень современным 🖥
В основе DeepGEMM лежит идея максимально эффективного выполнения операций умножения матриц с использованием 8-битной точности.
Для решения проблемы накопления в FP8 (которое может давать неточные результаты) разработчики внедрили двухуровневое накопление, которое использует возможности CUDA-ядра для повышения точности без потери производительности.
Что действительно радует – это минимализм кода.
✔ Ядро библиотеки представлено всего в одном ключевом модуле, состоящем примерно из 300 строк, что позволяет легко разобраться в его работе и даже внести собственные улучшения.
При этом все ядра компилируются «на лету» с помощью легковесного JIT-компилятора, так что нет долгого этапа сборки при установке.
DeepGEMM поддерживает разные режимы работы: обычные GEMM для плотных моделей, а также группированные операции для моделей типа Mix-of-Experts, где требуется обрабатывать данные в нескольких форматах – как в «континуальном», так и в «masked» виде. Это особенно актуально для современных решений в области глубокого обучения.
Оптимизации, заложенные в DeepGEMM, включают использование новых функций Hopper, таких как Tensor Memory Accelerator (TMA) для асинхронной передачи данных, а также тонкую настройку блоковых размеров и оптимизацию инструкций FFMA для лучшего перекрытия вычислений и загрузки данных. Результаты говорят сами за себя: производительность этой библиотеки на ряде тестовых примеров сравнима или даже превосходит решения, построенные на базе CUTLASS.
DeepGEMM – это лаконичный и эффективный инструмент, который может послужить отличной базой для исследований и практических разработок в области ускорения вычислений для глубокого обучения.
▪ Github
#ai #deepseek #opensource #DeepEP #OpenSourceWeek:
🔥 Aide — это форк Visual Studio Code, созданный для интеграции AI в процесс программирования! Эта среда разработки предоставляет усовершенствованные функции автоматизации, автодополнения и взаимодействия с кодом, делая написание, анализ и рефакторинг кода более удобным и эффективным.
🔐 Лицензия: AGPL-3.0
🖥 Github
Практический вебинар для ML-специалистов по автоматической обработке текстов📝
Приходите на прямой эфир 27 февраля в 18:00, где:
— обсудим, что представляют из себя методы векторных представлений слов и как их применяют для решения задач NLP
— подробно изучим алгоритмы FastText & W2V
— на практике с минимальными ресурсами решим задачу классификации текстов
Урок приурочен к старту онлайн-курса «Machine Learning. Professional» в OTUS и будет полезен IT-специалистам, которые хотят освоить продвинутые методы ML.
➡️ Участвовать в вебинаре бесплатно: https://otus.pw/Mb9g/?erid=2W5zFH1kioS
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🚀Яндекс представил YandexGPT 5 и впервые за 3 года выложил в опенсорс большую языковую модель
Основные детали:
• YandexGPT 5 Pro — мощная модель нового поколения, уже внедрена в чат с Алисой и доступна через API в Yandex Cloud.
• YandexGPT 5 Lite — 8B модель с контекстным окном 32k токенов, впервые за 3 года опубликована в открытом доступе. Выложена без финального этапа обучения и этических фильтров — идеально для исследований и кастомизации.
Модели открывают широкие возможности для автоматизации бизнес-процессов: от интеллектуальной обработки обращений в контакт-центрах (выделение ключевых моментов, категоризация, суммаризация для отчетов) до создания ИИ-ассистентов для умного поиска по базам знаний.
На сегодняшний день YandexGPT 5 Lite 8B Pretrain в ряде ключевых русскоязычных и англоязычных бенчмарков показывает результаты, превосходящие сопоставимые base-версии моделей Llama и Qwen.
◾️Хабр: https://habr.com/ru/companies/yandex/articles/885218/
◾️HF: https://huggingface.co/yandex/YandexGPT-5-Lite-8B-pretrain
@machinelearning_interview
Не пропустите главное событие этой весны по ИИ и анализу данных — конференцию Data Fusion 2025. Спикеры из науки, бизнеса и госструктур разберут реальные кейсы применения ML, искусственного интеллекта и DS.
Вас ждет:
📊 14 треков и 70+ сессий, посвященных передовым исследованиям и разработкам
🚀 Кейс-стади и воркшопы о ML в различных сферах бизнеса от финтеха и промышленности до медицины
🤝 Обмен опытом с ведущими специалистами отрасли
📍Москва, технопарк «Ломоносов», 16-17 апреля
Узнайте о последних разработках в области ML и AI!
Регистрируйтесь уже сейчас — https://data-fusion.ru/
#AI #ML #BigData #DataFusion #DataScience #IT
—
*ИИ — искусственный интеллект
*ML — Machine Learning – машинное обучение
*Воркшоп — практическое обучение
*DS — Data Science — наука о методах анализа данных
Классный сайт для тренировки навыков SQL.
На сайте размещены задачи, которые решаются через базу данных больницы.
Уровни сложности разные — от простых запросов с SELECT до по-настоящему сложных.
Берём на вооружение для практики!
https://www.sql-practice.com/
@machinelearning_interview
📌Открытый вебинар: «Алгоритмы SARSA и Q-learning — база для изучения Reinforcement Learning»
📚Вы узнаете:
+ Как работают SARSA и Q-learning и чем они отличаются
+ Как применить SARSA и Q-learning на практике с Python и OpenAI Gym
+ Где используют RL: робототехника, финансы, игры
Спикер: Игорь Стурейко — кандидат физико-математических наук МГУ, опытный разработчик, руководитель и преподаватель.
📅Дата: 26 февраля в 20:00 (мск)
🆓Бесплатно. В рамках курса «Reinforcement Learning»
👉Регистрация открыта: https://otus.pw/GRgW/?erid=2W5zFGPywNg
#реклама
О рекламодателе
Repost from Machinelearning
🌟 scGPT-spatial: модель для анализа данных о пространственной организации клеток в тканях.
scGPT-spatial - расширенная версия модели scGPT в помощь ученым-биологам для анализа пространственной транскриптомики. Основная цель scGPT-spatial — интегрировать информацию о пространственной локализации клеток и их транскриптомных профилях с знаниями scGPT для расширения понимания организации тканей и взаимодействия клеток в микроокружении.
scGPT-spatial обучалась с с учётом пространственных координат на наборе данных SpatialHuman30M (30 миллионов клеток и спотов из 4 протоколов секвенирования: Visium, Visium HD, MERFISH и Xenium) и использует архитектуру MoE.
В тестах scGPT-spatial показала отличные результаты в задачах кластеризации клеточных типов, деконволюции спотов и импутации генной экспрессии. В экспериментах на интеграцию данных из нескольких слайдов и модальностей модель обошла методы PCA и Seurat v4, достигнув показателя AvgBIO 0.86.
В задаче деконволюции клеточных типов scGPT-spatial превзошла Tangram и Cell2location, со средним Macro F1 в 0.58, а медианный коэффициент корреляции Пирсона в импутации генной экспрессии составил значение 0.6.
Веса модели опубликованы в открытом доступе, а в репозитории проекта на Github - подробная инструкция по настройке окружения для scGPT и ipynb демо-ноутбук инференса.
📌Лицензирование
🟢Код : MIT License.
🟠Модель: CC-BY-4.0 License.
🟡Модель
🟡Техотчет
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #MedML #ScGPT
Repost from Machinelearning
+2
🖥 PDF to Podcas- еще один проект преобразования текста в подкасты от NVIDIA
Он предназначенный для преобразования PDF-документов в персонализированный аудиоконтент с использованием технологий генеративного ИИ.
Ключевые компоненты:
- Инструмент преобразования PDF в Markdown: Извлекает содержимое из PDF-файлов и конвертирует его в формат Markdown для дальнейшей обработки.
- Сервис создания монологов или диалогов: Обрабатывает Markdown-контент, обогащая или структурируя его для создания естественного аудиоконтента.
- Сервис преобразования текста в речь (TTS): Преобразует обработанный контент в высококачественную речь.
Преимущества использования:
- Персонализация: Возможность адаптации решения под специфические потребности организации, включая брендинг, аналитику, реальное время перевода или интерфейс цифрового человека для повышения вовлеченности.
- Конфиденциальность: Решение соответствует требованиям конфиденциальности на всех этапах обработки данных.
- Гибкость: Модульная структура позволяет добавлять дополнительные функции, соответствующие потребностям пользователей.
- Микросервисы NVIDIA NIM используются для развертывания и масштабирования моделей на GPU.
- Модели Llama 3.1 применяются для обработки и генерации текста.
- Langchain используется для обработки и интеграции данных.
- Docling применяется для парсинга документов.
- ElevenLabs предоставляет сервисы преобразования текста в речь.
Лицензирование:
Использование моделей в этом проекте регулируется NVIDIA AI Foundation Models Community License.
▪ Github: https://github.com/NVIDIA-AI-Blueprints/pdf-to-podcast
▪Project: build.nvidia.com/nvidia/pdf-to-podcast
@ai_machinelearning_big_data
#nim #tts #pdftopodcast
Repost from Machinelearning
+1
📌 Практическое руководство по "подводным камням" больших языковых моделей с примерами.
Открытый препринт книги Тарсиса Соуза (Tharsis Souza), PhD Лондонсого университета, в которой представлен критический анализ проблем и ограничений, возникающих у инженеров и руководителей технических проектов при разработке приложений на основе LLM.
Цель книги, по заявлению автора – помочь создавать надежные и безопасные системы на основе LLM, избегая распространенных ошибок.
Она ориентирована на разработчиков, технических менеджеров проектов и технических руководителей, стремящихся к углубленному пониманию и преодолению практических трудностей, связанных с внедрением LLM.
В отличие от преобладающего дискурса, акцентирующего возможности LLM, книга сосредоточена на практических сложностях и потенциальных ошибках реализации, предлагая подробное руководство по их преодолению.
В книге рассматриваются проблемы: структурной ненадежности, управления входными данными, тестирования, аспектов безопасности и элайнмента, зависимости от поставщиков и оптимизации затрат.
Книга сопровождается репозиторием с практическими примерами на Python, анализом реальных сценариев и решений.
▶️ Содержание:
🟢Предисловие
🟢О книге
🟢Глава 1: Пробелы в оценках
🟢Глава 2: Структурированный вывод
🟢Глава 3: Управление входными данными
🟢Глава 4: Безопасность
🟢Глава 5: Элайнмент на основе предпочтений
🟢Глава 6: Локальные модели на практике
🟠Глава 7: Парадокс снижения стоимости (не опубликовано)
🟠Глава 8: Границы (не опубликовано)
🟠Приложение: Инструменты и ресурсы (не опубликовано)
🟡Страница проекта
🖥Github.com
@ai_machinelearning_big_data
#AI #ML #LLM #Book #Tutorial
Станьте ML-Инженером за 8 месяцев
Основная проблема обучений – оторванность от задач реального бизнеса. На курсе учили строить простые модельки, а на работе – сделать по шаблону недостаточно, нужно сразу связать это с бизнесом.
Курс-симулятор от Simulative построен таким образом, что вы сразу погружаетесь в настоящую работу: работаете над 10+ проектами из реального бизнеса, учитесь не только писать код, но и понимать, что у алгоритмов «под капотом»
Вы изучите математику, Python, научитесь обучать ML-модели, нейронные сети и создавать рекомендательные системы. А также подготовитесь к любому собеседованию – в курс включены тестовые задания, пробные интервью (технические и с HR) и многое другое.
С трудоустройством тоже помогут: 87% студентов находят работу в течение двух месяцев с момента начала поиска.
А на VIP тарифе преподаватели и HR спроектируют вам персональный трек обучения и за руку доведут до оффера. Часть стоимости курса вы оплачиваете только, когда найдёте работу.
Совсем скоро стартует новый поток
Узнать подробности
Станьте ML-Инженером за 8 месяцев
Основная проблема обучений – оторванность от задач реального бизнеса. На курсе учили строить простые модельки, а на работе – сделать по шаблону недостаточно, нужно сразу связать это с бизнесом.
Курс-симулятор от Simulative построен таким образом, что вы сразу погружаетесь в настоящую работу: работаете над 10+ проектами из реального бизнеса, учитесь не только писать код, но и понимать, что у алгоритмов «под капотом»
Вы изучите математику, Python, научитесь обучать ML-модели, нейронные сети и создавать рекомендательные системы. А также подготовитесь к любому собеседованию – в курс включены тестовые задания, пробные интервью (технические и с HR) и многое другое.
С трудоустройством тоже помогут: 87% студентов находят работу в течение двух месяцев с момента начала поиска.
А на VIP тарифе преподаватели и HR спроектируют вам персональный трек обучения и за руку доведут до оффера. Часть стоимости курса вы оплачиваете только, когда найдёте работу.
Совсем скоро стартует новый поток
Узнать подробности
⭐️ База ресурсов для поиска удаленно работа
• Toptal — ИТ фриланс для разработчиков с опытом;
• Wellfound — различные вакансии для стартапов и фрилансеров;
• RemoteOK — база для разных профессий;
• Remotive — удалёнка для айти и маркетинга;
• Галилео.ру — для инженеров;
• FlexJobs — для поиска подработок;
• JustRemote — парт-тайм работа тут;
• PowerToFly — для женщин в ИТ и бизнесе;
• RemoteWoman — для женщин, ищущих удалёнку в разных областях;
• AI Jobs — вакансии в сфере ИИ;
• Working Nomads — для цифровых кочевников, вакансии в маркетинге и ИТ;
• Simply Hired — поиск вакансий по всему миру;
• Angel List — стартапы, удалёнка в технологиях и бизнесе;
• Virtual Vocations — удалённые вакансии в разных сферах (администрация, маркетинг, ИТ);
• Remote Work — общий сайт;
• LinkedIn — ищем удалёнку среди обычных вакансий в профиле;
• We Work Remotely — удалёнка для разработчиков, дизайнеров и маркетологов;
• Jobspresso — качественные удалённые вакансии для профессионалов;
• Jobgether — удалёнка в разных профессиях, от маркетинга до ИТ;
• Fiverr — фриланс-платформа для самых разных краткосрочных проектов;
• Daily Remote — база удалённых вакансий в ИТ, маркетинге и других сферах;
• Crossover — высококачественная удалёнка для разработчиков и менеджеров;
• Outsourcely — фриланс для разных профессий;
• Upwork — крупнейшая платформа для фрилансеров, включает ВСЕ профессии;
• Dribbble — для дизайнеров и креативщиков, в том числе удалённая работа;
• Monster.com — вакансии по всему миру, в том числе удалённые;
• Angel.co — стартапы, удалёнка в сфере технологий;
• Otta — вакансии в стартапах, в том числе удалённые.
@machinelearning_interview
Суперзадача для профи в ML:
Разработайте курс вместе с Яндекс Практикумом!
Яндекс Практикум — сервис современного онлайн-образования, где обучают актуальным цифровым профессиям.
Сейчас мы обновляем курс «Инженер машинного обучения» и собираем команду, которая свежим взглядом сможет посмотреть на материал и сделать контент лучше.
Что делает автор курса?
Разрабатывает уроки, тесты, чек-листы, а если шире, то его задача так упаковать свой опыт, чтобы заинтересовать, объяснять и мотивировать.
Условия сотрудничества — комфортные:
▪︎дополнительный доход, удалёнка, нагрузка от 10 часов в неделю,
▪︎возможность строить программу по своему усмотрению,
▪︎команда, где ценятся как знания, так и мемы.
🔗 Узнать подробности и откликнуться
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
