Machine learning Interview

前往频道在 Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

显示更多

网络:Machinelearning 俄罗斯21 935 技术与应用4 573...

📈 Telegram 频道 Machine learning Interview 的分析概览

频道 Machine learning Interview (@machinelearning_interview) 俄语语言赛道中的是活跃参与者。目前社区聚集了 30 037 名订阅者，在 技术与应用 类别中位列第 4 573，并在 俄罗斯 地区排名第 21 935 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 30 037 名订阅者。

根据 12 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 33，过去 24 小时变化为 -3，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 20.97%。内容发布后 24 小时内通常能获得 8.31% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 6 297 次浏览，首日通常累积 2 497 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 40。
主题关注点： 内容集中在 claude, llm, контекст, hermes, nvidia 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

凭借高频更新（最新数据采集于 13 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

30 037

订阅者

-324 小时

-167 天

+3330 天

6 297

帖子浏览量

~ 2 49724 小时

~ 3 57848 小时

20.97%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

30 044

Какие методы машинного обучения применяются для дизайна белков? Расскажем на открытом уроке, посвященному курсу «Искусственный интеллект в медицине» Узнаете, как современные алгоритмы помогают моделировать, предсказывать и оптимизировать структуру и функции белков. Разберете основные подходы, включая языковые модели для белковых последовательностей и методы генеративного дизайна. ✅ Практика: Знакомство с современными инструментами и библиотеками, используемыми в белковой инженерии 👉 Регистрация и подробности: https://otus.pw/drg4/?erid=2W5zFJUS6YG #реклама О рекламодателе

30 044

✔️ Визуализация 2х архитектур нейронных сетей: классический «ванильный» Transformer (слева) и вариант с «Mixture of Experts» (справа). В обоих случаях есть базовые элементы вроде входных эмбеддингов, механизмов самовнимания (self-attention) и последовательного наложения блоков (N слоёв), но в «Mixture of Experts» внутри каждого блока появляется «router» (маршрутизатор). Этот маршрутизатор решает, какие «эксперты» (специализированные подмодули) должны обработать текущие данные. Таким образом, в отличие от обычного Transformer’а, где у нас один набор весов на слой, в «Mixture of Experts» несколько разных «экспертов» конкурируют или дополняют друг друга для более гибкой и точной обработки информации.

30 044

Для канала https://t.me/machinelearning_interview ⚡️ Вебинар «ML-инженер в 2025 году: навыки, тренды, спрос» Выглядит многообещающе: основатель karpov. courses Анатолий Карпов и сооснователь AI Talent Hub Дмитрий Ботов расскажут о трендах в ML-индустрии и навыках, которые необходимы всем спецам для развития в этой сфере. Вебинар пройдет 26 февраля в 18:00 по московскому времени. Регистрируйтесь здесь. Реклама. Университет ИТМО ИНН:7813045547 erid:2VtzqvpioNN

30 044

✔️ OpenAI запускает deep research. OpenAI полностью откроет улучшенную и обновленную функцию deep research для пользователей ChatGPT Plus, Team, Edu и Enterprise. Вместе с анонсом опубликована карта deep research системы, в которой подробно рассказывается о том, как OpenAI проводили глубокие исследования, оценивали их возможности и риски, а также повышали уровень безопасности. Новая версия поддерживает обработку изображений и улучшает возможности понимания и цитирования загруженных файлов. Пользователи Plus, Team, Enterprise и Edu могут использовать 10 deep research запросов в месяц, а на тарифе Pro месячная квота составит 120 запросов. OpenAI в X @machinelearning_interview

30 044

📌Открытый вебинар «MLFlow — полный контроль над ML-экспериментами» 📚Вы узнаете: 1️⃣ Что такое MLFlow и какие компоненты он содержит; 2️⃣ Как отслеживать и управлять экспериментами с помощью MLFlow; 3️⃣ Как интегрировать MLFlow в ваш ML-пайплайн и ускорить вывод моделей в продакшн; 4️⃣ Возможности MLFlow: трекинг экспериментов, управление моделями и воспроизводимость; 5️⃣ Как эффективно работать с артефактами и версиями моделей. 🎁 Проведем живую демонстрацию, где шаг за шагом внедрим MLFlow в ML-проект! Спикер: Игорь Стурейко — PhD Physical and Mathematical Sciences и опытный руководитель команд. 📅 Дата: 27 февраля в 20:00 (мск) 🆓 Бесплатно. Вебинар в рамках курса «MLOps» 👉 Регистрация открыта: https://otus.pw/NlfR/?erid=2W5zFJ8zWun #реклама О рекламодателе

30 044

Repost from Machinelearning

✔️ 3 день недели Опенсорса от DeepSeek ⭐️ DeepGEMM — это не просто очередная библиотека для матричных умножений, а настоящий «мастер-класс» по оптимизации FP8 GEMM для новейших GPU. Проект написан на CUDA и рассчитан исключительно на использование тензорных ядер архитектуры NVIDIA Hopper, что уже само по себе делает его очень современным 🖥 В основе DeepGEMM лежит идея максимально эффективного выполнения операций умножения матриц с использованием 8-битной точности. Для решения проблемы накопления в FP8 (которое может давать неточные результаты) разработчики внедрили двухуровневое накопление, которое использует возможности CUDA-ядра для повышения точности без потери производительности. Что действительно радует – это минимализм кода. ✔ Ядро библиотеки представлено всего в одном ключевом модуле, состоящем примерно из 300 строк, что позволяет легко разобраться в его работе и даже внести собственные улучшения. При этом все ядра компилируются «на лету» с помощью легковесного JIT-компилятора, так что нет долгого этапа сборки при установке. DeepGEMM поддерживает разные режимы работы: обычные GEMM для плотных моделей, а также группированные операции для моделей типа Mix-of-Experts, где требуется обрабатывать данные в нескольких форматах – как в «континуальном», так и в «masked» виде. Это особенно актуально для современных решений в области глубокого обучения. Оптимизации, заложенные в DeepGEMM, включают использование новых функций Hopper, таких как Tensor Memory Accelerator (TMA) для асинхронной передачи данных, а также тонкую настройку блоковых размеров и оптимизацию инструкций FFMA для лучшего перекрытия вычислений и загрузки данных. Результаты говорят сами за себя: производительность этой библиотеки на ряде тестовых примеров сравнима или даже превосходит решения, построенные на базе CUTLASS. DeepGEMM – это лаконичный и эффективный инструмент, который может послужить отличной базой для исследований и практических разработок в области ускорения вычислений для глубокого обучения. ▪ Github #ai #deepseek #opensource #DeepEP #OpenSourceWeek:

30 044

🔥 Aide — это форк Visual Studio Code, созданный для интеграции AI в процесс программирования! Эта среда разработки предоставляет усовершенствованные функции автоматизации, автодополнения и взаимодействия с кодом, делая написание, анализ и рефакторинг кода более удобным и эффективным. 🔐 Лицензия: AGPL-3.0 🖥 Github

30 044

Практический вебинар для ML-специалистов по автоматической обработке текстов📝 Приходите на прямой эфир 27 февраля в 18:00, где: — обсудим, что представляют из себя методы векторных представлений слов и как их применяют для решения задач NLP — подробно изучим алгоритмы FastText & W2V — на практике с минимальными ресурсами решим задачу классификации текстов Урок приурочен к старту онлайн-курса «Machine Learning. Professional» в OTUS и будет полезен IT-специалистам, которые хотят освоить продвинутые методы ML. ➡️ Участвовать в вебинаре бесплатно: https://otus.pw/Mb9g/?erid=2W5zFH1kioS Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

30 044

🚀Яндекс представил YandexGPT 5 и впервые за 3 года выложил в опенсорс большую языковую модель Основные детали: • YandexGPT 5 Pro — мощная модель нового поколения, уже внедрена в чат с Алисой и доступна через API в Yandex Cloud. • YandexGPT 5 Lite — 8B модель с контекстным окном 32k токенов, впервые за 3 года опубликована в открытом доступе. Выложена без финального этапа обучения и этических фильтров — идеально для исследований и кастомизации. Модели открывают широкие возможности для автоматизации бизнес-процессов: от интеллектуальной обработки обращений в контакт-центрах (выделение ключевых моментов, категоризация, суммаризация для отчетов) до создания ИИ-ассистентов для умного поиска по базам знаний. На сегодняшний день YandexGPT 5 Lite 8B Pretrain в ряде ключевых русскоязычных и англоязычных бенчмарков показывает результаты, превосходящие сопоставимые base-версии моделей Llama и Qwen. ◾️Хабр: https://habr.com/ru/companies/yandex/articles/885218/ ◾️HF: https://huggingface.co/yandex/YandexGPT-5-Lite-8B-pretrain @machinelearning_interview

30 044

Не пропустите главное событие этой весны по ИИ и анализу данных — конференцию Data Fusion 2025. Спикеры из науки, бизнеса и госструктур разберут реальные кейсы применения ML, искусственного интеллекта и DS. Вас ждет: 📊 14 треков и 70+ сессий, посвященных передовым исследованиям и разработкам 🚀 Кейс-стади и воркшопы о ML в различных сферах бизнеса от финтеха и промышленности до медицины 🤝 Обмен опытом с ведущими специалистами отрасли 📍Москва, технопарк «Ломоносов», 16-17 апреля Узнайте о последних разработках в области ML и AI! Регистрируйтесь уже сейчас — https://data-fusion.ru/ #AI #ML #BigData #DataFusion #DataScience #IT — *ИИ — искусственный интеллект *ML — Machine Learning – машинное обучение *Воркшоп — практическое обучение *DS — Data Science — наука о методах анализа данных

30 044

Классный сайт для тренировки навыков SQL. На сайте размещены задачи, которые решаются через базу данных больницы. Уровни сложности разные — от простых запросов с SELECT до по-настоящему сложных. Берём на вооружение для практики! https://www.sql-practice.com/ @machinelearning_interview

30 044

📌Открытый вебинар: «Алгоритмы SARSA и Q-learning — база для изучения Reinforcement Learning» 📚Вы узнаете: + Как работают SARSA и Q-learning и чем они отличаются + Как применить SARSA и Q-learning на практике с Python и OpenAI Gym + Где используют RL: робототехника, финансы, игры Спикер: Игорь Стурейко — кандидат физико-математических наук МГУ, опытный разработчик, руководитель и преподаватель. 📅Дата: 26 февраля в 20:00 (мск) 🆓Бесплатно. В рамках курса «Reinforcement Learning» 👉Регистрация открыта: https://otus.pw/GRgW/?erid=2W5zFGPywNg #реклама О рекламодателе

30 044

Repost from Machinelearning

🌟 scGPT-spatial: модель для анализа данных о пространственной организации клеток в тканях. scGPT-spatial - расширенная версия модели scGPT в помощь ученым-биологам для анализа пространственной транскриптомики. Основная цель scGPT-spatial — интегрировать информацию о пространственной локализации клеток и их транскриптомных профилях с знаниями scGPT для расширения понимания организации тканей и взаимодействия клеток в микроокружении. scGPT-spatial обучалась с с учётом пространственных координат на наборе данных SpatialHuman30M (30 миллионов клеток и спотов из 4 протоколов секвенирования: Visium, Visium HD, MERFISH и Xenium) и использует архитектуру MoE. В тестах scGPT-spatial показала отличные результаты в задачах кластеризации клеточных типов, деконволюции спотов и импутации генной экспрессии. В экспериментах на интеграцию данных из нескольких слайдов и модальностей модель обошла методы PCA и Seurat v4, достигнув показателя AvgBIO 0.86. В задаче деконволюции клеточных типов scGPT-spatial превзошла Tangram и Cell2location, со средним Macro F1 в 0.58, а медианный коэффициент корреляции Пирсона в импутации генной экспрессии составил значение 0.6. Веса модели опубликованы в открытом доступе, а в репозитории проекта на Github - подробная инструкция по настройке окружения для scGPT и ipynb демо-ноутбук инференса. 📌Лицензирование 🟢Код : MIT License. 🟠Модель: CC-BY-4.0 License. 🟡Модель 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI #ML #MedML #ScGPT

30 044

Repost from Machinelearning

🖥 PDF to Podcas- еще один проект преобразования текста в подкасты от NVIDIA Он предназначенный для преобразования PDF-документов в персонализированный аудиоконтент с использованием технологий генеративного ИИ. Ключевые компоненты: - Инструмент преобразования PDF в Markdown: Извлекает содержимое из PDF-файлов и конвертирует его в формат Markdown для дальнейшей обработки. - Сервис создания монологов или диалогов: Обрабатывает Markdown-контент, обогащая или структурируя его для создания естественного аудиоконтента. - Сервис преобразования текста в речь (TTS): Преобразует обработанный контент в высококачественную речь. Преимущества использования: - Персонализация: Возможность адаптации решения под специфические потребности организации, включая брендинг, аналитику, реальное время перевода или интерфейс цифрового человека для повышения вовлеченности. - Конфиденциальность: Решение соответствует требованиям конфиденциальности на всех этапах обработки данных. - Гибкость: Модульная структура позволяет добавлять дополнительные функции, соответствующие потребностям пользователей. - Микросервисы NVIDIA NIM используются для развертывания и масштабирования моделей на GPU. - Модели Llama 3.1 применяются для обработки и генерации текста. - Langchain используется для обработки и интеграции данных. - Docling применяется для парсинга документов. - ElevenLabs предоставляет сервисы преобразования текста в речь. Лицензирование: Использование моделей в этом проекте регулируется NVIDIA AI Foundation Models Community License. ▪ Github: https://github.com/NVIDIA-AI-Blueprints/pdf-to-podcast ▪Project: build.nvidia.com/nvidia/pdf-to-podcast @ai_machinelearning_big_data #nim #tts #pdftopodcast

30 044

⭐️ Назовите методы ускорения обучения на множестве GPU? 📌 Видео

30 044

Repost from Machinelearning

📌 Практическое руководство по "подводным камням" больших языковых моделей с примерами. Открытый препринт книги Тарсиса Соуза (Tharsis Souza), PhD Лондонсого университета, в которой представлен критический анализ проблем и ограничений, возникающих у инженеров и руководителей технических проектов при разработке приложений на основе LLM. Цель книги, по заявлению автора – помочь создавать надежные и безопасные системы на основе LLM, избегая распространенных ошибок. Она ориентирована на разработчиков, технических менеджеров проектов и технических руководителей, стремящихся к углубленному пониманию и преодолению практических трудностей, связанных с внедрением LLM. В отличие от преобладающего дискурса, акцентирующего возможности LLM, книга сосредоточена на практических сложностях и потенциальных ошибках реализации, предлагая подробное руководство по их преодолению. В книге рассматриваются проблемы: структурной ненадежности, управления входными данными, тестирования, аспектов безопасности и элайнмента, зависимости от поставщиков и оптимизации затрат. Книга сопровождается репозиторием с практическими примерами на Python, анализом реальных сценариев и решений. ▶️ Содержание: 🟢Предисловие 🟢О книге 🟢Глава 1: Пробелы в оценках 🟢Глава 2: Структурированный вывод 🟢Глава 3: Управление входными данными 🟢Глава 4: Безопасность 🟢Глава 5: Элайнмент на основе предпочтений 🟢Глава 6: Локальные модели на практике 🟠Глава 7: Парадокс снижения стоимости (не опубликовано) 🟠Глава 8: Границы (не опубликовано) 🟠Приложение: Инструменты и ресурсы (не опубликовано) 🟡Страница проекта 🖥Github.com @ai_machinelearning_big_data #AI #ML #LLM #Book #Tutorial

30 044

Станьте ML-Инженером за 8 месяцев Основная проблема обучений – оторванность от задач реального бизнеса. На курсе учили строить простые модельки, а на работе – сделать по шаблону недостаточно, нужно сразу связать это с бизнесом. Курс-симулятор от Simulative построен таким образом, что вы сразу погружаетесь в настоящую работу: работаете над 10+ проектами из реального бизнеса, учитесь не только писать код, но и понимать, что у алгоритмов «под капотом» Вы изучите математику, Python, научитесь обучать ML-модели, нейронные сети и создавать рекомендательные системы. А также подготовитесь к любому собеседованию – в курс включены тестовые задания, пробные интервью (технические и с HR) и многое другое. С трудоустройством тоже помогут: 87% студентов находят работу в течение двух месяцев с момента начала поиска. А на VIP тарифе преподаватели и HR спроектируют вам персональный трек обучения и за руку доведут до оффера. Часть стоимости курса вы оплачиваете только, когда найдёте работу. Совсем скоро стартует новый поток Узнать подробности

30 044

⭐️ База ресурсов для поиска удаленно работа • Toptal — ИТ фриланс для разработчиков с опытом; • Wellfound — различные вакансии для стартапов и фрилансеров; • RemoteOK — база для разных профессий; • Remotive — удалёнка для айти и маркетинга; • Галилео.ру — для инженеров; • FlexJobs — для поиска подработок; • JustRemote — парт-тайм работа тут; • PowerToFly — для женщин в ИТ и бизнесе; • RemoteWoman — для женщин, ищущих удалёнку в разных областях; • AI Jobs — вакансии в сфере ИИ; • Working Nomads — для цифровых кочевников, вакансии в маркетинге и ИТ; • Simply Hired — поиск вакансий по всему миру; • Angel List — стартапы, удалёнка в технологиях и бизнесе; • Virtual Vocations — удалённые вакансии в разных сферах (администрация, маркетинг, ИТ); • Remote Work — общий сайт; • LinkedIn — ищем удалёнку среди обычных вакансий в профиле; • We Work Remotely — удалёнка для разработчиков, дизайнеров и маркетологов; • Jobspresso — качественные удалённые вакансии для профессионалов; • Jobgether — удалёнка в разных профессиях, от маркетинга до ИТ; • Fiverr — фриланс-платформа для самых разных краткосрочных проектов; • Daily Remote — база удалённых вакансий в ИТ, маркетинге и других сферах; • Crossover — высококачественная удалёнка для разработчиков и менеджеров; • Outsourcely — фриланс для разных профессий; • Upwork — крупнейшая платформа для фрилансеров, включает ВСЕ профессии; • Dribbble — для дизайнеров и креативщиков, в том числе удалённая работа; • Monster.com — вакансии по всему миру, в том числе удалённые; • Angel.co — стартапы, удалёнка в сфере технологий; • Otta — вакансии в стартапах, в том числе удалённые. @machinelearning_interview

30 044

Суперзадача для профи в ML: Разработайте курс вместе с Яндекс Практикумом! Яндекс Практикум — сервис современного онлайн-образования, где обучают актуальным цифровым профессиям. Сейчас мы обновляем курс «Инженер машинного обучения» и собираем команду, которая свежим взглядом сможет посмотреть на материал и сделать контент лучше. Что делает автор курса? Разрабатывает уроки, тесты, чек-листы, а если шире, то его задача так упаковать свой опыт, чтобы заинтересовать, объяснять и мотивировать. Условия сотрудничества — комфортные: ▪︎дополнительный доход, удалёнка, нагрузка от 10 часов в неделю, ▪︎возможность строить программу по своему усмотрению, ▪︎команда, где ценятся как знания, так и мемы. 🔗 Узнать подробности и откликнуться