Tldr: on-device AI lab, от фаундеров Prisma / Reface (100+ mln users), $10 mln raised, fully remote. 2 роли - ML Research Engineer, Inference Engineer
Про компанию:
Mirai — AI lab, разрабатывающая фундаментальную модель и инфраструктуру инференса для AI на устройствах пользователя (on-device AI), что позволяет запускать LLM локально с ультранизкой задержкой.
📱Сегодня экономика AI плохо масштабируется через облачные вычисления и GPU-инференс. Со временем значительная часть AI-нагрузок переместится с серверов непосредственно на устройства пользователей.
🔝Компания основана фаундерами Prisma labs (одними из пионеров on-device ML) и Reface (100+ млн пользователей), а также
привлекла $10 млн в рамках seed-раунда.
Fully remote, distributed-команда (от Лондона до Токио), английский — основной рабочий язык.
Позиция - ML Research Engineer
Основные направления:
— quantization
— speculative decoding
— optimization для LLM inference
— NLP / transformer research
Что предстоит делать:
— исследовать и внедрять новые подходы к оптимизации моделей
— читать и адаптировать research papers по NLP / LLM systems
— писать production-quality ML systems
Нам интересны кандидаты с опытом в:
— Deep Learning / NLP / transformers / LLMs
— ML research / publications / open-source projects
— training, fine-tuning или оптимизации моделей
Будет плюсом:
— research labs / Kaggle / ICPC / олимпиады
— опыт реализации paper → production pipeline
Контакт -
@ann_rish
Позиция - Inference Engineer
Обязанности
— Разрабатывать и оптимизировать основной inference stack, включая низкоуровневые compute kernels.
— Добавлять поддержку новых model architectures, modalities, а также различных hardware/software backends.
— Разрабатывать продвинутые возможности инференса, такие как KV cache paging, continuous batching, quantization.
— Создавать tooling вокруг inference stack, чтобы систему было проще тестировать, понимать и надежно выводить в продакшен.
Требования
— Сильный опыт в low-level systems engineering — вы должны понимать, как работают компьютеры на уровне ниже прикладного программирования (application-level programming).
— Уверенное владение одним из systems languages: Rust, C, C++ или аналогичными.
Будет плюсом
— Качественные open-source contributions.
— Опыт написания высокопроизводительных GPU kernels или работы с Metal, Vulkan, CUDA и аналогичными технологиями.
Контакт -
@armantg