Data Secrets | Карьера
前往频道在 Telegram
Вакансии Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks Прислать вакансию/сотрудничество: @veron_28 https://telega.in/c/data_secrets_career
显示更多6 926
订阅者
+724 小时
+277 天
+7530 天
帖子存档
🥭 Apple, Amazon и Netflix вылетают из высшей лиги
В сети завирусилась новая аббревиатура MANGOS, в которую входят топ-компании в сфере ИИ.
Некоторые эксперты считают, что если у SpaceX, Anthropic и OpenAI все сложится с выходом на IPO, то вполне можно ожидать появления новой элиты компаний.
Там, где не должно быть сбоев, нужны вы
Т-Банк запускает наем сотрудников в новые дата-центры в Серпухове и Доброграде.
Компания ищет инженеров и ИТ-специалистов, которые готовы обеспечить стабильную работу инфраструктуры и развивать современные ЦОД по последним стандартам.
А еще предлагает:
— работу в современных офисах;
— ДМС со стоматологией, спортзал, консультации психологов, юристов и финансовых специалистов;
— компенсацию питания и спорта;
— специальные тарифы на продукты банка и скидки от партнеров;
— возможность переезда.
Вакансии подойдут и опытным, и начинающим специалистам.
Откликнуться можно прямо сейчас!
AI/Prompt-инженер в Точка
До 320.000₽
Удаленно
Предстоит: Внедрять методы обогащения контекста LLM и отслеживать качество баз знаний; Строить и развивать пайплайн генерации, обработки и контроля качества промптов: structured output, function calling, chain-of-thought, data pipelines, мониторинг стабильности.. Узнать подробнее 🔵
Опыт прохождения интервью MLE
Наткнулись на очень подробный разбор процесса поиска работы ML/Research Engineer в бигтехе. Андрей – специалист с примерно 8 годами опыта в Deep Learning, бывший Tech Lead в Snap, автор около 10 публикаций и патентов в области GenAI.
Подготовка к интервью заняла у него десятки часов. После пятилетнего перерыва в собеседованиях пришлось отдельно освежать LeetCode, ML coding, теорию и ML design. По его наблюдениям, рынок стал заметно сложнее, а на поиск хорошего оффера сейчас разумно закладывать от 3 до 6 месяцев.
Несмотря на сильный бэкграунд, опыт в Snap и публикации, он получил немало отказов еще на этапе CV. Сильное резюме не гарантировало интервью, поэтому стоило активно использовать рефералы, вести список компаний и системно работать с откликами.
По его оценке, около четверти процессов завершились неудачей из-за недостаточного внимания к этапам с менеджерами по найму. Если раньше общение с рекрутерами воспринималось больше как формальность, то оказалось, что они часто оказываются критически важным этапом. Здесь важно уметь кратко рассказать о себе, показать заинтересованность в компании и не занижать собственный опыт.
➡️ Техническое интервью
Что касается технических интервью, то они оказались гораздо менее стандартными, чем ожидалось. Помимо классического LeetCode, компании активно используют ML coding, AI-assisted coding, System Design и специализированные ML-секции. Например, в одних интервью требовалось реализовать части ML-алгоритмов, а в других – писать код вместе с использованием внешних инструментов и обсуждать инженерные компромиссы. Отдельная сложность заключалась в том, что похожие по названию интервью проверяли совершенно разные навыки. Где-то оценивали скорость решения алгоритмических задач, а где-то способность разобраться в незнакомой предметной области и предложить разумное решение. Автор отмечает, что нередко интервьюеры сознательно уходили от шаблонных вопросов и проверяли глубину понимания темы через открытые обсуждения. Еще одно отличие современного процесса в том, что появилось большое количество гибридных форматов. Например, встречались задания на реализацию contrastive loss, проекты по diffusion-моделям и интервью, где нужно было не только написать решение, но и объяснить, как его масштабировать на миллионы пользователей. В таких задачах проверяется не столько знание конкретной технологии, сколько инженерное мышление и способность принимать обоснованные решения.➡️ ML
Секция по ML во многих компаниях была посвящена проверке глубины и широты знаний. Вместо простых вопросов вроде «что такое batch normalization?» интервьюеры часто просили перечислить все известные методы регуляризации, разобрать причины появления NaN во время обучения или рассказать о возможных узких местах при инференсе LLM.➡️ ML Design
ML Design оказался одним из самых распространенных и одновременно самым разнообразным по типам интервью. Кандидату предлагали спроектировать рекомендательную систему, систему генерации контента, предсказание активности пользователей или архитектуру поверх foundation-моделей. Где-то ожидался полный цикл проектирования: от метрик и данных до мониторинга, а где-то нужно было глубоко погрузиться только в модельную архитектуру и процесс обучения. Кстати, именно подготовка к ML Design, по словам автора, дала наибольший прирост результатов на поздних этапах интервью.И напоследок главные советы из статьи: относитесь к поиску работы как к долгосрочному проекту, готовьтесь отдельно к каждому типу интервью, регулярно анализируйте свои ошибки и не недооценивайте нетехнические этапы. Полезно заранее подготовить сильную самопрезентацию, освежить опыт последних нескольких лет и приходить на интервью в хорошем состоянии.
20 июня – Летняя школа ШЕН Центрального университета
Хочешь узнать, как применять математику, код и машинное обучение в биологии и медицине, но не понимаешь, с чего начать?
Приглашаем на Летнюю школу программы «ИИ в биотехе» Школы естественных наук Центрального университета!
Программа реализуется совместно с инженерной школой и факультетом биоинженерии и биоинформатики МГУ, а также индустриальными партнёрами: Genotek и BIOCAD.
Что будет на Летней школе:
— Узнаешь, как ИИ меняет биотех: от анализа геномов до дизайна лекарств с помощью нейросетей;
— Послушаешь лекции от ведущих экспертов: Дмитрия Пензара, Александра Ракитько, Александра Надолинского и победителя конкурса «Биомолекула» Андрея Кузнецова;
— Познакомишься с магистерской программой «ИИ в биотехе»: направления подготовки, курсы, преподаватели, карьерные перспективы;
— Примешь участие в квестах и получишь шанс выиграть фаст-трек на грант до 75% от стоимости обучения.
Фаст-трек – это возможность поступить в магистратуру, минуя онлайн-контест: достаточно пройти собеседование и ревью анкеты.
Как попасть на Летнюю школу?
Регистрация по ссылке.
Отбор участников – до 15 июня. Результаты пришлём на почту.
Место проведения: кампус Центрального университета, м. Маяковская, ул. Гашека, 7
Ждём тебя на Летней школе «ИИ в биотехе»!
AI Agent Engineer в МТС
Удаленно / Офис / Гибрид в Москве
Предстоит: Проектировать Multi-Agent Systems от логики планирования до контроля ответов пользователю и обрабатывать ошибки; Прорабатывать интеграции и управлять памятью агентов.. Узнать подробнее 🔵
Рынок AI-талантов разделился на два лагеря
Данные показывают, что Anthropic, OpenAI и Nvidia подали больше заявлений на получение виз H-1B для новых сотрудников, чем годом ранее. Пока другие техгиганты отстранились от активного найма.
Если в прошлом году бигтех предлагал миллионы за топовых специалистов и активно нанимал, то сейчас, кажется, пыл поубавился. Даже появился антитренд: сокращения, замедление найма и концентрация талантов в небольших командах.
Дело усугубляет то, что нанимать специалистов из-за рубежа стало дороже. Получение визы H-1B теперь может обходиться компаниям более чем в 100 тысяч долларов. Поэтому работодатели все чаще делают ставку на небольшое число наиболее ценных и высокооплачиваемых специалистов.
Если Anthropic, OpenAI и Nvidia стали нанимать больше, то у Meta, Microsoft и Amazon заметно снижение найма. У Google снижение найма иностранных специалистов составило 64% по сравнению с прошлым годом.
ML-инженер в Т1 Холдинг
Удаленно / Офис / Гибрид в Москве
Предстоит: Создавать ценности для продукта с помощью уже существующих моделей и инструментов: AI-функции внутри продукта; tool calling; RAG.. Узнать подробнее 🔵
75% кода сделано ИИ, говорите?
Издание 404 получило доступ к внутренним настроениям сотрудников Google. Как выяснилось, настрой у некоторых разработчиков насчет ИИ не самый позитивный.
Во внутреннем чате поискового гиганта разработчики делятся мемами, которые высмеивают ИИ за галлюцинации, выдуманные факты и неточные результаты. Неожиданно то, что такие посты собирают кучу лайков.
Особенно жесткой критике подвергся внутренний инструмент Jetski, который, если верить все тем же мемам, ненадежен и часто ошибается.
Некоторые сотрудники считают, что ИИ не ускоряет разработку и не уменьшает нагрузку, а наоборот, увеличивает ее. Это сродни тому, что на каждого разработчика повесили джуна, чей код приходится проверять и исправлять.
Senior Архитектор решений (Data/AI)
Удаленно / Офис / Гибрид в Москве
Предстоит: Проектировать целевую архитектуру решений в домене данных, аналитики, интеграций и AI/ML-инфраструктуры с учетом стека: GitLab, ArgoCD, k8s, PostgreSQL, Trino, Iceberg, S3, ClickHouse, Superset, DBT, Open Metadata, Dagster, Debezium, vLLM, Ollama, Langfuse и др... Узнать подробнее 🔵
Культовый вопрос для найма
Если Стив Джобс прославился своим пивным интервью, то в Microsoft 90-х был другой культовый «ритуал».
На собеседовании вам могли задать вопрос: "Почему крышки канализационных люков круглые?".
Сильным считался не тот кандидат, который сразу выдавал готовый ответ, а тот, кто начинал с уточнения. Что-то вроде: «А они точно всегда круглые?» или подобные вопросы.
На самом деле такой вопрос проверял не знание системы канализационных люков, а несколько других качеств: умеет ли человек работать с неопределённостью; задает ли уточняющие вопросы перед тем, как думать над решением; насколько структурирована рассуждения; может ли предложить несколько гипотез и сравнить их между собой.
Именно поэтому вопрос стал легендой Microsoft конца 90-х. Компания тогда делала ставку на «сырой интеллект» и способность решать незнакомые задачи, а не на знание конкретных технологий.
Но вопрос быстро стал популярным. К концу 90-х его уже знали все студенты, а к началу 2000-х он просачился в книги и СМИ, а затем превратился в заученную загадку. Вместо проверки мышления интервьюеры начали проверять, читал ли кандидат нужную книгу. Поэтому Microsoft пришлось отказаться от этого вопроса.
Кстати, позже компании все же стали измерять эффективность подобных «головоломок» и выяснили, что они почти не предсказывают успех сотрудника 😀. Google официально признал brainteasers пустой тратой времени, а Microsoft постепенно отказалась от подобных вопросов в пользу задач на программирование.
Так почему крышки канализаций круглые?
- круглая крышка не может провалиться в круглое отверстие;
- ее не нужно выравнивать перед установкой;
- тяжелую крышку можно катить по земле вместо того, чтобы нести.
Стажер Data Scientist в МТС
Офис в Москве
Предстоит: Работать с большим потоком внешних проектов на построение ML-моделей; Реализовывать новые фичи для ML моделей на основе данных телекома; Делать аналитику по продуктам финтеха (Python, PySpark).. Узнать подробнее 🔵
Разбор задачи с Kaggle
Наткнулись на разбор соревнования Deep Past Challenge на Kaggle. Задача была довольно интересная: необходимо было переводить тексты с староассирийского языка (транслитерации клинописи возрастом около 4000 лет) на английский язык. Вроде бы обычный NLP-кейс, но практике все куда менее тривиально.
Сложность заключалась в том, что участники получили крошечный обучающий набор – всего около 1500 пар переводов. При этом распределения на train и test сильно отличались: обучающие данные были в основном на уровне документов, а тестовые на уровне отдельных предложений. Дополнительно организаторы предоставили большой корпус OCR-данных из научных публикаций, содержащий множество ошибок распознавания, пропусков, шумов и несовпадений.
Решения топ-3 мест в больше степени сводились к тому, кто лучше очистит и подготовит данные или увеличит обучающий набор:
Победители с самого начала отказались от официального train.csv как основы и фактически заново построили корпус из PDF-источников, итеративно улучшая извлечение: постепенно увеличили корпус на несколько тысяч пар по мере исправления ошибок извлечения. При выравнивании они ориентировались на смысловые якоря – числа, шумерограммы, имена собственные – а не на физическое расположение строк на табличке. Финальная система представляла собой ансамбль из 11 моделей ByT5-XL, а для выбора финального перевода использовался MBR-декодинг с комбинацией chrF++, BLEU, Jaccard и эвристик длины. Показательно, что лучшей оказалась подача с минимальной постобработкой – команда сознательно избегала «полировки» результатов после декодирования. Серебряные призёры показали, что в подобных задачах можно обойтись без сложных ансамблей. Их решение было заметно проще с точки зрения моделирования – один ByT5-large без архитектурных изменений, – однако они добыли около 60 тысяч пар предложений из различных источников, включая турецкие, французские и немецкие публикации, которые переводились на английский в процессе извлечения. Бронзовая команда сделала акцент на синтетических данных, но не в смысле простого раздувания корпуса. В их решении синтетика работала как структурированный учебный курс по старо-ассирийскому, а не как просто дополнительный текст. Пайплайн был двухэтапным: сначала continued pre-training для усвоения лексики и морфологии, затем fine-tuning на качественных академических переводах. Финальная система представляла собой ансамбль ByT5-Large и ByT5-XL. Для выбора лучшего перевода использовалась reward-модель на базе Qwen.Практически все сильные команды: ⭐️ занимались восстановлением и очисткой корпуса; ⭐️ боролись с OCR-шумом и ошибками выравнивания; ⭐️ нормализовали тексты и устраняли вариативность написания; ⭐️ использовали LLM в первую очередь для сегментации, фильтрации и подготовки данных, а не как финальную модель перевода; ⭐️ уделяли огромное внимание валидации.
Хакатон по использованию RL в трейдинге с призами до $2,500
Market-Action Arena
Reinforce.fi (ex-Overnight.fi) — проект, разрабатывающий собственные стратегии с использованием reinforcement learning и автоматическим управлением и перераспределением капитала 24/7 — запускает хакатон по моделированию рыночных решений.
Задача:
построить модель, которая на каждом шаге выбирает оптимальное действие (A1–A10) и максимизирует суммарный PnL.
Что внутри:
— market-like данные (анонимизированные признаки)
— последовательности по 1000 шагов
— задача с реальной логикой принятия решений
— скоринг = суммарный PnL
Это хороший кейс, чтобы:
— прокачать ML / RL на прикладной задаче
— добавить сильный проект в портфолио
— поработать с задачей, близкой к реальному трейдингу
Призы:
1 место — $2,500
2 место — $1,500
3 место — $1,000
Старт: конец июня
Длительность: ~1.5–2 месяца
Регистрация:
https://forms.gle/UB71QuyUvp8mSBRo9
Чат хакатона:
https://t.me/+R6lMJ10VXP5hOTI0
Подборка открытых вакансий 🔵
Junior Data Analyst в Skyeng
Гибрид / Офис в Иннополис
Senior CV Engineer в 2GIS
Удаленно
Junior+ Data Scientist в Beeline
Удаленно
SQL разработчик в Ozon
Гибрид / Офис в Москве
Senior ML Engineer в Wildberries
Гибрид / Офис в Москве
Middle Data Scientist в Т-Банк
Гибрид / Офис в Москве
Что такое джоб-скам и как на него не попасться
Только в 2022 году американцы потеряли из-за джоб-скама $267 миллионов. В среднем это около $2000 на человека, причем количество таких случаев растет из года в год. К 2025 году ущерб от этих схем превысил 2 миллиарда долларов.
Что же это такое – джоб-скам? Это обман, при котором вы откликаетесь на вакансию и общаетесь не с реальным работодателем, а с мошенником. Псевдорекрутеры пытается получить от вас либо деньги, либо личные данные, которые якобы нужны для оформления в штат, оплаты стажировки и многого другого.
Если в США это не новая проблема, то в России она только набирает популярность. Представители компаний неоднократно сообщают, что кто-то от их имени вел найм, а жертвы в итоге вместо оффера, получали заблокированный телефон и требование выкупа.
Среди популярных способов джоб-скама выделяют:
➖ персонализированные письма. Это легко проверить: достаточно посмотреть на почтовый домен. У настоящего рекрутера после @ обычно указано название компании;
➖ генерацию поддельных вакансий и компаний. С приходом ИИ создать сайт несуществующей компании, портфолио клиентов и новостную ленту стало проще простого. Поэтому такие компании стоит проверять в реестрах;
➖ собеседования с дипфейками. Вы встречаетесь с ИИ-моделью и проводите обычное собеседование, после чего вам сообщают радостную новость о приеме на работу и просят оплатить оборудование, обучение или что-то еще;
➖ кражу документов под предлогом оформления в штат. Если вы были неаккуратны, возможно, на вас уже оформили микрозайм.
Эксперты отмечают, что чаще от скама страдают специалисты начального уровня 😐
Senior/Middle Data Engineer в Cloud.ru
Офис / Гибрид в Москве
Предстоит: Исследование источников и разработка ETL процессов по загрузке данных из источников в DWH; Разработка и поддержка витрин; Участие в проектировании модели данных хранилища; Разработка, поддержка и оптимизация механизмов работы с DataLake.. Узнать подробнее 🔵
Сколько платит NVIDIA своим разработчикам?
Согласно данным, NVIDIA получила сертификацию примерно на 1200 ролей H-1B в течение первых двух кварталов 2026 финансового года. Это больше, чем 1000 сертификаций за тот же период прошлого года.
Между тем другие техгиганты остудили свой найм. Во втором квартале этого года Google получил около 2200 одобренных H-1B-заявок против 5100 годом ранее, в то время как Amazon сократил этот показатель примерно с 6100 до 4300 за тот же период.
Что касается самой зарплаты без различных бонусов и акций, то программисты могут рассчитывать на доход до 391 тысячи долларов, а исследователи – до 356 тысяч долларов. Если же рассматривать опытных разработчиков, то они могут получать уже от 400 тысяч долларов.
Сам Дженсен Хуанг считает, что иммигранты имеют решающее значение для миссии компании.
Senior/Middle Data Engineer
Офис во Владивостоке
Предстоит: Участие в формировании модели данных; Проектирование и разработка витрины и потоков данных на основе потребностей бизнес-пользователей; Участие в проектах по развитию Data Platform... Узнать подробнее 🔵
AI Agent Engineer в МТС
Удаленно / Офис / Гибрид в Москве
Предстоит: Проектировать Multi-Agent Systems от логики планирования до контроля ответов пользователю и обрабатывать ошибки; Прорабатывать интеграции и управлять памятью агентов; Разрабатывать техническую документацию, архитектурные решения и поддерживать актуальность реестра API-контрактов..... Узнать подробнее 🔵
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
