uk
Feedback
Start Career in DS

Start Career in DS

Відкрити в Telegram

Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям. Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :) Автор: @RAVasiliev № 5141779667

Показати більше

📈 Аналітичний огляд Telegram-каналу Start Career in DS

Канал Start Career in DS (@start_ds) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 11 674 підписників, посідаючи 10 724 місце в категорії Технології та додатки та 56 490 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 11 674 підписників.

За останніми даними від 05 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на 4, а за останні 24 години на -2, загальне охоплення залишається високим.

  • Статус верифікації: Не верифікований
  • Рівень залученості (ER): Середній показник залученості аудиторії становить 31.36%. Протягом перших 24 годин після публікації контент зазвичай збирає N/A% реакцій від загальної кількості підписників.
  • Охоплення публікацій: В середньому кожен допис отримує 0 переглядів. Протягом першої доби публікація в середньому набирає 0 переглядів.
  • Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 0.
  • Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як learning, llm, хабре, ментор, объяснение.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям. Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :) Автор: @RAVasiliev № 5141779667

Завдяки високій частоті оновлень (останні дані отримано 06 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

11 674
Підписники
-224 години
-27 днів
+430 день
Архів дописів
🏆 ML-соревнование на стыке ML, роботов и науки Ребята из CayleyPy делают крутую штуку на стыке ML/RL, математики и робототехники. Цель проекта - искать короткие решения для сложных головоломок. Один из главных кейсов - робот, который должен побить мировой рекорд по сборке Мегаминкса: это такая сложная версия кубика Рубика в форме додекаэдра. Для этого запустили соревнования на Kaggle. Суть простая: даны состояния пазлов, нужно найти как можно более короткие решения. Соревнования: • Мегаминкс https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard • Кубик Рубика 3x3x3 https://www.kaggle.com/competitions/cayleypy-ihes-cube • Кубик Рубика 4x4x4 https://www.kaggle.com/competitions/cayley-py-444-cube Призовой фонд уже больше 150 000 ₽ и будет расти. Плюс проект научный и open-source: можно не только порешать крутую задачу, но и потенциально поучаствовать в публикациях. GitHub: https://github.com/cayleypy/cayleypy Чат: @starkitmega По вопросам: @alexander_v_c

🔥 Итоги розыгрыша билетов на AHA'26 По итогам выбрали аж трёх победителей! В первой итерации великого рандома выбрали @catdem @JohnDen (комменатрии 1 и 9), но комментарий 1 на грани фола (автор не написал какой доклад интересно послушать), поэтому его автору мы предложим персональные условия выигрыша 🙂 Провели вторую итерацию розыгрыша чтобы доразыграть ещё один полный билет, здесь счастливчиком оказался @Krakatau27 (комментарий 6) Ребята, поздравляем вам и увидимся на AHA! За деталями к вам придут в личку 🙂

🔥АНА’26: конференция о продуктовой аналитике, ИИ и масштабировании цифровых продуктов 22 мая в Москве в седьмой раз пройдет АНА - техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд. Программа покрывает весь цикл: от базовых вещей (MLOps, продакшн) до того, что сейчас на хайпе - LLM, AI-агенты и архитектура современных AI-систем Среди ключевых тем: • R&D и экономика масштабирования продуктов • Методы системного снижения стоимости проверки гипотез • Управление ассортиментом и спросом в retail и e-commerce • Архитектура прикладного AI и ML&AI-инженерия • Разработка AI-first продуктов и open source AI-агенты для бизнеса • Data platform и инженерия доверия к данным Специально для читателей Start Career in DS: 1. Разыграем два очных билета на АНА'26 среди тех, кто откомментирует этот пост. Напишите в комментариях какой доклад особенно хотите послушать и почему 🙂 Розыграш проведём 03.05 в 12:00 по мск 2. Сделали промик на 15% на любой формат участия: STARTDS15 Увидимся на AHA, зарегистрироваться можно тут 🙂 А программу посмотреть - тут

Repost from Young&&Yandex
🐣 Рома Васильев зовёт в Школу аналитиков-разработчиков Этим летом Рома руководит ШАР и тизерит часть лекций в ролике.
Будем изучать продуктовую, техническую, маркетинговую аналитику и задачи — по Python, SQL, терверу и матстату. А ещё разберём, как AI может помочь аналитику-разработчику.
Запиши полезные рекомендации для подготовке к отбору и оставляй заявку: yandex.ru/yaintern/schools/analytics

Yandex Weekend Offer Analytics: 28 февраля - 1 марта Судя по опросу выше, карьерные вопросы тут многим актуальны 🙂 Поэтому делюсь реально классной возможностью. За 2 дня можно получить офер в Яндекс. Формат: - До 25 февраля регистрируетесь, с вами связывается рекрутер. - 28 февраля — две технические секции: - аналитическая задача (матстат, логика) - алгоритмическая задача (алгоритмы и структуры данных). - 1 марта — знакомство с командами и офер. Ищут аналитиков с опытом на Python от 3 лет. Направления: продуктовая аналитика, дата-аналитика (вокруг технологий, качества моделей и процессов данных), Data Science. Нужны Python и SQL, плюс профильные знания по профессии. Команды разные: Алиса, автономный транспорт, R&D, коммерция, безопасность. Нанимаем там к слову в том числе и к нам в межнар 🙂 Если вы давно хотели в Яндекс, но боитесь долгих процессов - это самый быстрый трек. Зарегистрироваться можно тут

Мне интересно читать про:
Anonymous voting

Привет всем подписчикам Start Career in DS! На связи Рома Васильев (@ravasiliev_ch) Этот канал был создан ещё в далёком 2020 году (пруфы!) чтобы выкладывать полезные для студентов материалы для подготовки к собеседованиям. С тех пор Start Career разросся до 11 тысяч подписчиков, и я точно знаю, что многие из подписчиков активно использовали материалы из канала чтобы изучать Data Science, готовиться к интервью и просто узнавать новое 🙂 Однако я также знаю, что многие подписчики тут уже совсем не про "Start career ...", кто-то за время существования канала успел вырасти от стажёров до синьоров / руководителей отделов DS. Так что можно сказать что мы росли вместе! Кстати, на продвинутые менеджерские темы / про современные технологии я периодически пишу в канале @ravasiliev_ch Последние несколько лет посты делались с переменных успехом, хочется понять что вам (нашим любимым подписчикам!) интереснее было бы видеть в этом канале. Хочу возродить канал и делать полезные материалы для вас 🙂

🎬 Wink AI Challenge – хакатон про ИИ и кино Случай, когда ML можно применить в творческом направлении, а именно – в производ
🎬 Wink AI Challenge хакатон про ИИ и кино Случай, когда ML можно применить в творческом направлении, а именно – в производстве сериалов и фильмов. На Wink AI Challenge участники создадут ИИ-сервисы, которые помогут ускорить кинопроизводство: анализировать сценарии, визуализировать сцены и классифицировать контент по возрастным рейтингам. Основное: – Регистрация до 31 октября на Codenrock – Призовой фонд 1 125 000 ₽ – Финал в Москве, двум участникам оплатят перелёт и проживание – Оценивать будут продюсеры фильмов «Слово пацана», «Ёлки», «Фишер» и других проектов К участию приглашают ML-инженеров, backend- и frontend-разработчиков, DevOps, MLOps и мультимедиа-специалистов. Каждая команда получит реальный сценарий и задачу – создать сервис, который сделает кинопроизводство быстрее и точнее. Если хочется сделать проект на стыке ML и креатива – хороший повод попробовать: https://cnrlink.com/winkaichallengestartds

🏆 Yandex Cup 2025 по аналитике, ML и другим дициплинам Автор этого канала в этом году руководит треком по аналитике и гарантирует, что задачки там будут очень интересные :) Что там будет:
Призовой фонд 12 млн рублей. Участник может выиграть до 500 тысяч Финал в Стамбуле. +1 приключение и возможность ощутить дух международных соревнований Буст карьеры. Лучших ребят ждёт упрощённый отбор в Яндекс Нетворкинг и вайб турнира. В одном месте соберутся сильнешие ребята из своих областей
Уже скоро будут первые туры, приходите регистрироваться вот сюда: yandex.ru/cup

🚀 Ребята из Авито проводят открытое собеседование на DS’a! 13 октября в 18:30 пройдет открытое интервью с реальным кандидато
🚀 Ребята из Авито проводят открытое собеседование на DS’a! 13 октября в 18:30 пройдет открытое интервью с реальным кандидатом, на котором коллеги покажут всё изнутри – от постановки задачи до того, как дается финальный фидбэк. Разберут кейс из собеседований, обсудят влияние ML-решений на продукт и покажут, по каким факторам отбирают кандидатов. Интервью проводят руководители DS-направлений Авито - Максим Каширин и Александр Ледовский. Кандидат - Дмитрий Савелко, LLM-инженер и автор блога Еbout Data Science. Участие бесплатное, зарегистрироваться можно по ссылке

Готовимся к стажировке вместе. Часть 2: почему полезно общаться с рекрутерами? Многие будущие стажеры воспринимают взаимодействие с рекрутером исключительно как возможность узнать, на какое время назначена секция или какая обратная связь получена от прошедшей секции. Чтобы лучше подготовиться и проявить себя на секциях, важно использовать переписку с рекрутером как способ задать вопросы и подробнее узнать о предстоящих этапах. Спойлер: в этом нет ничего странного и рекрутеры реагируют на такое спокойно или даже положительно) Подготовили для вас список вопросов, которые полезно задать рекрутеру Перед теоретическими секциями спроси:Вопросы из какой области будут на интервью, чего стоит ожидать -> будешь знать, что стоит повторить перед секцией - не будет паники или неопределенности ❓Какие материалы лучше прочитать/повторить, чтобы лучше проявить себя на секции -> рекрутеры часто рекомендуют материалы и короткие курсы по темам, которые часто спрашивают на собесах ❓Нужно ли будет решать задачи по математике и терверу? Если да, то по каким темам чаще всего спрашивают? -> повторив темы, можно заранее порешать задачки, чтобы освежить в памяти использование формул на практике и не пытаться долго вспомнить на собесе ❓Какой длительности будет секция и сколько вопросов обычно на ней задают -> зная тайминги, лучше понимаешь, сколько времени уделять на ответ, чтобы успеть ответить на все вопросы интервьюера, но приэтом, чтобы ответы была полными и раскрывающими знания Перед секцией с лайв-кодингом (алгоритмы или SQL):Какого уровня будут задачи на секции (для алгоритмов можно уточнить уровня easy, medium или hard литкода, для SQL - с использованием оконок или без них) -> зная уровень, понимаешь, на что нацеливаться и нарешивать, готовясь к собесу ❓В какой среде можно писать код во время собеса -> у каждой компании свои ограничения во время секций: кто-то предоставляет лишь блокнот без подсветки синтаксиса, кто-то предоставляет блокнот с подсветкой, некоторые компании разрешают писать в привычной среде и демонстрировать экран. Заранее зная ограничения, к ним можно подготовиться и привыкнуть, чтобы во время секции не испытывать дискомфорт и сконцентрироваться исключительно на решении задачи ❓Какое время отводится на решение задач, сколько их будет, и можно ли пользоваться поисковиком во время секции -> у каждой компании свои правила проведений код-секций, поэтому важно понимать их заранее, чтобы выстроить стратегию решения Перед финалом с командой спроси:Из какого бизнес-подразделения команда, чем она занимается -> ищем в медиа-пространстве статьи, чтобы подробнее узнать про команду, быть в контексте. Если информации нет или недостаточно, идем в гпт, чтобы подробнее узнать, чем такие команды могут заниматься и какие вопросы на финале могут задавать ❓Какие вызовы и цели сейчас стоят перед командой -> зная это, можно понять, какого стажера сейчас ищет команда и какие навыки в приоритете, чтобы показать их на собеседовании ❓Какая структура у финала: рассказ о себе, обсуждение предстоящих задач, генераций идей по кейсу в риал-тайме или что-то другое -> если есть решение кейса, обязательно повтори бизнес-метрики и погрузись в материалы из подборки про развитие бизнес-видения. Для рассказа о себе - заранее подготовь убедительный спич, подсветив, все важное о себе и своих достижениях, опыте. Составь список вопросов, которые хочешь задать команде о своих будущих задачах и треке развития: так команда убедится, что тебе действительно интересно то место, куда ты идешь
На самом деле, есть еще немало секретов прохождения на стажировку, которые не выкладывают публично в каналах. Поэтому, если хотите узнать больше – пишите в личку!
Ставьте 🔥, если хотите такой же подробный пост про первичный созвон с HR

🎓 Готовимся к стажировке вместе. Часть 2: Пробное собеседование Заботать алгоритмы, тервер, метрики и прочее - это лишь часть дела. Главное – это уметь продемонстрировать свои знания и навыки на собесе. И чтобы натренировать этот полезный скилл, можно делать как минимум три вещи: 1. Смотреть, как кто-то проходит собеседования 2. Проходить собеседования самим 3. Симулировать прохождение собеседования – Посмотреть, как проходят собеседования, можно, например, по ссылкам из нашего поста: раз, два – Проходить собеседования самим рискованнее, ведь в множестве компаний есть фризы на найм после неудачных собеседований. Да и попасть на собеседование бывает тяжело – Третий пункт многие недооценивают, но пробные собеседования снижают стресс во время прохождения реального интервью, выявляют слабые места, отрабатывают структуру ответа и помогают понять ожидания интервьюера Кто может провести такое собеседование? Наилучший вариант отработать пробное собеседование со своим ментором или более опытным коллегой/товарищем. Также бигтехи иногда проводят такую акцию в рамках своих мероприятий Но если такой возожности нет, нейронки в помощь! Подготовили для вас два самых рабочих варианта: 1) Диалог с ГПТ (можно использовать бесплатный deepseek / любую другую llm-ку) Пишете промт:
Привет! Мне предстоит [укажите названии секции] в компанию [укажите название компании и команды, если уже знаете,] на позицию [укажите роль и грейд, на который будете собеседоваться]. Стань моим интервьюером, чтобы я лучше мог подготовиться к нему. Задавай мне вопрос, я тебе в чат буду писать ответ, затем давай мне краткий фидбэк по нему.
Если не хотите писать вручную, есть wispr flow – транскрибатор с бесплатным пробным периодом 2) Google Ai stream. Пишете такой же промпт, но нужно уточнить про общение голосом. Затем общаетесь с ассистентом в режиме реального интервью, где и вы, и он разговариваете голосом. 3) Есть уже готовые сервисы подготовки к собесам на основе нейронок, например, @DataismPrepBot или https://prepfully.com, можно попробовать их Если хотите третью часть про подготовку к стажировке, ставьте огоньки 🔥 под этот пост, и пишите в комментарии, про что должна быть следующая часть!

Открыта регистрация на E-CUP 2025 — ML-соревнование от Ozon Формат — онлайн, участвовать можно одному или в команде до 5 чело
Открыта регистрация на E-CUP 2025 — ML-соревнование от Ozon Формат — онлайн, участвовать можно одному или в команде до 5 человек. Победители делят между собой 7.2 млн ₽. Защита решений в финале возможна как в онлайне, так и очно 13 сентября на IT-конференции E-CODE (проезд и проживание оплачивает организатор). Всего 3 трека: — Рекомендации: предсказание следующей покупки пользователя — Логистика: автопланирование курьеров — Контроль качества: автоматическое выявление поддельных товаров Задачи на основе реальных данных, с фокусом на масштаб и практику. Будет возможность пообщаться с разработчиками и аналитиками из Ozon Tech. Мерч и другие подарки тоже обещают! Регистрация до 17 августа включительно: ссылка

Всем привет! Хочу снова порекомендовать канал @zasql_python Канал ведет Senior Product Analyst в 🛒, ранее работал в Яндекс 🍫 Лавке, 💙 Популярные посты Шпаргалки по SQL Роадмап для продуктового аналитика / аналитика данных Для чего нужен ML в аналитике Личные размышления автора Визибилити в организацииВнезапные влетыПоиск роста для аналитикаВстречи или работа: где найти золотую середину аналитика? Блок продуктовых кейсов: пост1, пост2, пост3 Подписывайтесь, здесь много всего интересного для аналитиков.

🎓 Готовимся к стажировке вместе. Часть 1: Корпорации больше не берут джунов? Крупные компании все реже нанимают джуниоров. Вместо этого — активно набирают стажеров, расширяют программы стажировок и переманивают мидлов. Почему так? 💸Компании предпочитают растить кадры «с нуля» через стажировки и оставлять лучших себе, полностью закрывая внутреннюю потребность в джунах 💸За чуть большие деньги проще взять мидла с 1-2 годами опыта, чем учить джуна с риском, что он уйдет через полгода Что делать если вы джун и хотите поскорее ворваться в работу? ✅Ищите и откликайтесь на стажировки — это новый вход в профессию. Проще пройти стажировку за 3 месяца, чем полгода бесконечно скролить HH и проходить собесы ✅ Растите опыт через стартапы, пет-проекты (о них мы писали выше) и хакатоны А прямо сейчас открыт отбор на стажировку по аналитике, DS и ML здесь: 💸 Альфа-Банк 💸 OzonTech 💸 Яндекс 💸 T1 💸 ВТБ 💸 X5Tech 💸 t2 (ex. Tele2) 💸 Wildberries Ставьте ❤️, если вам интересны стажировки, и 🔥, если вы уже активно готовитесь и подаетесь на стажи, и задавайте интересующие вас вопросы в форме – ответим на них в одном из следующих постов или придем к вам в лс)

👩‍💼 Как развить бизнес видение? Бесспорно, для аналитиков любого грейда крайне важно помимо хард скиллов, также и бизнес видение. Не зря бигтехи проверяют и то, и другое на разных этапах собеса. Поэтому прокачивать его так же нужно, как и нарешивать литкод или задачки по терверу. Небольшой список общих советов: 👉 Ходите на конференции, где разбираются реальные кейсы: матемаркетинг, aha!, датафест 👉 Читайте каналы по интересующей вас тематике, а еще полезно почитать разные каналы с отчетностями компаний, чтобы понять, на чем они зарабатывают и на какие метрики смотрят, например, @businessincognita и @expertosphere 👉 Читайте книги, которые развивают бизнес-видение, например, The Data Detective и How To Measure Anything. Отдельно рекомендуем "Спроси маму" Роба Фитцпатрика, она научит вас правильно задавать вопросы клиенту и понимать, что реально он хочет, а в чем вообще не заинтересован. Саммари есть на хабре, но админы читали целиком и вам советуют А теперь подборка, если вам нужно все и сразу за короткий срок перед собесом: 🔎 Школа менеджеров Яндекса: возможность заглянуть в закулисье яндекса, построения продукта и принятия решений в нем 🔎 Платформа growth.design, на которой в формате комиксов разбираются различные продуктовые кейсы мировых топ-компаний. Узнали про нее от Макса из Заскуль Питона, оч советуем подробнее про эту крутую платформу прочитать у него. 🔎 Блог GoPractice – много классных бесплатных статей про продуктовый менеджмент, маркетинг и аналитику. А если понравится, то у них есть и платные симуляторы 🔎 Блоги компаний. Например, Авито, Яндекса, Альфа-банка. Выбирайте статьи, относящиеся к бизнес-части и прокачивайте насмотренность по принятию решений, которые влияют на то, что вы видите в своем смартфоне. Отдельно рекомендуем читать блоки компаний, куда вы планируете собеседоваться в ближайшее время. Проверенно повышает успешность прохождения собеседований, тк вы становитесь не просто аналитиком, а аналитиком, знакомым с целями, вызовами и последними решениями компаний Ставьте лайки 👍, если было полезно, и давайте добьем каналу следующий уровень, осталось совсем немного!

Магистратура по искусственному интеллекту МТС x ФКН ВШЭ Недавно мы писали про магистратуры по DS / ML / ИИ, появилась ещё одн
Магистратура по искусственному интеллекту МТС x ФКН ВШЭ Недавно мы писали про магистратуры по DS / ML / ИИ, появилась ещё одна достойная! Основное: – 30 оплачиваемых мест от МТС; – Обучение проходит в очном формате в московском кампусе ВШЭ; – Занятия ведут преподаватели ВШЭ и действующие эксперты-практики из МТС и MTS AI, а для проектов можно использовать виртуальную инфраструктуру компании; – После и во время обучения можно получить оффер; – Есть канал для абитуриентов, в котором отвечают на вопросы и помогают с подготовкой к поступлению В программе передовые методы машинного и глубинного обучения: большие языковые модели, генеративные нейросети, инструменты компьютерного зрения и распознавания естественного языка. Детали можно изучить на сайте

Магистратура как способ войти в Айти В последнее время открылось очень много классных магистратур по DS совместно с ТОП-компаниями. Чем они отличаются от обычных магистратур? 💭 Преподают дисциплины не только преподаватели ВУЗа, но и опытные аналитики и ML-щики из индустрии 💭 Программы практико-ориентированные, а значит будет что показать в портфолио и резюме 💭 Учат актуальным навыкам, которые используются в компаниях 💭 Компании-партнеры предоставляют стажировки и способствуют трудоустройству в компанию 💭 Прокачивают до конкретного уровня на рынке. Какие-то программы до джун+, какие-то до миддл+ Собрали для вас подборку магистратур с бюджетными местами, в которые еще открыт набор в этом году: 🎓 ВШЭ x Авито: Машинное обучение в цифровом продукте. Обучение проходит очно и онлайн, Авито оплачивает обучение 30 будущим магистрам, кто лучше всех пройдет отбор. Стоимость платного - 600 тыс. в год. Подать документы можно до 8го августа. Подробнее прочитать можно еще и у Авито 🎓 ФКН ВШЭ х Яндекс: Современные компьютерные науки. Очное обучение, 52 бюджетных места. Программа включает в себя data science, теоретическую информатику, инфраструктуру больших данных. Вступительные испытания - экзамен по математике и программированию + собеседование. Податься можно до 8 августа. Стоимость платного обучение - 490 тыс. в год 🎓 ИТМО х ВК: Программирование и ИИ. Очное обучение с возможностью обучаться онлайн, 43 бюджетных места. Прием документов до 19го августа. Можно поступить через личные достижения или сдать вступительный экзамен. Стоимость платного обучения - 599 тыс. в год 🎓 ВШЭ СПБ х ВК: Машинное обучение и анализ данных. Очное обучение и 30 бюджетных мест. Студенты проходят практики и стажировки как в российских компаниях VK, Biocad, Сбер, Яндекс, Газпромнефть, так и международных JetBrains, Huawei. Прием документов до 8го августа, а узнать, как лучше подготовиться к вступительным ВК описали тут. Стоимость платного обучения - 390 тыс. в год 🎓ВШЭ х Сбер: Финансовые технологии и анализ данных. Очное обучение, Сбер покрывает 100% стоимости обучение 30 студентам. Вступительные испытания - экзамен по вышмату и собеседование. Пройти их и подать документы можно до 8го августа. Стоимость платного обучения - 490 тыс. в год Ставьте 👍, если хотите больше постов про магистратуру и образовательные курсы P.S. давайте поднажмём и накинем бустов каналу (осталось совсем немного до следующего уровня), чтобы наш контент стал ещё интереснее и разнообразнее

🐈 Твой будущий пет-проект поэтапно, ч. 2: парсим, предобрабатываем и изучаем данные Прошлые части: 1. Откуда взять идею и данные В прошлой части (которая невероятно быстро набрала 50 реакций!) мы рассказали, откуда можно взять идею для твоего пет–проекта. Скорее всего, она будет попадать в одну или несколько категорий из следующих 5 (в зависимости от того, что ты хочешь развивать): – Аналитика + визуализация (e.g. сделать красивый дашборд) – Обучение моделек (e.g. дообучить llmку) – Сбор и подготовка данных (e.g. настроить регулярный парсинг) – Развертывание моделей (e.g. поднять llamу) – А/Б, проверка гипотез (e.g. провести стат тест) В этой серии постов постараемся затронуть все категории проектов и их этапы. И первые этапы (сбор данных, предобработка и EDA) подходят для большинства категорий # Сбор данных В прошлой части рассказали про то, откуда брать данные, но не рассказали, что делать, если вы не нашли подходящего датасета. В таком случае можно найти источник, и: 1) Вытащить данные через API – Вот тут лежит небольшой список самых очевидных API – Обычно к API всегда есть документация, и достать оттуда данные не составляет проблемы 2) Если API нет, спарсить их – Про парсинг мы уже писали подробный пост, которого вполне достаточно для большинства сайтов – Если у сайта сильная защита, то, скорее всего, вам стоит подумать над другим источником данных 🙂 – Если не хочется писать скрипты, то есть готовые воркфлоу в хайповой lowcode платформе n8n, их можно найти тут (кстати, в бигтехах все чаще используется лоукод, если хотите пост про опенсорсный lowcode, то нужно набрать 50 динозавриков 🦖 на этом посте) # Предобработка данных – Самую базу можно найти, например, в этой статейке – Про предобработку текстов можно почитать тут – Про работу с изображениями можно посмотреть слайды из ВышкиСтатейка с полезными штуками для препроцессинга временных рядов # EDA (Исследовательский анализ данных) – Разведочный анализ включает в себя построение графичков, тесное знакомство с данными, извлечение инсайтов из них – Если вы новичок, и вам нужно понять, что такое exploratory data analysis, прочитайте эту статьюТут есть наш пост с ссылками на лекции Александра Дьяконова – А еще мы писали про то, как чувак делал EDA для музыкантов с last.fm, менее научно, но можно посмотреть для развлечения – Если вы решили делать пет-проект в рамках кагл-соревы, можете посмотреть пример EDA для соревнования Чтобы вышла следующая часть, давайте наберем 150 🔥 под этим постом, и добьем второй уровень для канала (забустить по ссылке), чтобы мы могли публиковать сторисы А еще обязательно пишите в комментариях свои вопросы по пет-проектам, и мы постараемся ответить на них прямо там же или в следующих частях 🙂

🏎 Давно тебя не было в уличных гонках! Как вы уже заметили, мы пропали на какое-то время... Но вернулись и не планируем изменять тому, за что вы нас любите и читаете. Для вас мы: — Записывали видео, в которых простым языком поясняли сложные вещи Показывали, как парсить что угодно и как угодно Подробно разбирали задачи с собесов Находили крутые роадмапы для развития в DS Собирали подборки для прокачки знаний в в ML-system design и много чего еще крутого и полезного! Мы пересобрали команду, теперь будет делать контент для вас: Рома Васильев - Руковожу аналитикой международного Поиска в Яндексе. Провёл в Яндексе и не только сотни собеседований, нанимал много ребят в разные направления - Веду этот канал уже больше пяти (офигеть!) лет, здесь мы про что только не писали уже. А ещё преподаю машинное обучение/аналитику в ВШЭ, Центральном Университете, периодически выступаю на конфах/открытых уроках и тд - В последнее время много пишу про аналитику/менеджмент/управление в личный телеграм канал я так понимаю, Роман Васильев Олег Андреев: - Этот невероятный парень проработал у меня ассистентом (по каналу и не только) практически год, за это время мы с ним успели написать кучу постов (например, пост про материалы для стажировки его рук дело) и сделать несколько классных видосов – На втором курсе универа вышел на стажировку в Яндекс, потом попал в штат, и сейчас уже больше года работает в АнтиФишинге браузера аналитиком-разработчиком Аня Курдина: – Попала на стажировку в команду аналитики международного Яндекса, на стажировке делала проект, про который я потом рассказывал на конфе Young&Yandex (посмотреть можно тут) – После стажировки Аня вышла в штат и сейчас работает аналитиком-разработчиком в рекламе – А еще Аня недавно стала золотым медалистом олимпиады «Я-профессионал» по направлению бизнес-информатика 🎉 Пишите в комментарии, про что вам было бы интересно почитать, и обязательно ставьте реакции на этот пост и на комментарии с идеями постов (чем больше реакций, тем выше вероятность, что мы выберем тему именно этого комментария) 🤩