en
Feedback
Start Career in DS

Start Career in DS

Open in Telegram

Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям. Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :) Автор: @RAVasiliev № 5141779667

Show more

📈 Analytical overview of Telegram channel Start Career in DS

Channel Start Career in DS (@start_ds) in the Russian language segment is an active participant. Currently, the community unites 11 672 subscribers, ranking 10 724 in the Technologies & Applications category and 56 490 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 11 672 subscribers.

According to the latest data from 05 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 4 over the last 30 days and by -2 over the last 24 hours, overall reach remains high.

  • Verification status: Not verified
  • Engagement rate (ER): The average audience engagement rate is 31.36%. Within the first 24 hours after publication, content typically collects N/A% reactions from the total number of subscribers.
  • Post reach: On average, each post receives 0 views. Within the first day, a publication typically gains 0 views.
  • Reactions and interaction: The audience actively supports content: the average number of reactions per post is 0.
  • Thematic interests: Content is focused on key topics such as learning, llm, хабре, ментор, объяснение.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
Тут публикуются материалы для прокачки скиллов в DS и подготовки к собеседованиям. Пишем про технические тулзы, визуализацию данных, бизнесовые задачи, разбираем ML-алгоритмы и обсуждаем смежные темы :) Автор: @RAVasiliev № 5141779667

Thanks to the high frequency of updates (latest data received on 06 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

11 672
Subscribers
-224 hours
-27 days
+430 days
Posts Archive
🏆 ML-соревнование на стыке ML, роботов и науки Ребята из CayleyPy делают крутую штуку на стыке ML/RL, математики и робототехники. Цель проекта - искать короткие решения для сложных головоломок. Один из главных кейсов - робот, который должен побить мировой рекорд по сборке Мегаминкса: это такая сложная версия кубика Рубика в форме додекаэдра. Для этого запустили соревнования на Kaggle. Суть простая: даны состояния пазлов, нужно найти как можно более короткие решения. Соревнования: • Мегаминкс https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard • Кубик Рубика 3x3x3 https://www.kaggle.com/competitions/cayleypy-ihes-cube • Кубик Рубика 4x4x4 https://www.kaggle.com/competitions/cayley-py-444-cube Призовой фонд уже больше 150 000 ₽ и будет расти. Плюс проект научный и open-source: можно не только порешать крутую задачу, но и потенциально поучаствовать в публикациях. GitHub: https://github.com/cayleypy/cayleypy Чат: @starkitmega По вопросам: @alexander_v_c

🔥 Итоги розыгрыша билетов на AHA'26 По итогам выбрали аж трёх победителей! В первой итерации великого рандома выбрали @catdem @JohnDen (комменатрии 1 и 9), но комментарий 1 на грани фола (автор не написал какой доклад интересно послушать), поэтому его автору мы предложим персональные условия выигрыша 🙂 Провели вторую итерацию розыгрыша чтобы доразыграть ещё один полный билет, здесь счастливчиком оказался @Krakatau27 (комментарий 6) Ребята, поздравляем вам и увидимся на AHA! За деталями к вам придут в личку 🙂

🔥АНА’26: конференция о продуктовой аналитике, ИИ и масштабировании цифровых продуктов 22 мая в Москве в седьмой раз пройдет АНА - техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд. Программа покрывает весь цикл: от базовых вещей (MLOps, продакшн) до того, что сейчас на хайпе - LLM, AI-агенты и архитектура современных AI-систем Среди ключевых тем: • R&D и экономика масштабирования продуктов • Методы системного снижения стоимости проверки гипотез • Управление ассортиментом и спросом в retail и e-commerce • Архитектура прикладного AI и ML&AI-инженерия • Разработка AI-first продуктов и open source AI-агенты для бизнеса • Data platform и инженерия доверия к данным Специально для читателей Start Career in DS: 1. Разыграем два очных билета на АНА'26 среди тех, кто откомментирует этот пост. Напишите в комментариях какой доклад особенно хотите послушать и почему 🙂 Розыграш проведём 03.05 в 12:00 по мск 2. Сделали промик на 15% на любой формат участия: STARTDS15 Увидимся на AHA, зарегистрироваться можно тут 🙂 А программу посмотреть - тут

Repost from Young&&Yandex
🐣 Рома Васильев зовёт в Школу аналитиков-разработчиков Этим летом Рома руководит ШАР и тизерит часть лекций в ролике.
Будем изучать продуктовую, техническую, маркетинговую аналитику и задачи — по Python, SQL, терверу и матстату. А ещё разберём, как AI может помочь аналитику-разработчику.
Запиши полезные рекомендации для подготовке к отбору и оставляй заявку: yandex.ru/yaintern/schools/analytics

Yandex Weekend Offer Analytics: 28 февраля - 1 марта Судя по опросу выше, карьерные вопросы тут многим актуальны 🙂 Поэтому делюсь реально классной возможностью. За 2 дня можно получить офер в Яндекс. Формат: - До 25 февраля регистрируетесь, с вами связывается рекрутер. - 28 февраля — две технические секции: - аналитическая задача (матстат, логика) - алгоритмическая задача (алгоритмы и структуры данных). - 1 марта — знакомство с командами и офер. Ищут аналитиков с опытом на Python от 3 лет. Направления: продуктовая аналитика, дата-аналитика (вокруг технологий, качества моделей и процессов данных), Data Science. Нужны Python и SQL, плюс профильные знания по профессии. Команды разные: Алиса, автономный транспорт, R&D, коммерция, безопасность. Нанимаем там к слову в том числе и к нам в межнар 🙂 Если вы давно хотели в Яндекс, но боитесь долгих процессов - это самый быстрый трек. Зарегистрироваться можно тут

Мне интересно читать про:
Anonymous voting

Привет всем подписчикам Start Career in DS! На связи Рома Васильев (@ravasiliev_ch) Этот канал был создан ещё в далёком 2020 году (пруфы!) чтобы выкладывать полезные для студентов материалы для подготовки к собеседованиям. С тех пор Start Career разросся до 11 тысяч подписчиков, и я точно знаю, что многие из подписчиков активно использовали материалы из канала чтобы изучать Data Science, готовиться к интервью и просто узнавать новое 🙂 Однако я также знаю, что многие подписчики тут уже совсем не про "Start career ...", кто-то за время существования канала успел вырасти от стажёров до синьоров / руководителей отделов DS. Так что можно сказать что мы росли вместе! Кстати, на продвинутые менеджерские темы / про современные технологии я периодически пишу в канале @ravasiliev_ch Последние несколько лет посты делались с переменных успехом, хочется понять что вам (нашим любимым подписчикам!) интереснее было бы видеть в этом канале. Хочу возродить канал и делать полезные материалы для вас 🙂

🎬 Wink AI Challenge – хакатон про ИИ и кино Случай, когда ML можно применить в творческом направлении, а именно – в производ
🎬 Wink AI Challenge хакатон про ИИ и кино Случай, когда ML можно применить в творческом направлении, а именно – в производстве сериалов и фильмов. На Wink AI Challenge участники создадут ИИ-сервисы, которые помогут ускорить кинопроизводство: анализировать сценарии, визуализировать сцены и классифицировать контент по возрастным рейтингам. Основное: – Регистрация до 31 октября на Codenrock – Призовой фонд 1 125 000 ₽ – Финал в Москве, двум участникам оплатят перелёт и проживание – Оценивать будут продюсеры фильмов «Слово пацана», «Ёлки», «Фишер» и других проектов К участию приглашают ML-инженеров, backend- и frontend-разработчиков, DevOps, MLOps и мультимедиа-специалистов. Каждая команда получит реальный сценарий и задачу – создать сервис, который сделает кинопроизводство быстрее и точнее. Если хочется сделать проект на стыке ML и креатива – хороший повод попробовать: https://cnrlink.com/winkaichallengestartds

🏆 Yandex Cup 2025 по аналитике, ML и другим дициплинам Автор этого канала в этом году руководит треком по аналитике и гарантирует, что задачки там будут очень интересные :) Что там будет:
Призовой фонд 12 млн рублей. Участник может выиграть до 500 тысяч Финал в Стамбуле. +1 приключение и возможность ощутить дух международных соревнований Буст карьеры. Лучших ребят ждёт упрощённый отбор в Яндекс Нетворкинг и вайб турнира. В одном месте соберутся сильнешие ребята из своих областей
Уже скоро будут первые туры, приходите регистрироваться вот сюда: yandex.ru/cup

🚀 Ребята из Авито проводят открытое собеседование на DS’a! 13 октября в 18:30 пройдет открытое интервью с реальным кандидато
🚀 Ребята из Авито проводят открытое собеседование на DS’a! 13 октября в 18:30 пройдет открытое интервью с реальным кандидатом, на котором коллеги покажут всё изнутри – от постановки задачи до того, как дается финальный фидбэк. Разберут кейс из собеседований, обсудят влияние ML-решений на продукт и покажут, по каким факторам отбирают кандидатов. Интервью проводят руководители DS-направлений Авито - Максим Каширин и Александр Ледовский. Кандидат - Дмитрий Савелко, LLM-инженер и автор блога Еbout Data Science. Участие бесплатное, зарегистрироваться можно по ссылке

Готовимся к стажировке вместе. Часть 2: почему полезно общаться с рекрутерами? Многие будущие стажеры воспринимают взаимодействие с рекрутером исключительно как возможность узнать, на какое время назначена секция или какая обратная связь получена от прошедшей секции. Чтобы лучше подготовиться и проявить себя на секциях, важно использовать переписку с рекрутером как способ задать вопросы и подробнее узнать о предстоящих этапах. Спойлер: в этом нет ничего странного и рекрутеры реагируют на такое спокойно или даже положительно) Подготовили для вас список вопросов, которые полезно задать рекрутеру Перед теоретическими секциями спроси:Вопросы из какой области будут на интервью, чего стоит ожидать -> будешь знать, что стоит повторить перед секцией - не будет паники или неопределенности ❓Какие материалы лучше прочитать/повторить, чтобы лучше проявить себя на секции -> рекрутеры часто рекомендуют материалы и короткие курсы по темам, которые часто спрашивают на собесах ❓Нужно ли будет решать задачи по математике и терверу? Если да, то по каким темам чаще всего спрашивают? -> повторив темы, можно заранее порешать задачки, чтобы освежить в памяти использование формул на практике и не пытаться долго вспомнить на собесе ❓Какой длительности будет секция и сколько вопросов обычно на ней задают -> зная тайминги, лучше понимаешь, сколько времени уделять на ответ, чтобы успеть ответить на все вопросы интервьюера, но приэтом, чтобы ответы была полными и раскрывающими знания Перед секцией с лайв-кодингом (алгоритмы или SQL):Какого уровня будут задачи на секции (для алгоритмов можно уточнить уровня easy, medium или hard литкода, для SQL - с использованием оконок или без них) -> зная уровень, понимаешь, на что нацеливаться и нарешивать, готовясь к собесу ❓В какой среде можно писать код во время собеса -> у каждой компании свои ограничения во время секций: кто-то предоставляет лишь блокнот без подсветки синтаксиса, кто-то предоставляет блокнот с подсветкой, некоторые компании разрешают писать в привычной среде и демонстрировать экран. Заранее зная ограничения, к ним можно подготовиться и привыкнуть, чтобы во время секции не испытывать дискомфорт и сконцентрироваться исключительно на решении задачи ❓Какое время отводится на решение задач, сколько их будет, и можно ли пользоваться поисковиком во время секции -> у каждой компании свои правила проведений код-секций, поэтому важно понимать их заранее, чтобы выстроить стратегию решения Перед финалом с командой спроси:Из какого бизнес-подразделения команда, чем она занимается -> ищем в медиа-пространстве статьи, чтобы подробнее узнать про команду, быть в контексте. Если информации нет или недостаточно, идем в гпт, чтобы подробнее узнать, чем такие команды могут заниматься и какие вопросы на финале могут задавать ❓Какие вызовы и цели сейчас стоят перед командой -> зная это, можно понять, какого стажера сейчас ищет команда и какие навыки в приоритете, чтобы показать их на собеседовании ❓Какая структура у финала: рассказ о себе, обсуждение предстоящих задач, генераций идей по кейсу в риал-тайме или что-то другое -> если есть решение кейса, обязательно повтори бизнес-метрики и погрузись в материалы из подборки про развитие бизнес-видения. Для рассказа о себе - заранее подготовь убедительный спич, подсветив, все важное о себе и своих достижениях, опыте. Составь список вопросов, которые хочешь задать команде о своих будущих задачах и треке развития: так команда убедится, что тебе действительно интересно то место, куда ты идешь
На самом деле, есть еще немало секретов прохождения на стажировку, которые не выкладывают публично в каналах. Поэтому, если хотите узнать больше – пишите в личку!
Ставьте 🔥, если хотите такой же подробный пост про первичный созвон с HR

🎓 Готовимся к стажировке вместе. Часть 2: Пробное собеседование Заботать алгоритмы, тервер, метрики и прочее - это лишь часть дела. Главное – это уметь продемонстрировать свои знания и навыки на собесе. И чтобы натренировать этот полезный скилл, можно делать как минимум три вещи: 1. Смотреть, как кто-то проходит собеседования 2. Проходить собеседования самим 3. Симулировать прохождение собеседования – Посмотреть, как проходят собеседования, можно, например, по ссылкам из нашего поста: раз, два – Проходить собеседования самим рискованнее, ведь в множестве компаний есть фризы на найм после неудачных собеседований. Да и попасть на собеседование бывает тяжело – Третий пункт многие недооценивают, но пробные собеседования снижают стресс во время прохождения реального интервью, выявляют слабые места, отрабатывают структуру ответа и помогают понять ожидания интервьюера Кто может провести такое собеседование? Наилучший вариант отработать пробное собеседование со своим ментором или более опытным коллегой/товарищем. Также бигтехи иногда проводят такую акцию в рамках своих мероприятий Но если такой возожности нет, нейронки в помощь! Подготовили для вас два самых рабочих варианта: 1) Диалог с ГПТ (можно использовать бесплатный deepseek / любую другую llm-ку) Пишете промт:
Привет! Мне предстоит [укажите названии секции] в компанию [укажите название компании и команды, если уже знаете,] на позицию [укажите роль и грейд, на который будете собеседоваться]. Стань моим интервьюером, чтобы я лучше мог подготовиться к нему. Задавай мне вопрос, я тебе в чат буду писать ответ, затем давай мне краткий фидбэк по нему.
Если не хотите писать вручную, есть wispr flow – транскрибатор с бесплатным пробным периодом 2) Google Ai stream. Пишете такой же промпт, но нужно уточнить про общение голосом. Затем общаетесь с ассистентом в режиме реального интервью, где и вы, и он разговариваете голосом. 3) Есть уже готовые сервисы подготовки к собесам на основе нейронок, например, @DataismPrepBot или https://prepfully.com, можно попробовать их Если хотите третью часть про подготовку к стажировке, ставьте огоньки 🔥 под этот пост, и пишите в комментарии, про что должна быть следующая часть!

Открыта регистрация на E-CUP 2025 — ML-соревнование от Ozon Формат — онлайн, участвовать можно одному или в команде до 5 чело
Открыта регистрация на E-CUP 2025 — ML-соревнование от Ozon Формат — онлайн, участвовать можно одному или в команде до 5 человек. Победители делят между собой 7.2 млн ₽. Защита решений в финале возможна как в онлайне, так и очно 13 сентября на IT-конференции E-CODE (проезд и проживание оплачивает организатор). Всего 3 трека: — Рекомендации: предсказание следующей покупки пользователя — Логистика: автопланирование курьеров — Контроль качества: автоматическое выявление поддельных товаров Задачи на основе реальных данных, с фокусом на масштаб и практику. Будет возможность пообщаться с разработчиками и аналитиками из Ozon Tech. Мерч и другие подарки тоже обещают! Регистрация до 17 августа включительно: ссылка

Всем привет! Хочу снова порекомендовать канал @zasql_python Канал ведет Senior Product Analyst в 🛒, ранее работал в Яндекс 🍫 Лавке, 💙 Популярные посты Шпаргалки по SQL Роадмап для продуктового аналитика / аналитика данных Для чего нужен ML в аналитике Личные размышления автора Визибилити в организацииВнезапные влетыПоиск роста для аналитикаВстречи или работа: где найти золотую середину аналитика? Блок продуктовых кейсов: пост1, пост2, пост3 Подписывайтесь, здесь много всего интересного для аналитиков.

🎓 Готовимся к стажировке вместе. Часть 1: Корпорации больше не берут джунов? Крупные компании все реже нанимают джуниоров. Вместо этого — активно набирают стажеров, расширяют программы стажировок и переманивают мидлов. Почему так? 💸Компании предпочитают растить кадры «с нуля» через стажировки и оставлять лучших себе, полностью закрывая внутреннюю потребность в джунах 💸За чуть большие деньги проще взять мидла с 1-2 годами опыта, чем учить джуна с риском, что он уйдет через полгода Что делать если вы джун и хотите поскорее ворваться в работу? ✅Ищите и откликайтесь на стажировки — это новый вход в профессию. Проще пройти стажировку за 3 месяца, чем полгода бесконечно скролить HH и проходить собесы ✅ Растите опыт через стартапы, пет-проекты (о них мы писали выше) и хакатоны А прямо сейчас открыт отбор на стажировку по аналитике, DS и ML здесь: 💸 Альфа-Банк 💸 OzonTech 💸 Яндекс 💸 T1 💸 ВТБ 💸 X5Tech 💸 t2 (ex. Tele2) 💸 Wildberries Ставьте ❤️, если вам интересны стажировки, и 🔥, если вы уже активно готовитесь и подаетесь на стажи, и задавайте интересующие вас вопросы в форме – ответим на них в одном из следующих постов или придем к вам в лс)

👩‍💼 Как развить бизнес видение? Бесспорно, для аналитиков любого грейда крайне важно помимо хард скиллов, также и бизнес видение. Не зря бигтехи проверяют и то, и другое на разных этапах собеса. Поэтому прокачивать его так же нужно, как и нарешивать литкод или задачки по терверу. Небольшой список общих советов: 👉 Ходите на конференции, где разбираются реальные кейсы: матемаркетинг, aha!, датафест 👉 Читайте каналы по интересующей вас тематике, а еще полезно почитать разные каналы с отчетностями компаний, чтобы понять, на чем они зарабатывают и на какие метрики смотрят, например, @businessincognita и @expertosphere 👉 Читайте книги, которые развивают бизнес-видение, например, The Data Detective и How To Measure Anything. Отдельно рекомендуем "Спроси маму" Роба Фитцпатрика, она научит вас правильно задавать вопросы клиенту и понимать, что реально он хочет, а в чем вообще не заинтересован. Саммари есть на хабре, но админы читали целиком и вам советуют А теперь подборка, если вам нужно все и сразу за короткий срок перед собесом: 🔎 Школа менеджеров Яндекса: возможность заглянуть в закулисье яндекса, построения продукта и принятия решений в нем 🔎 Платформа growth.design, на которой в формате комиксов разбираются различные продуктовые кейсы мировых топ-компаний. Узнали про нее от Макса из Заскуль Питона, оч советуем подробнее про эту крутую платформу прочитать у него. 🔎 Блог GoPractice – много классных бесплатных статей про продуктовый менеджмент, маркетинг и аналитику. А если понравится, то у них есть и платные симуляторы 🔎 Блоги компаний. Например, Авито, Яндекса, Альфа-банка. Выбирайте статьи, относящиеся к бизнес-части и прокачивайте насмотренность по принятию решений, которые влияют на то, что вы видите в своем смартфоне. Отдельно рекомендуем читать блоки компаний, куда вы планируете собеседоваться в ближайшее время. Проверенно повышает успешность прохождения собеседований, тк вы становитесь не просто аналитиком, а аналитиком, знакомым с целями, вызовами и последними решениями компаний Ставьте лайки 👍, если было полезно, и давайте добьем каналу следующий уровень, осталось совсем немного!

Магистратура по искусственному интеллекту МТС x ФКН ВШЭ Недавно мы писали про магистратуры по DS / ML / ИИ, появилась ещё одн
Магистратура по искусственному интеллекту МТС x ФКН ВШЭ Недавно мы писали про магистратуры по DS / ML / ИИ, появилась ещё одна достойная! Основное: – 30 оплачиваемых мест от МТС; – Обучение проходит в очном формате в московском кампусе ВШЭ; – Занятия ведут преподаватели ВШЭ и действующие эксперты-практики из МТС и MTS AI, а для проектов можно использовать виртуальную инфраструктуру компании; – После и во время обучения можно получить оффер; – Есть канал для абитуриентов, в котором отвечают на вопросы и помогают с подготовкой к поступлению В программе передовые методы машинного и глубинного обучения: большие языковые модели, генеративные нейросети, инструменты компьютерного зрения и распознавания естественного языка. Детали можно изучить на сайте

Магистратура как способ войти в Айти В последнее время открылось очень много классных магистратур по DS совместно с ТОП-компаниями. Чем они отличаются от обычных магистратур? 💭 Преподают дисциплины не только преподаватели ВУЗа, но и опытные аналитики и ML-щики из индустрии 💭 Программы практико-ориентированные, а значит будет что показать в портфолио и резюме 💭 Учат актуальным навыкам, которые используются в компаниях 💭 Компании-партнеры предоставляют стажировки и способствуют трудоустройству в компанию 💭 Прокачивают до конкретного уровня на рынке. Какие-то программы до джун+, какие-то до миддл+ Собрали для вас подборку магистратур с бюджетными местами, в которые еще открыт набор в этом году: 🎓 ВШЭ x Авито: Машинное обучение в цифровом продукте. Обучение проходит очно и онлайн, Авито оплачивает обучение 30 будущим магистрам, кто лучше всех пройдет отбор. Стоимость платного - 600 тыс. в год. Подать документы можно до 8го августа. Подробнее прочитать можно еще и у Авито 🎓 ФКН ВШЭ х Яндекс: Современные компьютерные науки. Очное обучение, 52 бюджетных места. Программа включает в себя data science, теоретическую информатику, инфраструктуру больших данных. Вступительные испытания - экзамен по математике и программированию + собеседование. Податься можно до 8 августа. Стоимость платного обучение - 490 тыс. в год 🎓 ИТМО х ВК: Программирование и ИИ. Очное обучение с возможностью обучаться онлайн, 43 бюджетных места. Прием документов до 19го августа. Можно поступить через личные достижения или сдать вступительный экзамен. Стоимость платного обучения - 599 тыс. в год 🎓 ВШЭ СПБ х ВК: Машинное обучение и анализ данных. Очное обучение и 30 бюджетных мест. Студенты проходят практики и стажировки как в российских компаниях VK, Biocad, Сбер, Яндекс, Газпромнефть, так и международных JetBrains, Huawei. Прием документов до 8го августа, а узнать, как лучше подготовиться к вступительным ВК описали тут. Стоимость платного обучения - 390 тыс. в год 🎓ВШЭ х Сбер: Финансовые технологии и анализ данных. Очное обучение, Сбер покрывает 100% стоимости обучение 30 студентам. Вступительные испытания - экзамен по вышмату и собеседование. Пройти их и подать документы можно до 8го августа. Стоимость платного обучения - 490 тыс. в год Ставьте 👍, если хотите больше постов про магистратуру и образовательные курсы P.S. давайте поднажмём и накинем бустов каналу (осталось совсем немного до следующего уровня), чтобы наш контент стал ещё интереснее и разнообразнее

🐈 Твой будущий пет-проект поэтапно, ч. 2: парсим, предобрабатываем и изучаем данные Прошлые части: 1. Откуда взять идею и данные В прошлой части (которая невероятно быстро набрала 50 реакций!) мы рассказали, откуда можно взять идею для твоего пет–проекта. Скорее всего, она будет попадать в одну или несколько категорий из следующих 5 (в зависимости от того, что ты хочешь развивать): – Аналитика + визуализация (e.g. сделать красивый дашборд) – Обучение моделек (e.g. дообучить llmку) – Сбор и подготовка данных (e.g. настроить регулярный парсинг) – Развертывание моделей (e.g. поднять llamу) – А/Б, проверка гипотез (e.g. провести стат тест) В этой серии постов постараемся затронуть все категории проектов и их этапы. И первые этапы (сбор данных, предобработка и EDA) подходят для большинства категорий # Сбор данных В прошлой части рассказали про то, откуда брать данные, но не рассказали, что делать, если вы не нашли подходящего датасета. В таком случае можно найти источник, и: 1) Вытащить данные через API – Вот тут лежит небольшой список самых очевидных API – Обычно к API всегда есть документация, и достать оттуда данные не составляет проблемы 2) Если API нет, спарсить их – Про парсинг мы уже писали подробный пост, которого вполне достаточно для большинства сайтов – Если у сайта сильная защита, то, скорее всего, вам стоит подумать над другим источником данных 🙂 – Если не хочется писать скрипты, то есть готовые воркфлоу в хайповой lowcode платформе n8n, их можно найти тут (кстати, в бигтехах все чаще используется лоукод, если хотите пост про опенсорсный lowcode, то нужно набрать 50 динозавриков 🦖 на этом посте) # Предобработка данных – Самую базу можно найти, например, в этой статейке – Про предобработку текстов можно почитать тут – Про работу с изображениями можно посмотреть слайды из ВышкиСтатейка с полезными штуками для препроцессинга временных рядов # EDA (Исследовательский анализ данных) – Разведочный анализ включает в себя построение графичков, тесное знакомство с данными, извлечение инсайтов из них – Если вы новичок, и вам нужно понять, что такое exploratory data analysis, прочитайте эту статьюТут есть наш пост с ссылками на лекции Александра Дьяконова – А еще мы писали про то, как чувак делал EDA для музыкантов с last.fm, менее научно, но можно посмотреть для развлечения – Если вы решили делать пет-проект в рамках кагл-соревы, можете посмотреть пример EDA для соревнования Чтобы вышла следующая часть, давайте наберем 150 🔥 под этим постом, и добьем второй уровень для канала (забустить по ссылке), чтобы мы могли публиковать сторисы А еще обязательно пишите в комментариях свои вопросы по пет-проектам, и мы постараемся ответить на них прямо там же или в следующих частях 🙂

🏎 Давно тебя не было в уличных гонках! Как вы уже заметили, мы пропали на какое-то время... Но вернулись и не планируем изменять тому, за что вы нас любите и читаете. Для вас мы: — Записывали видео, в которых простым языком поясняли сложные вещи Показывали, как парсить что угодно и как угодно Подробно разбирали задачи с собесов Находили крутые роадмапы для развития в DS Собирали подборки для прокачки знаний в в ML-system design и много чего еще крутого и полезного! Мы пересобрали команду, теперь будет делать контент для вас: Рома Васильев - Руковожу аналитикой международного Поиска в Яндексе. Провёл в Яндексе и не только сотни собеседований, нанимал много ребят в разные направления - Веду этот канал уже больше пяти (офигеть!) лет, здесь мы про что только не писали уже. А ещё преподаю машинное обучение/аналитику в ВШЭ, Центральном Университете, периодически выступаю на конфах/открытых уроках и тд - В последнее время много пишу про аналитику/менеджмент/управление в личный телеграм канал я так понимаю, Роман Васильев Олег Андреев: - Этот невероятный парень проработал у меня ассистентом (по каналу и не только) практически год, за это время мы с ним успели написать кучу постов (например, пост про материалы для стажировки его рук дело) и сделать несколько классных видосов – На втором курсе универа вышел на стажировку в Яндекс, потом попал в штат, и сейчас уже больше года работает в АнтиФишинге браузера аналитиком-разработчиком Аня Курдина: – Попала на стажировку в команду аналитики международного Яндекса, на стажировке делала проект, про который я потом рассказывал на конфе Young&Yandex (посмотреть можно тут) – После стажировки Аня вышла в штат и сейчас работает аналитиком-разработчиком в рекламе – А еще Аня недавно стала золотым медалистом олимпиады «Я-профессионал» по направлению бизнес-информатика 🎉 Пишите в комментарии, про что вам было бы интересно почитать, и обязательно ставьте реакции на этот пост и на комментарии с идеями постов (чем больше реакций, тем выше вероятность, что мы выберем тему именно этого комментария) 🤩

Start Career in DS - Statistics & analytics of Telegram channel @start_ds