54 on the back
Рассказываю немного о своем опыте, хакатоню ml, делюсь мемами и вместе ботаем::))
Больше252
Подписчики
-124 часа
+57 дней
+3430 дней
- Подписчики
- Просмотры постов
- ER - коэффициент вовлеченности
Загрузка данных...
Прирост подписчиков
Загрузка данных...
Фото недоступноПоказать в Telegram
Испанцы🇪🇸🇪🇸🇪🇸❤️❤️❤️
У Барселоны вырисовывается самый талантливый игрок поколения Ямаль(может и на лч замахнемся)))
❤ 4🍌 1
#дневник№1⬅️
С 1 по 5 июня я был на Летняя школа ФКН и VK Education. Сказать, что это было невероятно, ничего не сказать. Помимо классных(я бы даже сказал ахуенных) лекций по nlp и llm, у нас были пары по продуктовой значимости продукта и manager skills(для себя рассматриваю именно такое продолжение карьеры👽). Также со среды мы начали активно развивать свои собственные проекты в группах из 3 человек, и хочется огромное спасибо сказать Никите и Тимофею за вовлеченность и продуктивность. В последний день в офисе VK происходила защита проектов, где мы заняли 2 место по продуктовой значимости проекта, и в призах у нас была Маруся и еще пару плюшек. Я уверен, что скоро мы доведем наш проект до красивого MVP, который в будущем вы сможете увидеть на просторах Вышки, Финашки или других образовательный сервисов🎁)
Еще раз огромное спасибо организаторам этого проекта, надеюсь это мой не последний раз на фкн все таки в поход хочется)), и огромное спасибо ребятам, с которыми мы провели эту первую неделю июля💗
"Education breeds confidence. Confidence breeds hope. Hope breeds peace." - Confucius
❤ 10🔥 5👏 2💊 2🖕 1
Пост про отборы на стажировки➡️
Я думаю многим, кто подписан на этот канал, будет полезно узнать о датах набора на стажировка, а также парочку советов по отбору. Если на данному посту будет много реакций, добавлю еще парочку интересных материалов для более безболезненного отбора🤝
Ps речь идет о стажировках в data science и иногда аналитика
Яндекс😀
Набор на стажировку круглогодичный, в целом готовьтесь к 4 или 5 собесам. Как ни странно, сейчас я считаю отбор в Яндекс одним из самых лучших, так как довольно понятные задания вас там ждут и есть общий метод оценивания. Хотя до сих пор считаю, что некоторые темы в собесах на стажку больше походят на позицию junior+.
Т-банк(тинькофф, тиньк, как его не называй))😓
Отбор идет по волнам, но сейчас с их дополнительными наборами кажется, что она идет всегда. И тут у вас встает выбор: если вам не особо важно на какой позиции начинать карьеру, то советую подать анкету на аналитику, так как конкуренция на место там сильно ниже(пост про это в канале). Если все таки вы решили идти сразу в ml, то скорее всего столкнетесь с непонятными методами оценивания, а также вам придется все тесты писать максимум, чтобы вас рассмотрели.
Сбер✨
Набор происходит 2 раза в год(зима и лето), и тут вы впервые столкнетесь с такими вещами, как телефонное интервью и то, что вашу анкету просто в базу. Честный мой совет: на конференциях ищите hr, с помощью них вы хоть что то найдете в сбере.
ВКонтакте🌐
Тут набор идет на вакансиям, поэтому есть смысл периодически просматривать сайт на наличие чего то нового. Ни разу не проходил дальше их теста, поэтому ничего дельного сказать не могу.
Озон📈
Для аналитиков стажеров тут есть ozon camp, про который я слышал очень позитивные вещи, если вы все же из ml, то в озоне от вас ждут минимум год опыта.
Авито😎
Классное место для работы, особенно если вы после какого нибудь ААА, единственное для себя заметил, что тут берут только с 3 курса, в остальных случаях автореджект.
Alfa❤️
Тут будет два мнение, так как есть огромная разница в отборе в просто в альфу и в альфу лаборатории. В обычном случае вас будет ждать очень долгое ожидание(весь период собесов длиться 3.5 месяца), не понятные вопросы по мотивации, и в конечном итоге в 99% вас просто закинут в базу резюме. Можете идти туда только если у вас есть фасттрек.
Второе - это отбор в лаборатории. В этом канале публикуются годные вакансии на стажера, очень классные собесы по ml, да и в целом ребята выполняют классные задачи. Поэтому лучше идите именно в лаборатории)))
X5 Group 🌿
Вот тут у меня личная обида))) Если в первый раз ad hoc аналитику и по факту завалил алгоритмы, то на втором собесе на data scientist меня зареджектили просто потому что(хотя я уверен, что у них просто места на стажировку закончились). Тут от вас ждут скорее аналитики, поэтому помимо python, алгоритмов и ml, вас будут спрашивать ab тестирование и теорвер, на поздних стадиях могут спросить uplift моделирование(про все это вы можете почитать в канале)
Attention is all you need💗
❤ 16👍 8
Фото недоступноПоказать в Telegram
😎 ЭТО АНОНС ПЯТНИЧНОГО СТРИМА? (да.)
⌛ 21 июня 17:00 мск
Сессия подходит к концу, а значит можно снова залетать на соревы по kaggle. И тут как раз вовремя хакатон по оцениванию эссе.
Так что же мы обсудим на стриме:
1. Основные подходы работы с данными в nlp
2. Разберем саму сореву, лучших публичный ноутбук
3. Покажу свои наработки и основные идеи
Увидимся в пятницу, всех очень жду, также обязательно подписываетесь на канал. Там много полезного, а также в нем после стрима будут лежать ноутбуки.- Никита @sasquato
❤ 9
➡️Обучаясь в финансовом университете на направлении "Прикладная математика и информатика", периодически создается диссонанс из-за количества дисциплин по финансам и анализу данных, помимо классической математики, программирования, глубокого и машинного обучения. Фактически, ты после получения диплома ты можешь стать как финансистом или аналитиком, так и data science специалистом. На этой почве и получился коллаб с ребятами, которые расскажут про свои сферы и как в них устроена работа. Получилось такое распределение:
💲 Леша рассказал про финансы
⭐️ Лена про консалтинг и бизнес-аналитику
🐱 Саша про продуктовую аналитику
Очень советую почитать и подписаться на ребят, ведут реально крутые и полезные каналы📈
Ну а теперь можно перейти к нашему любимому data science😠. Для того, чтобы понять, какие профили у нас есть, стоит понять какие направление имеет наша любимая область:
1️⃣ Машинное обучение (разработка алгоритмов и моделей, способных обучаться на данных и делать прогнозы)
2️⃣ Моделирование данных (оптимизация имеющихся моделей)
3️⃣ Статистика (попытка интерпретировать данных и проверить их значимость с помощью математики)
4️⃣ Программирование (предобработка и предобработка данных, автоматизация моделей)
5️⃣ Базы данных (хранение, управление и извлечение данных)
🤓ML researcher
Самые крутые ребята в ML. Если вы ML researcher и у вас есть хотя бы годик опыта, то за вами реально будут будет гоняться всякие вк, т-банки и так далее🤑
Основная задача исследователя — улучшать качество моделей машинного обучения. В целом его работу можно разделить на два блока. Первый — работа с готовой моделью в проекте. Необходимо непрерывно оценивать ее качество и находить, что в ней можно улучшить. Второй — непосредственно исследовательская часть: поиск новых архитектур и сигналов для предсказания.
Основную часть времени занимает обучение новых моделей. Например, подготовка данных на кластере и написание инфраструктуры для эффективного обучения. Также в обязанности входит деплой модели: нужно написать модель и проверить, что на реальных данных она ведет себя ожидаемым образом, а затем уже оптимизировать ее производительность.
Что нужно знать исследователю:
— Python, чтобы разрабатывать модели
— C++, чтобы внедрять код в продакшн
— Фреймворки для глубинного обучения (TensorFlow, PyTorch, Caffe или другие)
— Структуры данных и алгоритмы
😌ML-разработчик
Обязанности разработчика очень похожи на исследовательские. Но в отличие от него не нужно готовить публикации в научных журналах и регулярно разрабатывать принципиально новые технологии. Гораздо важнее, чем для исследователя, умение писать эффективный и читаемый код, в котором потом смогут разобраться коллеги.🧐
Также полезно владеть инструментами для совместной разработки и уметь не только обучать качественные модели, но и создавать на их основе сервисы, способные выдерживать высокую нагрузку: это может требовать владения как более низкоуровневыми языками программирования, так и техниками для оптимизации моделей машинного обучения.
Что нужно знать разработчику:
— Python и С++, чтобы разрабатывать модели и обучать алгоритмы
— Теорию вероятности, математическую статистику и дискретную математику
— Фреймворки Deep Learning (TensorFlow, PyTorch, Caffe или другие)
😓Дата-инженер
Инженеры занимаются подготовкой данных для последующего анализа. Их задача — сначала собрать данные из соцсетей, сайтов, блогов и других внешних и внутренних источников, а затем привести в их структурированный вид, который можно отправить аналитику.🥹
Что нужно знать дата-инженеру:
— Как проектировать хранилища, настраивать сбор данных и дата-пайплайнов
— Как построить ETL-процессы
— C++, Python или Java
— SQL для работы с базами данных
Также еще остается аналитика, но про нее читайте у ребят💗
Пишите как вам пост, ставьте реакции и ждем вторую часть🍀
❤ 13🌚 3🍓 2
#КурсыпоSQL 📈
Так как экзамен по СУБД(фактически по Postgres) сдан, хотелось бы поделиться пройденными мной курсами за год(особенно будет полезно ребятам, у которых будет СУБД на следующий год, спасибо Саше⭐️, который привел эту аудиторию), и составить общее впечатление по ним.
1. SQLbolt 😏
Очень классный курс для начала. Неплохо объяснены основные темы, интересные задачи и в целом данный курс можно пройти за день. Фактически, для начала это один из лучших курсов. Единственное, он полностью на английском и там достаточно мало практики, также нет разбора более сложных тем(функций, транзакций или индексов)
2. Курс sql на степик 😓
Вот тут практики за глаза хватит. Но она такая скучная, что вам хватит 2 разделов, чтобы понять, что это не сильно интересно. И снова не поднимаются сложные темы.
3. Sql academy 😌
Лучший курс для меня, который я нашел в интернете. Отличный тренажер, набор задач, дизайн самих задач. В целом, 10 из 10, очень советую пройти каждому.
4. Книга по postgres(Е. П. Моргунов, PostgreSQL. Основы языка SQL) 🤑
Весь второй семестр в нашем вузе. Если пройдете совместно с 3 курсом, то вам будет реально скучно в вузе)))
5. Видеоуроки по postgres 💲
Отличная теория, очень понятно все объясняется, также есть курс на stepikесли перейдете по ссылке с youtube, то будет стоит 1400(его не проходил, но по общему содержанию очень хорош, правда есть проблемы с задачами и их решениями).
Пишите, как вам эти курсы и какие еще посоветуйте ➡️ Ну и конечно же ставьте реакции))))💗
❤ 9🔥 2🍓 2
#ХабрНедели 📈
06.06 - 13.06
В данной подборке будут включены лучшие статьи недели на хабре для нашего профиля(ml и python). Пишите также какие статьи вы еще читали на этой неделе💗
Машинное обучение:
1. Как анализировать тысячи отзывов с ChatGPT? Частые ошибки и пример на реальных данных
2. Могут ли KAN справляться с задачами компьютерного зрения?
3. Революционный подход к нейросетям: рассказываем про KAN (Kolmogorov-Arnold Networks)
4. Простые способы ускорения обучения PyTorch-моделей
5. Эксперимент: создаем цифровых двойников Ленина и Николая II
6. Повышаем интерпретируемость SHAP-графиков
Классные события:
1. Гайд по ICLR 2024: тренды и лучшие доклады
Просто интересно почитать:
1. AIOgram3 18. Подключаем оплату Telegram Stars
2. То ли дом, то ли лаборатория: как устроен умный дом профессионала
3. Я протестировал велосипед с водородным приводом. Возможно, это настоящее зеленое будущее?
4. Scrum — рак, убивающий индустрию
5. Разбираем осьминога
6. Памяти Кевина Митника — хакера, ломавшего ФБР, АНБ и Кремниевую долину. Часть 7: призрак в маске мертвеца
7. Рекрутинговый ад или как я в Канаде IT работу искал
8. Как за один день сделать месячный объем работы и перестать тревожиться — пошаговая инструкция
Ps Сейчас очень сложное время, чтобы писать статьи из-за сессии и других внешних дел, но я очень постараюсь, чтобы посты выходили почаще🐱
❤ 7🔥 2👏 1
#ХабрНедели💪
В данной подборке будут включены лучшие статьи недели на хабре для нашего профиля(ml и python). Пишите также какие статьи вы еще читали на этой неделе💗
Машинное обучение:
1. Архитектура RAG: полный гайд
2. Архитектура RAG: часть вторая — Advanced RAG
3. Подготовка текста к машинному переводу на разные языки
4. Как мы собираем данные для обучения Kandinsky
5. Учим нейронную сеть генерировать текст
Повестка дня и полезные статьи:
1. Блокировка Docker Hub для России. Без паники разбираемся как работать дальше
Просто интересно почитать:
1. Метаверс ВТБ: как мы развиваем собственную платформу коммуникаций будущего
2. «Он среди нас»: синдром самозванца как один из самых распространенных недугов у айтишников
3. История подростка, взломавшего Twitter и укравшего миллионы
4. Матричный шрифт с анимацией на микроконтроллере
И поставьте реакцию, если дочитали до конца🤑
❤ 12❤🔥 6👍 5🐳 2
😚Что такое kaggle и с чем его едят?)
Поскольку много новых людей в канале📈, хочется рассказать о том, чем я периодически живу и почему уйти в хакатоны на 2-3 месяца выглядит нормальным🤑.
🤓Kaggle - это платформа для проведения хакатонов и обучения, с огромным количеством ноутбуков и датасетов, а также огромным комьюнити. Причём каждый на этой платформе может найти свое место относительно уровня подготовки, так как здесь есть огромное множество курсов(все на английском, так что еще и язык прокачаете) и большое количество ноутбуков других людей для постоянного развития своих навыков🍀. И так давайте рассмотрим небольшой roadmap для вхождения на kaggle с максимальной отдачей для вас.
1️⃣Понимание основных библиотек
Чтобы там не было, но без pandas и numpy никуда, так что предлагаю парочку курсов на stepik.
Курс по pandas
Курс по numpy
Что в первом курсе, что во втором, не советую проходить полностью, скорее просто пролистать и поделать задания
Курс kaggle по Pandas
Также было бы славно иметь минимальное понимание по теорверу и матстату, от себя могу посоветовать книжку "Статистика и котики"💪🥺
2️⃣Курсы на kaggle для понимания как работает платформа
1. Intro to Machine Learning
2. Intermediate Machine Learning
3️⃣Далее, когда у вас уже есть некоторое понимание, что такое машинное обучение (если все еще что-то непонятно, то купите эту книжку), самое время переходить к практике. Для этого я всем советую курс Алерона(тимлид Додо и вообще классный чувак) под названием "Введение в соревновательный Data Science"🐱. Куча практики, множество ноутбуков, классные гости и неплохое объяснение материала. Также вы в подарок получаете классное комьюнити и возможность найти команду)))😇
4️⃣Теперь вы прокаченные слоны и дальше у вас есть 2 пути. Первое, это понять машинное обучение более фундаментально, понемногу заходить в глубокое обучение. Для этого можно прочитать хендбук по мл от яндекса или пройти курс по мл от вышки. В любом случае, вам придётся это делать перед собеседованиями и если у вас уже есть какие то пет проекты, то все можно пройти вообще месяца за 4⭐️
Или второй путь, который подойдёт тем, кто пока что хочет учиться, а не работать по 40 часов в неделю-это хакатоны на kaggle с призами💲. Они там на любой вкус и на все тематики. Как самый первый хакатон можно будет взять обучающий, которых на kaggle множество👽)
💗В общем, пишите в комментарии, как вам пост, и что бы вы ещё хотели увидеть в этом канале?)
❤ 15👍 8🔥 5❤🔥 3🌭 1🫡 1
Выберите другой тариф
Ваш текущий тарифный план позволяет посмотреть аналитику только 5 каналов. Чтобы получить больше, выберите другой план.