cookie

Sizning foydalanuvchi tajribangizni yaxshilash uchun cookie-lardan foydalanamiz. Barchasini qabul qiling», bosing, cookie-lardan foydalanilishiga rozilik bildirishingiz talab qilinadi.

avatar

Sberloga

Data Сообщество По всем вопросам обращаться @SberlogaHelperBot Чат - @sberlogadataclub

Ko'proq ko'rsatish
Reklama postlari
2 538
Obunachilar
+124 soatlar
-57 kunlar
-230 kunlar

Ma'lumot yuklanmoqda...

Obunachilar o'sish tezligi

Ma'lumot yuklanmoqda...

Repost from Reliable ML
Photo unavailableShow in Telegram
Секция Career от Reliable ML на Data Fest 2024 25 мая в офисе VK, Москва Всем привет! Есть у нас с Димой такая традиция, каждый год в конце мая мы организуем секцию Reliable ML на Data Fest. А в этом году делаем аж три секции. А все почему? Потому что очень много крутых докладов. Приходите послушать и обсудить! Публикуем расписание секции Карьера, которая пройдет 25 мая офлайн в офисе VK в Москве. Сначала поговорим с вами о рынке труда и карьерных вопросах со стороны работника/кандидата, а потом - со стороны руководителей команд. Регистрация на площадку на 25 мая тут. В этот же день после обеда будет вторая наша офлайн секция - Data Strategy. Расписание опубликуем чуть позже. Ваш @Reliable ML #datafest #offline #ods #career #reliable_ml #business
Hammasini ko'rsatish...
1
Photo unavailableShow in Telegram
👍 19🤣 11👎 1
💻 Улучшаем навыки программирования! 💬 Уже занимаюсь DS наверное лет 10, еще с тех пор когда слова "Data Science" даже не употреблялись. И, как мне видится, за все это время мало что изменилось с точки зрения написания кода - сложно читаемый, не воспроизводимый и непригодный для использования в production-системах. Кроме этого выявляются многочисленные проблемы, такие как нарушение логики, лики, ошибки реализации тех или иных функций которые в конечном счете влияют на результат. 💬 Хочу поговорить о том как можно улучшить свои скилы в плане написания production ready кода. Ниже представлены несколько ресурсов, которые помогут систематизировать информацию, понять текущие пробелы в знаниях и начать их изучение: 1⃣ https://goodresearch.dev/ Сайт с базовыми знаниями о том как создавать и вести любой научный проект. От создания структуры проекта, работы с git, написание кода, документации, тестов и т.д. Кратко, понятно, а главное все по делу. Где нужно - есть дополнительные ссылки с более детальной информацией. В общем если вы видели в своей жизни только jupyter notebook и не знаете с чего начать более сложный проект - начните с этого сайта. 2⃣ https://refactoring.guru/ Паттерны проектирования - нужно знать. Вы же на python код пишите все-таки. Кроме этого есть отдельный раздел по рефакторингу кода, который содержит типичные ошибки при написании кода и принципы которые помогут избегать их. У меня сложная история с изучением этого материала, связанная с написанием проекта по парсингу документов судебных решений. История полная боли, ошибок, самоосознания насколько фиговый код я пишу, и в итоге - переписыванием кода с нуля, причем 2 или 3 раза. После переработки, код стал чище, понятнее, а главное - можно было легко его доработать. Мой совет - изучите тему, даже если не все запомните, при реализации проекта вам будут приходить правильные мысли и возможно не потратите уйму времени на переписывание собственного кода. 3⃣ Lott Phillips - Python Object Oriented Programming 4th Edition (2021, Packt) ООП в python. Конечно я считаю, что посмотрев 2 скринкаста ниже можно основную информацию подчерпнуть сразу потратив всего 2 часа https://www.youtube.com/watch?v=r1Y7m5bB7l8 https://www.youtube.com/watch?v=Eetg5HIxNow Прочитать книгу все равно рекомендую если вы хотите улучшить свои хард скилы 4⃣ Luciano Ramalho - Fluent Python- Clear, Concise, and Effective Programming (2022, O'Reilly Media) Думаю эта книга станет отличным дополнением для людей которые уже знают python и хотят узнать что-то новое. Там с первых строк будет понятно, что книга не для новичка - concurrency, async, метапрограммирование, датаклассы, ООП, функции, структуры данных. Вас ждет погружение в мир Python на максималках 🧑‍💻 Напишите в комментах свои рекомендации и чем вы пользовались
Hammasini ko'rsatish...
The Good Research Code Handbook

This handbook is for grad students, postdocs and PIs who do a lot of programming as part of their research. It will teach you, in a practical manner, how to organize your code so that it is easy to understand and works reliably.

🔥 11
🔎 Ищешь работу в сфере аналитики, датасаенса или дата инженерии? Тогда подписывайся на канал в Telegram - Sberlogajobs! 📊 У нас публикуются только актуальные вакансии от ведущих компаний. Мы поможем тебе найти работу мечты! 💼 Подписывайся прямо сейчас: https://t.me/sberlogajobs Не упусти свой шанс на успешное трудоустройство! 😉 #vacancy #jobsearch #analytics #datascience #dataengineering
Hammasini ko'rsatish...
Sberloga Jobs

Data Вакансии По всем вопросам обращаться @boyadzhi

🔥 3👍 1
Митап Победителей в Лотерею 27 февраля! Всем привет! Как вы, возможно, знаете Гипотеза Лотерейного Билета предполагает, что в нейросетях можно найти мощные подсети, способные обучаться не хуже полных сетей. Наши друзья погрузились в тему и хотят рассказать об этом. Приходите на наш митап, чтобы узнать о том, как можно выявить и оптимизировать такие подсети, и как это открывает двери к нейросетям следующего поколения. 🚀 🔍 Что будет на митапе: - Узнаем какой прогресс по этой теме существует в мире. - Посмотрим на работу с подсетью MobileNet_V3, потерявшей половину весов и менее 1% accuracy без дообучения весов. - Откроем черный ящик нейросетей и разберемся, что происходит внутри. - Поговорим про перспективы и возможности для разработки совсем иных нейросетей с меньшим количеством параметров, но с гораздо большими возможностями. На мероприятии выступят: - Голощапов Владислав (независимый исследователь) - Денис Кузнеделев (Сколтех, Центр технологий искусственного интеллекта, Резидент исследовательского отдела ООО «ЯНДЕКС», лауреат Yandex ML Prize) 🌟 Доклады: 1. Ансамбль синапсов – структурная единица нейронной сети (Влад Голощапов) 2. История Оптимального хирурга для спарсификации нейронных сетей, в теории и на практике (Денис Кузнеделев) 3. Глубокий анализ полезности весов - путь к успешному прунингу (Влад Голощапов) 4. Как извлечь пользу из прунинга. Нейросети с адаптивно обучаемой архитектурой (Влад Голощапов) Обязательная регистрация по ссылке 📅 27.02.2024 🕓 18:00 - 22:00 📍 Точка кипения ODS Moscow
Hammasini ko'rsatish...
🔥 3👍 1
00:21
Video unavailableShow in Telegram
😁 32💯 3
Photo unavailableShow in Telegram
Коллеги, всем привет! Давно мы не сообщали об обновлениях LightAutoML, но все это время мы не сидели сложа руки - сегодня ночью на PyPI появился релиз LAMA 0.3.8.1 с множеством полезных обновлений: 1) Теперь из коробки вам доступны 9 SOTA архитектур табличных нейросетей таких как MLP, DenseNet, DenseLight, ResNet, SNN, TabNet, NODE, FTTransformer и AutoInt++. Также были добавлены SOTA методы кодирования признаков - PLR и SoftEmb. 2) По многочисленным заявкам в LightAutoML был добавлен алгоритм SSWARM для расчета Shapely значений итоговой модели. Алгоритм позволяет работать с произвольной итоговой моделью (состоящей не только из бустингов) и если сравнивать его с KernelExplainer из SHAP, то удается получить нужные значения на 2-4 порядка быстрее (примерно на уровне TreeExplainer, который поддерживает только бустинги). 3) Всеми любимые отчеты о разработке моделей теперь можно строить для TabularUtilizedAutoML пресета 4) В новой версии LightAutoML поддерживает версии питона 3.8 - 3.11 включая оба конца, что позволяет использовать ее как на Kaggle, так и в Google Colab 5) Исправлено большое количество добавленных ранее багов и проблем с зависимостями (так, например, решена проблема с версией scikit-learn - теперь случайный лес работает в мультиаутпут задачах и временных рядах) 🙃 С примерами использования нововведений можно ознакомиться в нашем обновленном туториале и в кернелах (Tabular_NN, SSWARM_SHAP) на Kaggle. Будем рады услышать ваш фидбек, а также вопросы/замечания/предложения по работе LightAutoML
Hammasini ko'rsatish...
👍 10🔥 3
I'ML Meetup: Обучение и запуск в прод моделей на больших данных Дмитрий Бугайченко, Сбер — «Практический ML на больших данных» Сергей Саввов — «Слияние LLM» https://wildcard.timepad.ru/event/2746307/?utm_campaign=JRG_IMLmeetup&utm_medium=newsletter&utm_source=email
Hammasini ko'rsatish...
I'ML Meetup: Обучение и запуск в прод моделей на больших данных / События на TimePad.ru

I’ML — мероприятия от JUG Ru Group для всех, кто использует ML в проектах. Обсуждаем общие проблемы машинного обучения, изучаем лучшие методы работы с ним на практике, запускаем и поддерживаем модели в проде, делимся историями успехов и неудач. В подкастах и на митапах, а в будущем — и на конференции.

👍 6
2024-1-1
Hammasini ko'rsatish...
15👀 8🗿 3🤔 1
С наступающим! В последний рабочий день рекомендую посмотреть на еще одну либу наших друзей: Augmentex - твой карманный аугментер текста. Мы недавно вместе с коллегами опубликовали супер-либ SAGE. И зовётся супер-либ не случайно, тк состоит из генеративной части и нашей библиотеки Augmentex. Если вы хотите получить возможность аугментации текстов на основе добавления опечаток, перестановок и др. и вам не нужны механики генеративной аугментации или custom имитации ошибок- это ваш выбор. Иначе юзайте SAGE. Например, Augmentex работает на CPU и умеет, на основе general частот ngramm, заменять корректные символы/наборы символов на их комплиментарные ошибки. Тоже самое можно делать и на уровне слов. Встроена возможность добавлять пробелы между символами или склеивать слова и многое другое, см. мануал в репо. Мы уже поддерживаем 2 языка - русский и английский, а также имитации general ошибок ввода с ПК и мобильной (поддержка Android/IOS раскладок) клавиатур. Также мы планируем добавить наши bbox атаки , о которых я говорил в своих постах и на выступлениях. Атаки включают и encoders и LLM дискриминацию. Следите за обновлениями! P. S. Использование атак в генерации батча при обучении наших моделей, добавляет устойчивости и апает метрики качества на 2-5%. @dealerAI Ставьте звездочки и присылайте свои либы о которых хотите рассказать (@boyadzhi)
Hammasini ko'rsatish...
GitHub - ai-forever/augmentex: Augmentex — a library for augmenting texts with errors

Augmentex — a library for augmenting texts with errors - GitHub - ai-forever/augmentex: Augmentex — a library for augmenting texts with errors

🔥 7👍 3 3👎 1