cookie

Sizning foydalanuvchi tajribangizni yaxshilash uchun cookie-lardan foydalanamiz. Barchasini qabul qiling», bosing, cookie-lardan foydalanilishiga rozilik bildirishingiz talab qilinadi.

avatar

topdatalab

Канал поддержки книги «Как монетизировать данные». https://topdatalab.ru

Ko'proq ko'rsatish
Reklama postlari
820
Obunachilar
+124 soatlar
+47 kunlar
+430 kunlar

Ma'lumot yuklanmoqda...

Obunachilar o'sish tezligi

Ma'lumot yuklanmoqda...

Много накполенных маленьких ошибок перемножаются между собой и превращаются в большую и жирную ошибку. Не ругайте меня за перфекционизм, когда я пытаюсь ликвидировать все маленькие ошибки насколько это возможно. Это касается не только BI, но и ML моделей. Garbage In, garbage out. Часто я сталкиваюсь даже с сопротивлением инженеров: “да у нас тут и так криво и косо, нет смысла лечить эту ошибку”. Смысл есть - я хочу быть уверенным, что в том месте никакой ошибки нет, чтобы я не тратил время на поиски в этом месте.
Hammasini ko'rsatish...
👍 11🤪 1
Почему ML инженер должен не только умело применять существующие Machine learning модели, но и уметь писать их с нуля? Сегодня я столкнулся с ситуацией, когда написанная мной Loss функция отказывалась считаться в LightGBM. С точки зрения математики все было правильно. Дьявол оказался в деталях. https://github.com/microsoft/LightGBM/pull/1199 7 лет назад они сделали патч, который просто сделал для L1 loss hessian = 1, а не нулю (вторая производная). Выглядит очень нелогично, но поменяв 0 на 1 у меня все заработало. Если бы у меня не было опыта написания ML, то скорее всего я бы не разобрался. Если вы ML инженер, и все написанное выше полная белиберда, то рекомендую заняться самообучением. Чуть выше я уже писал про отличный разбор алгоритмов ML, их анализом и кодированием. (https://t.me/topdatalab/345) PS: Завтра до четверга я прилетаю в Хаарлем (Нидерланды), если есть желание встретится вечером - пишите
Hammasini ko'rsatish...
👍 2🔥 2🤯 1😱 1
Зарегистрировал компанию в UK - заняло час. Делала бухгалтер Открыл сам счет в Монзо за 10 минут - вот это скорость! Я правда там и депозиты держу, и кредитку. Все сильно проще, чем когда я открывал компанию в США - другие деньги и другое время ожидание открытия счета в Mercury
Hammasini ko'rsatish...
👍 5🔥 4
В связи с новой работой я ушел в глубокий Machine Learning. Получаю огромное удовольствие от чтения научных статей. Например, мне нужно знать все детали алгоритма LightGBM. Я пошел на сайт самого LightGBM, скачал оттуда статьи и читаю. Дальше интереснее. А вдруг кто-то на пальцах объяснил, как это все работает? И не для новичка, а прямо по paper самих создателей? Почему? Потому что только создатели могут объяснить пару параметров, который не засветились на конкурсах Kaggle. И случайно нашел незаслуженно непопулярный канал https://www.youtube.com/playlist?list=PLgaemU2xZlTieGRRTAdDlHOgxr-bs6pfr (автоперевод с корейского) Но как мне нравится то, как автор объясняет, ему бы лекции читать (скорее всего так и делает)
Hammasini ko'rsatish...
Machine Learning (2) - Ensemble models

I will summarize the ensemble model in Machine Learning one by one. 8. Random Forest - OOB, Proximities, Missing value, Outliers 9. Adaptive Boosting (AdaBoo...

12🔥 6👍 5
А вот и структурные данные подъехали (табличные), которые пока плохо обрабатываются LLM “Symbolica is a startup developing new foundational deep learning models for structured reasoning, based on principles of category theory, type theory and functional programming. Specifically, we aim to develop models which manipulate structured data, learn algebraic structure in it, and do so with an interpretable and verifiable logic. To that end, we are developing new mathematical foundations for deep learning” https://www.symbolica.ai/ Их научная база: http://www.categoricaldeeplearning.com/ Кто изучал функциональное программирование - будет интересно
Hammasini ko'rsatish...
Мне до сих пор до конца непонятно, как LLM повлияет на рынок труда. Но то, что влияние будет существенным это факт. У меня довольно плохо с памятью, я мало помню точно, но помню принципы. И GPT мне помогает «помнить» синтаксис Python или Scala, как что-то сделать с помощью какой-нибудь библиотеки. Мне лично LLM уже сэкономил много времени даже на личном проекте, я потратил в три раза меньше времени на написание проекта, чем если бы делал это без GPT. Также я сэкономил деньги - мне не пришлось нанимать специалистов на какие-то задачи, в которых я разбирался не очень хорошо. Продуктивность выросла, значит нужно еще меньше людей, чтобы сделать что-то существенное. Правда GPT не заменит вас как главного инженера, скорее младших разработчиков. Я прочитал и нашел полезной статью https://vc.ru/u/10179-vladislav-proshinsky/1201119-budushchee-menedzhmenta-v-epohu-ii-pipl-menedzhery-vs-menedzhery-modeley думать об этом нужно уже сейчас. Я пытаюсь сделать большее - чему учить своих детей? Пока мне непонятно :(
Hammasini ko'rsatish...
​Будущее менеджмента в эпоху ИИ. Пипл менеджеры vs Менеджеры моделей — Vladislav Proshinsky на vc.ru

В 2024 году на работу начинают активно «выходить» Со-пилоты, ИИ агенты, которые могут выполнять часть работы вместо людей, и даже в некоторых случаях это делают лучше. Тренд на ИИ растет, растет и спрос на новый вид менеджеров — менеджеров моделей. Нанимать людей на выполнение задач становится «не модно», увольнения растут. Люди — прошлый век?

🔥 5👍 4 1
Отчитываюсь по собеседованиям! Забегая вперед напишу, что я выхожу работать в начале июня --Финтех стартап - VP of data - отказался сам Здесь на Canary Wharf запускается новый финтах стартап. Примерно в течение месяца у меня было четыре интервью с ними. Вчера было последнее, где я уже сообщил, что мне сам финтех уже не так интересен. То есть я отказался сам, но мы оставили возможность для консультаций. --Стартап в области тревел - VP of data - отказался сам Было пару интервью. Я отказался сам от продолжения. --British Petroleum - Staff Data Analyst - продолжаю Сегодня было техническое интервью с CTO. Первые полчаса мы разговаривали в том числе, как стимулировать сотрудников не уходить из-за скучной работы. Вторую часть времени я решал задачу - проектировал структуру таблицу для сервиса такси и писал SQL скрипт для вычисления метрики. Метрика звучала так - нужно найти города, где самый большой разрыв между числом клиентов и водителями. Задачу я решил. Но она была с изюминкой и в лоб ее не решить. На следующей неделе у меня техническая презентация для группы людей. --Intercom - Senior ML engineer - мне отказали Я уже писал выше о первых трех интервью и их восхитительном процессе найма, когда мне дали полную обратную связь, а именно что каждый интервьюер написал про меня. В понедельник у меня было четыре интервью: 1) Техническая презентация - прошел 2) ML skills - прошел 3) Personal values - прошел 4) Технические дизайн - не прошел :(. Запутался в деталях и все делал медленно. Сегодня я созванивался с рекрутером. Как и после первых интервью он зачитал мне персональное мнение интервьюеров. Общий мой недостаток - ухожу в сторону, не хватает ясности в моих объяснениях. --Высокочастотный трейдинг - ML researcher - получил оффер Как вы помните из постов выше, мне дали тестовое задание, и я потратил почти три недели своего времени на ее решение. В абсолюте я задачу не решил, но мои подходы к ее решению очень понравились. Потом у меня было интервью с Head of ML. Следующим шагом мы начали обсуждать оффер. Здесь я сам предложил тестово поработать. Мне пошли навстречу, и буквально на следующий день я приземлился в Амстердаме. Поработав с ними три дня я понял, что это мое, так как напомнило мне мои времена в Retail Rocket: задача очень сложная и требует много математике и экспериментов. Оффер я принял, выхожу работать в первых числах июня.
Hammasini ko'rsatish...
🔥 38👏 13 12
Целый день работал и смог запустить metabase поверх retenly.com Теперь каждый зарегистрированный пользователь имеет прямой SQL доступ ко всем данным британских компаний, включая импорт и экспорт. Закрытая бета - если нужен доступ маякните мне Подробности технический реализации: 1) использовался драйвер Metabase Duckdb https://github.com/MotherDuck-Open-Source/metabase_duckdb_driver 2) я включил Google авторизацию в nginx и metabase - не нужно помнить пароль
Hammasini ko'rsatish...
GitHub - MotherDuck-Open-Source/metabase_duckdb_driver: Metabase DuckDB Driver shipped as 3rd party plugin

Metabase DuckDB Driver shipped as 3rd party plugin - MotherDuck-Open-Source/metabase_duckdb_driver

🔥 5 1
Photo unavailableShow in Telegram
Посмотрел статистику Retail Rocket на BuiltWith. Горжусь своим вкладом и всех причастных к такому серьезному результату! Много работы было сделано
Hammasini ko'rsatish...
👍 9
Low ego / team player вижу в вакансии, которую прислали. Вообще много, где так пишут. Интересно, насколько отличается эффективность low ego от high ego? Может ли быть high ego хорошим team player? Следующий вопрос - работает ли это на уровне акционеров и высшего менеджмента? Ведь цель любого бизнеса - прибыль любой ценой
Hammasini ko'rsatish...
👍 1 1
Boshqa reja tanlang

Joriy rejangiz faqat 5 ta kanal uchun analitika imkoniyatini beradi. Ko'proq olish uchun, iltimos, boshqa reja tanlang.