Дата канальи

Ir al canal en Telegram

Данные / ML / AI / аналитика в корпорациях. Для связи @NikitaZelinskiy (реклама и консультации по AI/ML для бизнеса)

Rusia97 009 Tecnologías y Aplicaciones16 691

6 061

Suscriptores

+1324 horas

+237 días

+6430 días

2 416

Visitas de la publicación

~ 1 06024 horas

~ 1 20448 horas

39.90%

Tasa de compromiso

Sin datos

Mensajes por día

Ads index

beta

Archivo de publicaciones

6 058

Repost from Data Science

Updated 2204-page PDF Mathematics ebook: "Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Machine Learning" Find it here: https://cis.upenn.edu/~jean/gbooks/geomath.html

6 058

#ML В книжке, на секундочку, примерно 2200 страниц — и , как гласит заголовок, в ней ровно то что нужно в ML и CS. Отчего-то сомневаюсь что успешные MTS глобальных бигтехов даже половину знают Но сама яма весьма злободневна Неделя прошла в дискуссиях с людьми, связанными с образованиями: методологом, деканом факультета, владельцем онлайн-школы, преподавателями и семинаристами и, само собой, c супругой (ибо вопрос образовательной траектории детей стоит как всегда остро). Мне кажется что в эпоху когда школьники уверенно берут межнар по ИИ (а задачи с него будут и мидлам-синьорам вполне интересны) и выходят интернами в Antropic, ценность школьных знаний и шестилетнего притирания штанов в ВУЗе радикально сокращается. Вот и наши реформаторы тоже вводят понятие базового высшего образования — чтобы сразу после бакалавриат в аспирантуру. Да и в бакалавриате, кмк, надо не историю и обж учить — и тогда, как и в условном Оксфорде, можно его будет за 3 года заканчивать. В чем тогда ценность образования, особенно школьного? Кмк, вообще не в знаниях — а в среде и получаемых навыках: - [ ] преодолеть трудности - [ ] , оптимизировать аллокацию времени между активности - [ ] , организовать процесс усвоения знаний и самопроверки - [ ] , навык коммуникаций - [ ] , приоритизация поступающей информации - [ ] , навык в долгосрочную мотивацию - [ ] , навык общения на иностранном языке Или я что-то упускаю? Вообще, вижу будущее образования скорее в кружках по интересам — вроде наших ML-тренировок чем в массивных университетах с избыточной ригидной программой.

6 058

#кейсы #корпжиза Познакомился на SH с несколькими CTO, в крупную клетку в изрядном подпитии они тяготели к одной из двух крайностей: —> business first, с трудом убеждаю что на техдолг и миграцию тоже нужны ресурсы —> меня мнение VP от бизнес-вертикалей не колышет, трансформирую бизнес как хочу — то есть ИТ выступает драйвером бизнес-трансформации В ходе дискуссии ребята поделились историей про соседний мобильный оператор, в котором CTO настоял на персональном ценообразовании клиентов в офисе продаж: в момент покупки симки формируется персональная скидка на тариф. Полгода ИТшники делают дорабатывают рабочее место продажника на точке, офферстор, интеграции и прочее, DS пилят модели. Как итог — откликов почти нет, DS получают порционно разививающую обратную связь Через пару недель DS тим лид едет к родителям в Сызрань, заходит в точку продаж и пытается купить симку, ожидая какой же тариф ему предложат. Ему предлагают тариф в 3 раза дешевле в месяц пакетом на 3 месяца, бандл с бесплатной банковской карточкой — про которую продажник доверительно сообщает что если ее не активировать и не пользоваться то ничего страшного и не произойдет — а через три месяца в приложении или на сайте уже можно будет выбрать нормальный тариф 😅 (то есть оплачиваемое продвижение тарифов с дружественными картами, что более интересно из коробки тк дешевле в 3 раза, за которые тоже забашляли другие вертикали) Мне почему-то кажется, что во всей этой истории зарабатывал только продажник на точке — план по продаже карт он явно выполнял. Спасло бы ситуацию взаимодействие с клиентом только через цифру? или "правильные" (а какие?) KPI на продажников? Еще что-то?

6 058

В опросе между пятницей и субботой победило воскресенье 😅 Теперь все готово и смело могу пригласить вас снова к нам в гости! Мы в МТС True Tech совместно с ВТБ второго августа организуем масштабное мероприятие в Москве для DS-сообщества «Урбан ML». 17 докладов, мастер-классов и дискуссий с сильными экспертами из MWS, ВТБ, X5, Звук, Альфа Банка и других крупных компаний. Поговорим про рекомендации, антифрод, агентов, на мастер-классе научим использовать LLM для реокмендаций 2026 года) Будем отдыхать и общаться весь день! Между докладами можно будет сыграть в ИИ-шахматы, баскетбол и настольный теннис. Вечером - афтепати с 🍺 и диджей-миксами под открытым небом. Участие бесплатное, но места ограничены. 👉 Успейте зарегистрироваться Буду рад всех вас видеть, в прошлые разы очень душевно вышло!

6 058

Прислали как должна выглядеть настоящая рыбалка !

6 058

#ML #кейсы История из одного чатика лидов. Что думаете — девочка фродстер или нет? Первый лид:

@datarascals , вот ты любишь рофлы собирать всякие, ещё один принес. Может ещё у кого есть - делитесь)) Не знаю, почему мне так везет, либо фродеров стало ооочень много 😢 Девушка подключилась на собес, попросил расшарить экран. И она прям в реальном времени курсом вытаскивает снизу чёрное окошко (выделил красным кругом). Я ее спрашиваю, что это за программа - у нее неожиданно ломается микрофон и она не может ответить. Выходит со встречи, перезаходит - черного окошка уже нет и все норм 😁 Все чистенько, красивенько Тем не менее - задачи решила почти идеально с первой попытки, на вопросы отвечала быстро и уверенно. И вот вопрос - это был фрод или нет? Если б не этот ее косяк в начале встречи - я б вооообще не заподозрил ничего. Можно ли доказать, что после переподключения она читерила? Ды в целом нет... Может она реально шарит

@второй лид , передо мной у тебя с ней был собес тоже, 6 июля. Почему потребовался повторный?

Второй лид:

Во время собеса она не вытаскивала программы никакие Она перезаходила на встречу и микрофон лагал, на это много времени убили

<…>

Да, лагать у нее все начало на моменте, когда мы открыли вместе coderpad с условием задачи. Интересное совпадение

6 058

#оффтоп Последние несколько месяцев в личку стучатся с запросом «где научиться нормально вайбкодить» вполне себе матерые разрабы / девопсы / MLE. Хотя ответ, казалось бы очевиден: Абсолютно бесплатно в первоисточниках 1. Open AI Academy, Codex for Builders 2. Antropic Academy, Claude Code in Action Но если вам вдруг не хватает дисциплины, живого человеческого общения, жарких дискуссий и ревью от пиров и преподавателей по вашей реальной задаче — есть недорогая альтернатива, которую запустили знакомые парни в кепках и без: 12 недельный буткэмп по агентной разработке С пылу с жару, прошел только первый поток. Получилась отличная актуальная программа с хорошими оценками и отзывами, рассчитанная на мидл-плюс / синьорных разработчиков и руководителей разработки, которые хотят вкатится в агентный инжениринг (есть практика, что на него идут продакты, но будет тяжело, расчет на хороший инженерный бэкграунд, имейте ввиду) Скоро, 14 июля, стартует второй поток. Включайтесь пока еще есть места Цель программы: освоить ai-driven разработку, встроить агентов в SDLC команды и повысить скорость разработки. Практика: Предстоит практиковать с агентами, их оркестрацией и автоматизацией продуктового цикла. Разберётесь, как агентами решать задачи по реализации фич, рефакторингу, тестированию, покрытию документацией, как в целом работать с легаси и оптимизировать контекст. Будет большой фокус на Specification Driven Development, разберетесь с MCP, RAG-системами и управлением контекстом А по жирному тарифу "Активная практика" на каждый урок можно приносить свои боевые задачи и разбирать вместе с группой и преподавателями Авторы и преподаватели: программу ведут практики с 15–18 годами опыта: ex‑Yandex Cloud, ex‑Meta, staff-инженер Google, директор центра по найму разработчиков и автор десятков курсов для МФТИ, РАНХиГС, Яндекс.Практикума, Центрального университета, а также ex-директор по AI Сбера, лид AI-транформации продуктовых команд Формат: 12 недель, 17 уроков, 5 модулей. Синхронно, живые эфиры вечерами по 1-2 занятия в неделю по 2-3 часа, с расчетом на 3 часа самостоятельной практики между ними (советую практиковать больше, все вечера и выходные. Это огромное удовольствие. Плюс я считаю, что в это нельзя чуть-чуть поигрывать. Надо нырять с головой) Как методологически проходит занятие: минимально необходимая теория, разбор кейса, групповая практика прям на вебинаре, плюс домашки на гитхабе и доступна библиотека примеров \ материалов в помощь. https://naition.ai Промокод ЗЕЛИНСКИЙ даст 20% скидку. А для друзей и коллег можно получить еще +10%. П.С. Также ребята пилотируют B2B спец-формат для команд, если вы как бизнес хотите прокачать свою команду.

6 058

Repost from South HUB

Доклады South HUB кэмп 2026 вышли в записи! AI, лидерство, роботы, карьерные повороты и решения, которые меняют самих лидеров и их компании. Теперь можно поставить на паузу, вернуться на сильную мысль и переслушать момент, который в зале пролетел слишком быстро или впервые проникнуться мыслями, прозвучавшими со сцены пятого кэмпа. 💬 Смотреть в VK / 📹 Смотреть в YouTube Вас ждёт концентрат идей — личные истории, технологическая глубина и тот самый эффект, когда после выступления хочется что-то пересобрать у себя.

6 058

#кейсы #ML ML System Design учит что начинать желательно с какого-н бейзлайна Часто внедрение такого бейзлайна требует определенной наглости Например, cамая простая стратегия ценообразования: 1. Поднимаешь цены всем клиенты (на дельту с небольшой окрестностью) 2. Возвращаешь нормальные тем кто жалуется / встал на лыжи 3. Обучаешь модель определения «нечувствительных к цене» (далекий предок эластичности — кривой-то у нас нет) 4. В дальнейшем повышаешь только им А теперь наглость — как такой подход выглядит в отчете аудиторам:

Проблема: Ежедневный пересчет депозитных ставок по формуле (ETC - ФОР - АСВ - Opex - EVA) создает естественную волатильность, к которой клиенты уже адаптировались. Проведенный анализ клиентского поведения выявил сегмент, демонстрирующий низкую чувствительность к колебаниям процентных ставок. Для таких клиентов возможно применение пониженных ставок относительно рекомендованного казначейством уровня без риска оттока. При этом сохраняется возможность оперативной корректировки условий в случае изменения рыночной конъюнктуры. Данный подход позволяет оптимизировать стоимость фондирования, создавая дополнительный маржинальный доход, в то время как клиенты, для которых ставка остается ключевым фактором, продолжают получать конкурентные условия. Важно отметить, что подобная практика требует регулярного мониторинга клиентской реакции и своевременной адаптации параметров предложения. Задача: снизить эффективную ставку по привлечению не допустив оттока клиентов и просадок в ликвидности. Решение: На первом этапе был проведен эксперимент по сбору данных, в рамках которого выборочно предлагалась пониженная депозитная ставка для части клиентов. Это позволило сегментировать клиентскую базу на две группы: нечувствительных к изменению ставки (согласившихся на пониженные условия) и чувствительных (отказавшихся от предложения). На основе этих данных была построена Look-a-Like модель, которая выявляет клиентов с характеристиками, аналогичными нечувствительной группе. Для таких клиентов впоследствии применялась ставка ниже рекомендованной казначейством, что позволило оптимизировать стоимость привлечения ресурсов без потери клиентской базы. При этом сохранялся принцип прозрачности - клиенты заранее информировались о возможных колебаниях ставки, а сама модель регулярно пересматривалась с учетом новых данных о поведении клиентов. Такой подход создает баланс между доходностью для банка и приемлемыми условиями для лояльных клиентов, демонстрирующих низкую чувствительность к изменениям процентных ставок. Деньги: удалось стат. значимо снизить эффективную ставку привлечения на 0.02%

На оборотах крупного банка за год — это сотни миллионов рублей

6 058

Repost from partially unsupervised

Давние читатели канала помнят, что когда-то в древние времена мы с Валерой написали книжку про ML design. Это было так давно, что люди тогда умели не только читать по диагонали, но еще иногда писать, а книги были значимым артефактом для упаковки знаний. С тех пор утекло немало воды, работу делают агенты, и книгам они предпочитают скиллы. И вот мы с клодом наконец добрались перепаковать одно в другое: ML system design в форме скилла с набором рубрик для ревью. Устанавливается одной командой через skills.sh, умеет ревьювить дизайн-доки и ML проекты лучше агента из коробки и ~~чесать нам эго~~ ненавязчиво ссылаться на авторов как могучих авторитетов.

6 058

Друг в соседнем чате глаза открыл на советские космические лазерные пистолеты, которыми вооружали космонавтов — до сих пор под впечатлением, думал только в фантастике такое

6 058

Кто-то уже понял как оно работает? Долго казалось что foundation model для табличек это оксюморон (по временным рядам про FM тоже был скепсис , хоть я и сам читал по ним лекции и пробовал в деле) https://research.google/blog/introducing-tabfm-a-zero-shot-foundation-model-for-tabular-data/

6 058

Отрицательный рост акций в 7 раз за пару лет

6 058

#корпжиза Как вам интервью ген директора Диасофта? Каналья или нет?

6 058

Банк N26 успешно отсыпал агентов в потные ручонки HR. Такое вот письмо с заголовком "Head of Data Science - Generative AI Interview Follow-Up" пришло на днях товарищу

6 058

#ML Поймал тут за руку лида, который не знал как negative sampling связан с метриками — и при обучении огромного трансформера на даунстрим-задачах у него было "все хорошо". Многие слышали что при огромном дисбалансе классов (event rate, например, в рекламе или антифроде вполне может быть 1 на миллион) roc_auc (или gini что почти то же самое: gini = 2*roc_auc - 1) становятся непоказательными. Но насколько? Давайте проверим — сделаем вид что у нас уже есть откалиброванная модель и по ней уже получен бинарный предикт (чтобы не возиться со скорами и трешхолдами):


y_true= np.zeros(1_000_000, dtype=int) 
y_pred = y_true.copy() 

y_true[1:51] = 1 
y_pred[1:20] = 1 # 19 из 50 мы угадали = TP
y_pred[99:120] = 1 # еще 21 пометили зазря = FP

А теперь давайте после после последнего, назначенного единичкой, элемента, добавлять нолики — которые модель верно определила ноликами. Что произойдет с метриками? У нас в этом примере нет скоров — только бинарные ответы Gini начнет расти до своего теоретического предела — recall. Precision и recall не поменяются. Вайбкод для картинки А что произойдет с метриками если все же будет модель, которая будет выдавать скоры? Тогда вместо одного трешхолда полезнее смотреть качество в верхнем сегменте: precision@k, recall@k, lift@k, где k выбирается как фиксированное число или как доля объектов. Например, можно брать k = event_rate * n, то есть выбирать top-k объектов по скору И вот тут ROC-AUC/Gini особенно легко вводят в заблуждение: они оценивают глобальное ранжирование всех positive-negative пар, а бизнесу часто важна только самая верхушка скоринга Что делать чтобы меньше возиться? Можно начать с площадью под кривой precision-recall

6 058

#субботние пет-проекты https://pomoex-66.ru/ Парни навайбкодили для инвесторов в акции график индекс vs ВВП, терминал впечатляет

6 058

Никогда раньше не видел вживую

6 058

#кейсы #ML #корпжиза Есть два типа ML-кейсов: в одних полностью автоматизируется принятие решений — например , выдача кредита, открытие расчетного счета, выявление дефектов и пр. А в другом после работы моделей (а часто достаточно сложных систем из десятков моделей, эвристик и бизнес-правил) решение принимает все же человек — сотрудник или клиент — в целом не так важно. Те, кто работает с рекомендациями и поиском отлично знают про разные biases — selection bias, position bias, popularity bias и прочее и прочее Но есть еще один тип bias который не так популярен в публикациях на открытых датасетах — «уважаемый человек попросил». Самое близкое к этому по смыслу — промотируемые объявления / позиции (как раз надежда поэксплуатировать positional bias чтобы срубить еще денег) — все вы видели в публичных поисковиках или классифайдах на верхних позициях не самые релевантные, зато проплаченные объявления. Сейчас расскажу как он возникает Вызывает как-то шеф с задачей — давай сфокусируем продажников так чтобы продавали только те продукты, которые вот прям сейчас нужны клиентам и при этом принесут хорошую маржу. В постановке ничего удивительного — любой бизнесмен хочет чтобы и выручка и прибыль росли. Как это реализовать? Например, сделать в интерфейсе сотрудника окошко с самыми приоритетными задачами и объяснением почему они приоритетные и чего сам сотрудник с этого заработает. А приоритетность уж модели определят. Осталось только согласовать с HR схему мотивации и провести обучение. Идея вроде на поверхности, но результат показал только четвертый A/B (зато сразу рост конверсии с 3% до 12% и среднего чека в полтора раза). А почему? Ну потому как опытный менеджер шеф показал сие чудо другим топам. И каждый уважаемый Сан Саныч попросил чтобы его задачи (по продуктам его бизнес-вертикали) — не важно насколько его продукт хорош или подходит этому конкретному клиенту — тоже попали в это приоритетное чудо-окошко. Когда компании, занимающейся выловом сельди в Атлантическом океане предлагают застраховать всю ее ресурсную базу (то есть всю селедку в океане) — такие рекомендации доверие у сотрудников не повышают. Только после трех (!) прощальных пилотов удалось убедить шефа что так мы денег не заработаем и промо надо отдельным окошком (и отдельной строкой в мотивации продажников). Интерфейс получился достаточно красивый чтобы наш департамент получил американскую Gold Stewie Award (там кстати есть ссылка на ролик с самим приложением сотрудника) Только вот тайминг подвел — над чем громко посмеялся аж Financial Times PS Нужен ваш совет и вовлеченность Задаюсь вопросом почему в linkedin посты заходят гораздо хуже чем здесь. Проведем пару экспериментов — буду писать там и оставлять здесь ссылку, буду благодарен реакциям и набросам в комментах. Или лучше другая англоязычная площадка? Substack? Medium? Цель — интересно поделать ML-кейсов на широком рынке — обогатиться знаниями о повадках каналий в других странах (хотя несколько кейсов — Англии и Канады как минимум — в канале уже есть)