ch
Feedback
Дата канальи — дата / ML / AI / корпжиза

Дата канальи — дата / ML / AI / корпжиза

前往频道在 Telegram

Корпжиза аналитиков и DS. Если хотите анонимно поделиться историей на широкий круг -- го в личку @NikitaZelinskiy, аналогично по остальным вопросам

显示更多
5 859
订阅者
+324 小时
+167
+3530

数据加载中...

吸引订阅者
六月 '26
六月 '26
+47
在2个频道中
五月 '26
+108
在3个频道中
Get PRO
四月 '26
+60
在3个频道中
Get PRO
三月 '26
+96
在1个频道中
Get PRO
二月 '26
+268
在7个频道中
Get PRO
一月 '26
+163
在5个频道中
Get PRO
十二月 '25
+1 056
在7个频道中
Get PRO
十一月 '25
+735
在11个频道中
Get PRO
十月 '25
+170
在6个频道中
Get PRO
九月 '25
+240
在61个频道中
Get PRO
八月 '25
+215
在6个频道中
Get PRO
七月 '25
+1 412
在30个频道中
Get PRO
六月 '25
+351
在58个频道中
Get PRO
五月 '25
+39
在1个频道中
Get PRO
四月 '25
+84
在2个频道中
Get PRO
三月 '25
+2 102
在3个频道中
Get PRO
二月 '250
在10个频道中
Get PRO
一月 '250
在5个频道中
Get PRO
十二月 '24
+159
在7个频道中
日期
订阅者增长
提及
频道
17 六月+4
16 六月+4
15 六月+2
14 六月+1
13 六月+4
12 六月+11
11 六月0
10 六月+2
09 六月+2
08 六月0
07 六月0
06 六月0
05 六月0
04 六月+3
03 六月+7
02 六月+2
01 六月+5
频道帖子
#ML Обожаю кликбейт в рисече: Superintelligent Retrieval Agent: The Next Frontier of Agentic Retrieval Источник Настолько sup
#ML Обожаю кликбейт в рисече:
Superintelligent Retrieval Agent: The Next Frontier of Agentic Retrieval
Источник Настолько super-прорыв что авторам прямо в аннотации приходится оправдываться что это не обычный query expansion а немного докрученный:
SIRA does not merely ask what terms are relevant to the query; it asks which terms are likely to separate the desired evidence from corpus-level confusers. On the corpus side, an LLM enriches each document offline with missing search vocabulary; on the query side, it predicts evidence vocabulary omitted by the query; and corpus statistics are used as tool calls to filter proposed terms that are absent, overly common, or unlikely to create retrieval margin. The final retrieval step is a single weighted BM25 call combining the original query with the validated expansion.
А мб и правда надо быть максимально нескромным чтобы заметили ? 🤔

2
#southhub Сегодня пил кофе с HR, они все спрашивали как сделать так чтобы данные опросов можно было использовать для аналитик
#southhub Сегодня пил кофе с HR, они все спрашивали как сделать так чтобы данные опросов можно было использовать для аналитики. А я им на примере кликов и лонгкликов в рекламе объяснял логику выбора прокси-событий и и разницу между Вилларибо (опрашивали) и Виллабаджо (измеряли). Если ту же логику применить к конференциям, то вместо опросов и отзывов можно посмотреть на факт: добраться до (и тем паче выбраться из) Сочи — это лютый кошмар. Тем не менее, сотни С-levels приехали на SouthHub — никто не жаловался, не отступил, не ныл — а ведь некоторые с детьми и потратили на дорогу в одну сторону больше суток. Поэтому абсолютно ожидаемо что на самой конфе я встретил открытых и дружелюбных людей со всей страны, у которых (что большая редкость для конференций) действительно позиция совпадала с опытом и знаниями настолько что хотелось слушать не отрываясь (искренне прошу прощения тех кого по три часа не отпускал задавая миллионы вопросов - но было дико интересно). Отдельное спасибо VK за рыбалку на херабуну, Авито за полосатика, X5 за бомбовые коктейли, Альфе за глинтвейн когда я замерзал, Магниту за бургеры в 12 ночи, и само собой МТС и оргам конфы — за все) Невероятно душевно, не знал что так бывает в таком масштабе и с такой концентрацией корпоратов)
1 381
3
Давно тут рыбы не было. Как связаны VK и золотая форель?
Давно тут рыбы не было. Как связаны VK и золотая форель?
1 882
4
Необычная реклама сегожня попалась, однако мысли писать докторскую точно не было, хотя один коллега на SH признался что он до
Необычная реклама сегожня попалась, однако мысли писать докторскую точно не было, хотя один коллега на SH признался что он доктор. Ну и какой же у докторанта научный руководитель? Научный консультант скорее 🤔
1 904
5
🕒 Синдром «Серебряной пули» История про «эффективного менеджера» направления CVM (customer value management) Задача ребят — продавать доп. услуги клиентам и повышать конверсию. Вводные от заказчика прекрасны: «Мы тут ходили к другой команде, они нам собрали фичу — "лучшее время отправки SMS". Мы полгода крутили пилот, получили нулевой результат. Хотим, чтобы вы сделали то же самое, но лучше». Начинаем копать от бизнес-задачи. Выясняется: конверсия низкая. Почему? Ну, логично же: мы просто отправляем SMS не в то время! 🤡 Дальше — диалог, достойный войти в учебники по «продукт-менеджменту»: — Вы же уже проверили гипотезу на пилоте, результат нулевой. Зачем развивать безнадежную идею? — Мы в это верим. — Мы работали со многими крупными компаниями, решали эту задачу. Вы первые, кто просит именно эту фичу. — Мы переиграем рынок. — Ок, если я получу ваш пуш в 10:00 вместо 12:00, реально есть вера, что конверсия взлетит? — Разве это не очевидно? Тут мы немного выпали в осадок, но решили узнать, как устроена сегментация и выборка клиентов. — А как вы понимаете, кому слать? Есть функция ранжирования (uplift-модели, скоринг)? — Не понял вопрос. — Ну как вы понимаете, кто сконвертится лучше или хуже? — А-а-а, никак. Просто случайно выбираем из сегмента. Они же ВСЕ заинтересованы в продукте! — То есть ваш сегмент — это просто жесткие бизнес-правила (условия типа ЕСЛИ/ИЛИ)? — Если упрощенно, то да. Мы строим гипотезы и тестируем их через А/Б! То есть ребята делают А/Б тест на абсолютно случайной выборке внутри кастомного сегмента, не умеют в предсказание оттока/конверсии, но верят в тайминг. Пытаемся нащупать омниканальность. У них есть SMS, пуши и звонки. — А не пробовали выстроить каскадную стратегию? Например: сначала SMS, через день — звонок? — Ну и чем это кончится? — Оптимизацией стратегии... *(Повисла неловкая пауза)* — У нас либо звонки, либо SMS! ❌ Итог: Мы рассказали, как строим нормальный ML-пайплайн для CVM у других заказчиков (с моделированием, склонностью к покупке и оптимизацией стратегии). Продукту не зашло. Ведь у нас нет самого главного — алгоритма, который высчитывает идеальную секунду для отправки SMS человеку, которому это предложение вообще не всралось. Как называется эта болезнь? В медицине не знаем, но в ИТ это «карго-культ фичи». Когда команда игнорирует базовую математику, отсутствие нормальной сегментации и кривую коммуникацию, но свято верит, что одна «модная» фича переиграет рынок. Сталкивались с такими «верующими» заказчиками? Какую самую дикую фичу у вас просили завернуть в ML? 👇
1 795
6
Влад поделился историей в духе канала , не могу пройти мимо )
1 606
7
Тренировки по ML ➖➖➖➖➖➖ 6️⃣ июня состоится семнадцатая встреча в рамках тренировок по машинному обучению ❤️ Что будет на встр
Тренировки по ML ➖➖➖➖➖➖ 6️⃣ июня состоится семнадцатая встреча в рамках тренировок по машинному обучению ❤️ Что будет на встрече: ⚪️Orbit Wars как первое RL соревнование на Kaggle в эпоху coding agents 📢 Спикер: Дмитрий Руденко, Kaggle Competition Master, самый активный участник соревновательного сообщества. Автор @pseudolabeling 📆 Когда: 6 июня в 18:10 🗺️ Где: онлайн ❤️ ссылка на подключение Подробнее про челленджи 🐭 По организационным вопросам вы можете обращаться к Марии ↩️ #анонсы #студенты #ии
2 320
8
подключайтесь!
2 141
9
#кейсы Про независимые измерения качества таргетирования рекламы Представьте что вы рекламное агентство, ваши клиенты-рекламо
#кейсы Про независимые измерения качества таргетирования рекламы Представьте что вы рекламное агентство, ваши клиенты-рекламодатели заказывают рекламные кампании (РК) на сотни тысяч и миллионы человек, все прекрасно. Однако, оказывается, что их чудесные оловянные втулки для перьевых ручек продаются примерно никак. И в низких CTR рекламных кампаний виноваты именно ваши DS, которые, неучи такие, плохо попадают в аудиторию - мальчиков и девочек, взрослых и детей и пр. Делал как-то сореву по такой задаче Как клиенту обосновать свою позицию? На его счастье есть «независимый измеритель качества таргетирования рекламы» (точность работы такого измерения приложен картинкой к посту): 20 тысячам добровольцев устанавливается мобильное приложение (с этого момента их зовут пантеистами — от survey panel), а затем результаты показа вашей рекламной кампании им экстраполируются (с магическим перевзвешиванием! — каждый панелист представляет собой какую-то группу населения) на миллионные аудитории РК. Но не будем, как часто бывает в канале, токсично обсуждать недостатки подхода (а некоторые ML-команды тратят годы на то чтобы улучшить «попадание» в этот генератор псевдослучайных чисел). Давайте о достоинствах, тут понадобится немного фантазии Если бы у вас был каким-то волшебным образом добыт список из этих 20 тыс панелистов то достаточно было бы заказать колл-центру обзвон их обзвон с одним-единственным вопросом : датой рождения (пол по голосу относительно надежно определяется). Ура! — точность таргетирования при следующей тестовой РК достигает 95%+ согласно «независимому измерителю» достигнута, вопросы клиентов снялись. Да, список панелистов постеgпенно расширяется / измеряется, но и способы его добычи не стоят на месте ) PS: в рекламном мире много забавных терминов — МММ, возвратные комиссии, подмешивание панелистов, мы настолько окружены рекламой что любому нелишне подразобраться в этом мире
2 292
10
Clickhouse для программистов, аналитиков и инженеров данных Перестаньте ждать, пока считается аналитика. Научитесь использова
Clickhouse для программистов, аналитиков и инженеров данных Перестаньте ждать, пока считается аналитика. Научитесь использовать ClickHouse — СУБД, которая превращает минутные аналитические запросы в ответы за доли секунды. С первого дня — доступ к инфраструктуре для практики. 🌐 Чему вы научитесь: 🤩 Архитектура одиночных и кластерных инсталляций ClickHouse: как устроена система изнутри и как масштабировать её под реальные нагрузки 🤩 Хранение данных: движки MergeTree, партиционирование и сжатие — как держать терабайты аналитических данных при минимальных затратах на инфраструктуру. 🤩 Обработка миллиардов строк за секунды: построение эффективных запросов, агрегаций и материализованных представлений. 🤩 ClickHouse в продакшене: использование в приложениях, продуктовой аналитике и типичные грабли, на которые наступают почти все 🤩 Живая практика без отрыва от работы: не более 2-3 часов в неделю, разбор задач с экспертом в групповом чате. 🥸 Кто мы: R&D-центр Devhands. Автор курса — Алексей Белозерский, Chief Data Officer в inSales (СБЕР 2В), ex: VK Tech, М.Видео, Эльдорадо 🗓 Старт курса: 11 июня, 6 недель обучения. Изучить программу и записаться можно здесь. Ждем вас! Реклама. ИП Рыбак А.А. ИНН 771407709607 Erid: 2VtzqxNnFKA
2 783
11
Еду на SouthHub 10 июня (как и другие 500 c-levels), нет времени на раздумья и изучение программы — регистрируйтесь, приезжайте — пообщаемся, потусим, сходим в горы немножко Вся инфа, тут канал: https://t.me/sthhb сайт: https://southhub.ru/southub/ Советую полистать, тк каждая компания-участник предлагает свой шатер с активностями (кому-то ближе гвоздестояние, а я вот спиннинги возьму) — несложно найти дело по душе в компании коллег не с улицы
3 072
12
Не фанат выставок и «культурного» досуга, но на эту стену залипал долго и с удовольствием
Не фанат выставок и «культурного» досуга, но на эту стену залипал долго и с удовольствием
3 025
13
#корпшиза Про синьоров и вилки На скрине две свежие вакансии в одну команду Одна Junior — с верхней вилкой 360 (+20% премии)
#корпшиза Про синьоров и вилки На скрине две свежие вакансии в одну команду Одна Junior — с верхней вилкой 360 (+20% премии) Другая Senior — с нижней границей 300 По реакциям в том канале вижу что многие восприняли это негативно Сейчас объясню почему для меня это выглядит как позитив Дисклеймер: не знаю точно как устроено в конкретной компании на экране Зато расскажу почему такое возможно, откуда берутся все эти Junior, Senior и какие выводы можно сделать Итак, почему и откуда берутся все эти лычки 1. Хотят финансисты — удобнее и точнее бюджетировать и планировать когда не просто DS с вилкой от 150 и до миллиона, а что-то более гранулярное (пусть и с пересекающимися вилками) 2. Сотрудники (!) думают что карьерный рост можно превратить в сдачу экзаменов на квалификацию. Знания и навыки — необходимый (часто), но недостаточный пререквизит для роста. Используют лычки как трекинг что все движется в верном направлении. 3. HR — пытаются тоже как-то в этом всем поучаствовать, надеясь формализовать плохо формализуемое и воспрепятствовать (зачем?) тем НМ (нанимающим менеджерам) которые садят хорошего джуна на ставку синьора потому что проект горит и работать кому-то надо По факту варианта 2: — все либо переругаются, сломаются процессы найма, повышений и ротации — либо придут к компромиссам: признают что синьор в прайсинге может быть джуном в S2T или в RecSys (и наоборот), что вилка в моменте может зависеть от срочности и критичности задачи, от локальных колебаний рынка, от выстроенного процесса работы с будущими коллегами со школы, университета и тд. И раз вилки так сильно пересекаются — значит, в компании вариант 2 и люди как-то смогли между собой договориться, что очень здорово. Какие выводы можно сделать? — в резюме все эти «Middle», «Senior» и пр можно смело опустить — пишите просто DS или MLE — информативность лычек по сути никакая. О вас сделают вывод по масштабу задач, которыми вы занимались. Более того, регулярно в резюме / линкедине, а теперь часто и в паблике (по недосмотру PR-отделов) можно увидеть «CTO», «Head of AI», «CDS», «CDO» и прочих людей, вписывающих громкие должности — а по факту руководящих группой 2-20 чел в каком-то кусочке компании. Спросите у такого через сколько уровней он от CEO и все быстро станет ясно Я бы назвал это кризисом доверия, и он начался задолго до «волков». HR-инфоцыгане и кадровые агентства советовали и советуют своим клиентам «позиционироваться» — то есть врать — в духе «если вы техлид команды, напишите что вы CTO» и пр. Поэтому не переживайте так за лычки — они не очень сильно связаны с уровнем дохода и вашим восприятием на рынке — переживайте за задачи — чтобы они были классные, интересные, масштабные. И это обязательно конвертируется в тч в карьерный рост и доход. PS А вообще, опытным и рукастым DS везде рады — прямо сейчас несколько знакомых из разных компаний (мы, Авито, ДЗО Сбера, Т1 и пр) активно ищет себе синьорных DS или хотя бы middle+ — если актуально, пишите в личку вместе с CV
4 438
14
Tesseract живее всех живых, vllm-ocr видимо еще не прижились
Tesseract живее всех живых, vllm-ocr видимо еще не прижились
2 539
15
Друзья просят помощи — вдруг кто-то едет в июне на CVPR и согласится постер с собой взять ? А то у парней публикация сгорит п
Друзья просят помощи — вдруг кто-то едет в июне на CVPR и согласится постер с собой взять ? А то у парней публикация сгорит по правилам конфы (( Пишите в личку
3 193
16
#корпжиза https://habr.com/ru/articles/1035342/ Понадобилось всего 25 лет, 18 тысяч собеседований и более сотни статей с экспериментами (например, сторонний наблюдатель за 20-30 сек c начала интервью (без звука!) способен предсказать заключение средней рекрутерши) — чтобы научно точно вывести очевидный факт что рекрутеры и прочие hrd в найме только вредят. После того как сам видел в заключении рекрута в графе софты — «лапуся нормис» не согласиться с мнением ученых решительно невозможно. Ждем массового внедрения агентов в найме! А пока Или даже так. Если человек очень хорош в театре впечатлений и умеет подать себя как обладателя выдающихся навыков в коммуникативности и добросовестности, то он даже со средними компетенциями может претендовать на зарплату в 2-3 раза выше и иметь всё равно более высокие шансы, чем абсолютное большинство тех, кто качал компетенции и навыки. и Так что базовая установка рекрутеров – выбирать тех, кто произвёл на них приятное впечатление. При этом, что любопытно, что рекрутеры проявляли жесточайший сексизм. И описывали мужчин как уверенных в 7 раз чаще, а женщин – как жизнерадостных в 25 раз чаще.
4 029
17
Я подумал вот чего. Все равно ведь все вы так или иначе используете ИИ для медицинских советов. Но это тоже нужно грамотно уметь делать. И на самом деле ИИ сейчас прямо очень и очень неплох в этом: я вот зуб даю он не хуже эдак 80-90% онкологов. Я думаю если бы их заменить ИИ - оно все было бы сильно получше. И я решил создать инструкцию для онкологических пациентов о том как настроить проект в ChatGPT или Claude чтобы ответы были максимально грамотными и полными. В полноценный текст промпта проекта, которые сделает это безопасным и грамотным. Ловите по этой ссылке полную инструкцию как настроить и чего вставить в настройки проекта чтобы оно отвечало хорошо P.S. Делитесь инструкцией - не жадничайте.
3 112
18
оффтоп: Илья сам онколог со стажем, чую что этим постом он десяток AI-native стартапов точно прихлопнул 😆
2 655
19
Вариант с мультивыбором: в конце июля — в какой день проводим митап на весь день?
3 213
20
Собираемся провести Summer Data Science Day в конце июля, в какой день лучше?
2 805