Дата канальи — дата / ML / AI / корпжиза
前往频道在 Telegram
Корпжиза аналитиков и DS. Если хотите анонимно поделиться историей на широкий круг -- го в личку @NikitaZelinskiy, аналогично по остальным вопросам
显示更多5 859
订阅者
+324 小时
+167 天
+3530 天
数据加载中...
吸引订阅者
六月 '26
六月 '26
+47
在2个频道中
五月 '26
+108
在3个频道中
Get PRO
四月 '26
+60
在3个频道中
Get PRO
三月 '26
+96
在1个频道中
Get PRO
二月 '26
+268
在7个频道中
Get PRO
一月 '26
+163
在5个频道中
Get PRO
十二月 '25
+1 056
在7个频道中
Get PRO
十一月 '25
+735
在11个频道中
Get PRO
十月 '25
+170
在6个频道中
Get PRO
九月 '25
+240
在61个频道中
Get PRO
八月 '25
+215
在6个频道中
Get PRO
七月 '25
+1 412
在30个频道中
Get PRO
六月 '25
+351
在58个频道中
Get PRO
五月 '25
+39
在1个频道中
Get PRO
四月 '25
+84
在2个频道中
Get PRO
三月 '25
+2 102
在3个频道中
Get PRO
二月 '250
在10个频道中
Get PRO
一月 '250
在5个频道中
Get PRO
十二月 '24
+159
在7个频道中
| 日期 | 订阅者增长 | 提及 | 频道 | |
| 17 六月 | +4 | |||
| 16 六月 | +4 | |||
| 15 六月 | +2 | |||
| 14 六月 | +1 | |||
| 13 六月 | +4 | |||
| 12 六月 | +11 | |||
| 11 六月 | 0 | |||
| 10 六月 | +2 | |||
| 09 六月 | +2 | |||
| 08 六月 | 0 | |||
| 07 六月 | 0 | |||
| 06 六月 | 0 | |||
| 05 六月 | 0 | |||
| 04 六月 | +3 | |||
| 03 六月 | +7 | |||
| 02 六月 | +2 | |||
| 01 六月 | +5 |
频道帖子
#ML
Обожаю кликбейт в рисече:
Superintelligent Retrieval Agent: The Next Frontier of Agentic RetrievalИсточник Настолько super-прорыв что авторам прямо в аннотации приходится оправдываться что это не обычный query expansion а немного докрученный:
SIRA does not merely ask what terms are relevant to the query; it asks which terms are likely to separate the desired evidence from corpus-level confusers. On the corpus side, an LLM enriches each document offline with missing search vocabulary; on the query side, it predicts evidence vocabulary omitted by the query; and corpus statistics are used as tool calls to filter proposed terms that are absent, overly common, or unlikely to create retrieval margin. The final retrieval step is a single weighted BM25 call combining the original query with the validated expansion.А мб и правда надо быть максимально нескромным чтобы заметили ? 🤔
| 2 | #southhub
Сегодня пил кофе с HR, они все спрашивали как сделать так чтобы данные опросов можно было использовать для аналитики. А я им на примере кликов и лонгкликов в рекламе объяснял логику выбора прокси-событий и и разницу между Вилларибо (опрашивали) и Виллабаджо (измеряли).
Если ту же логику применить к конференциям, то вместо опросов и отзывов можно посмотреть на факт: добраться до (и тем паче выбраться из) Сочи — это лютый кошмар. Тем не менее, сотни С-levels приехали на SouthHub — никто не жаловался, не отступил, не ныл — а ведь некоторые с детьми и потратили на дорогу в одну сторону больше суток.
Поэтому абсолютно ожидаемо что на самой конфе я встретил открытых и дружелюбных людей со всей страны, у которых (что большая редкость для конференций) действительно позиция совпадала с опытом и знаниями настолько что хотелось слушать не отрываясь (искренне прошу прощения тех кого по три часа не отпускал задавая миллионы вопросов - но было дико интересно).
Отдельное спасибо VK за рыбалку на херабуну, Авито за полосатика, X5 за бомбовые коктейли, Альфе за глинтвейн когда я замерзал, Магниту за бургеры в 12 ночи, и само собой МТС и оргам конфы — за все) Невероятно душевно, не знал что так бывает в таком масштабе и с такой концентрацией корпоратов) | 1 381 |
| 3 | Давно тут рыбы не было. Как связаны VK и золотая форель? | 1 882 |
| 4 | Необычная реклама сегожня попалась, однако мысли писать докторскую точно не было, хотя один коллега на SH признался что он доктор.
Ну и какой же у докторанта научный руководитель? Научный консультант скорее 🤔 | 1 904 |
| 5 | 🕒 Синдром «Серебряной пули»
История про «эффективного менеджера» направления CVM (customer value management)
Задача ребят — продавать доп. услуги клиентам и повышать конверсию.
Вводные от заказчика прекрасны:
«Мы тут ходили к другой команде, они нам собрали фичу — "лучшее время отправки SMS". Мы полгода крутили пилот, получили нулевой результат. Хотим, чтобы вы сделали то же самое, но лучше».
Начинаем копать от бизнес-задачи. Выясняется: конверсия низкая. Почему? Ну, логично же: мы просто отправляем SMS не в то время! 🤡
Дальше — диалог, достойный войти в учебники по «продукт-менеджменту»:
— Вы же уже проверили гипотезу на пилоте, результат нулевой. Зачем развивать безнадежную идею?
— Мы в это верим.
— Мы работали со многими крупными компаниями, решали эту задачу. Вы первые, кто просит именно эту фичу.
— Мы переиграем рынок.
— Ок, если я получу ваш пуш в 10:00 вместо 12:00, реально есть вера, что конверсия взлетит?
— Разве это не очевидно?
Тут мы немного выпали в осадок, но решили узнать, как устроена сегментация и выборка клиентов.
— А как вы понимаете, кому слать? Есть функция ранжирования (uplift-модели, скоринг)?
— Не понял вопрос.
— Ну как вы понимаете, кто сконвертится лучше или хуже?
— А-а-а, никак. Просто случайно выбираем из сегмента. Они же ВСЕ заинтересованы в продукте!
— То есть ваш сегмент — это просто жесткие бизнес-правила (условия типа ЕСЛИ/ИЛИ)?
— Если упрощенно, то да. Мы строим гипотезы и тестируем их через А/Б!
То есть ребята делают А/Б тест на абсолютно случайной выборке внутри кастомного сегмента, не умеют в предсказание оттока/конверсии, но верят в тайминг.
Пытаемся нащупать омниканальность. У них есть SMS, пуши и звонки.
— А не пробовали выстроить каскадную стратегию? Например: сначала SMS, через день — звонок?
— Ну и чем это кончится?
— Оптимизацией стратегии...
*(Повисла неловкая пауза)*
— У нас либо звонки, либо SMS! ❌
Итог: Мы рассказали, как строим нормальный ML-пайплайн для CVM у других заказчиков (с моделированием, склонностью к покупке и оптимизацией стратегии). Продукту не зашло. Ведь у нас нет самого главного — алгоритма, который высчитывает идеальную секунду для отправки SMS человеку, которому это предложение вообще не всралось.
Как называется эта болезнь?
В медицине не знаем, но в ИТ это «карго-культ фичи». Когда команда игнорирует базовую математику, отсутствие нормальной сегментации и кривую коммуникацию, но свято верит, что одна «модная» фича переиграет рынок.
Сталкивались с такими «верующими» заказчиками? Какую самую дикую фичу у вас просили завернуть в ML? 👇 | 1 795 |
| 6 | Влад поделился историей в духе канала , не могу пройти мимо ) | 1 606 |
| 7 | Тренировки по ML
➖➖➖➖➖➖
6️⃣ июня состоится семнадцатая встреча в рамках тренировок по машинному обучению ❤️
Что будет на встрече:
⚪️Orbit Wars как первое RL соревнование на Kaggle в эпоху coding agents
📢 Спикер: Дмитрий Руденко, Kaggle Competition Master, самый активный участник соревновательного сообщества. Автор @pseudolabeling
📆 Когда: 6 июня в 18:10
🗺️ Где: онлайн ❤️ ссылка на подключение
Подробнее про челленджи 🐭
По организационным вопросам вы можете обращаться к Марии ↩️
#анонсы #студенты #ии | 2 320 |
| 8 | подключайтесь! | 2 141 |
| 9 | #кейсы
Про независимые измерения качества таргетирования рекламы
Представьте что вы рекламное агентство, ваши клиенты-рекламодатели заказывают рекламные кампании (РК) на сотни тысяч и миллионы человек, все прекрасно.
Однако, оказывается, что их чудесные оловянные втулки для перьевых ручек продаются примерно никак.
И в низких CTR рекламных кампаний виноваты именно ваши DS, которые, неучи такие, плохо попадают в аудиторию - мальчиков и девочек, взрослых и детей и пр. Делал как-то сореву по такой задаче
Как клиенту обосновать свою позицию?
На его счастье есть «независимый измеритель качества таргетирования рекламы» (точность работы такого измерения приложен картинкой к посту):
20 тысячам добровольцев устанавливается мобильное приложение (с этого момента их зовут пантеистами — от survey panel), а затем результаты показа вашей рекламной кампании им экстраполируются (с магическим перевзвешиванием! — каждый панелист представляет собой какую-то группу населения) на миллионные аудитории РК.
Но не будем, как часто бывает в канале, токсично обсуждать недостатки подхода (а некоторые ML-команды тратят годы на то чтобы улучшить «попадание» в этот генератор псевдослучайных чисел).
Давайте о достоинствах, тут понадобится немного фантазии
Если бы у вас был каким-то волшебным образом добыт список из этих 20 тыс панелистов то достаточно было бы заказать колл-центру обзвон их обзвон с одним-единственным вопросом : датой рождения (пол по голосу относительно надежно определяется).
Ура! — точность таргетирования при следующей тестовой РК достигает 95%+ согласно «независимому измерителю» достигнута, вопросы клиентов снялись.
Да, список панелистов постеgпенно расширяется / измеряется, но и способы его добычи не стоят на месте )
PS: в рекламном мире много забавных терминов — МММ, возвратные комиссии, подмешивание панелистов, мы настолько окружены рекламой что любому нелишне подразобраться в этом мире | 2 292 |
| 10 | Clickhouse для программистов, аналитиков и инженеров данных
Перестаньте ждать, пока считается аналитика. Научитесь использовать ClickHouse — СУБД, которая превращает минутные аналитические запросы в ответы за доли секунды. С первого дня — доступ к инфраструктуре для практики.
🌐 Чему вы научитесь:
🤩 Архитектура одиночных и кластерных инсталляций ClickHouse: как устроена система изнутри и как масштабировать её под реальные нагрузки
🤩 Хранение данных: движки MergeTree, партиционирование и сжатие — как держать терабайты аналитических данных при минимальных затратах на инфраструктуру.
🤩 Обработка миллиардов строк за секунды: построение эффективных запросов, агрегаций и материализованных представлений.
🤩 ClickHouse в продакшене: использование в приложениях, продуктовой аналитике и типичные грабли, на которые наступают почти все
🤩 Живая практика без отрыва от работы: не более 2-3 часов в неделю, разбор задач с экспертом в групповом чате.
🥸 Кто мы: R&D-центр Devhands. Автор курса — Алексей Белозерский, Chief Data Officer в inSales (СБЕР 2В), ex: VK Tech, М.Видео, Эльдорадо
🗓 Старт курса: 11 июня, 6 недель обучения.
Изучить программу и записаться можно здесь.
Ждем вас!
Реклама. ИП Рыбак А.А. ИНН 771407709607 Erid: 2VtzqxNnFKA | 2 783 |
| 11 | Еду на SouthHub 10 июня (как и другие 500 c-levels), нет времени на раздумья и изучение программы — регистрируйтесь, приезжайте — пообщаемся, потусим, сходим в горы немножко
Вся инфа, тут
канал: https://t.me/sthhb
сайт: https://southhub.ru/southub/
Советую полистать, тк каждая компания-участник предлагает свой шатер с активностями (кому-то ближе гвоздестояние, а я вот спиннинги возьму) — несложно найти дело по душе в компании коллег не с улицы | 3 072 |
| 12 | Не фанат выставок и «культурного» досуга, но на эту стену залипал долго и с удовольствием | 3 025 |
| 13 | #корпшиза
Про синьоров и вилки
На скрине две свежие вакансии в одну команду
Одна Junior — с верхней вилкой 360 (+20% премии)
Другая Senior — с нижней границей 300
По реакциям в том канале вижу что многие восприняли это негативно
Сейчас объясню почему для меня это выглядит как позитив
Дисклеймер: не знаю точно как устроено в конкретной компании на экране
Зато расскажу почему такое возможно, откуда берутся все эти Junior, Senior и какие выводы можно сделать
Итак, почему и откуда берутся все эти лычки
1. Хотят финансисты — удобнее и точнее бюджетировать и планировать когда не просто DS с вилкой от 150 и до миллиона, а что-то более гранулярное (пусть и с пересекающимися вилками)
2. Сотрудники (!) думают что карьерный рост можно превратить в сдачу экзаменов на квалификацию. Знания и навыки — необходимый (часто), но недостаточный пререквизит для роста. Используют лычки как трекинг что все движется в верном направлении.
3. HR — пытаются тоже как-то в этом всем поучаствовать, надеясь формализовать плохо формализуемое и воспрепятствовать (зачем?) тем НМ (нанимающим менеджерам) которые садят хорошего джуна на ставку синьора потому что проект горит и работать кому-то надо
По факту варианта 2:
— все либо переругаются, сломаются процессы найма, повышений и ротации
— либо придут к компромиссам: признают что синьор в прайсинге может быть джуном в S2T или в RecSys (и наоборот), что вилка в моменте может зависеть от срочности и критичности задачи, от локальных колебаний рынка, от выстроенного процесса работы с будущими коллегами со школы, университета и тд.
И раз вилки так сильно пересекаются — значит, в компании вариант 2 и люди как-то смогли между собой договориться, что очень здорово.
Какие выводы можно сделать?
— в резюме все эти «Middle», «Senior» и пр можно смело опустить — пишите просто DS или MLE — информативность лычек по сути никакая. О вас сделают вывод по масштабу задач, которыми вы занимались.
Более того, регулярно в резюме / линкедине, а теперь часто и в паблике (по недосмотру PR-отделов) можно увидеть «CTO», «Head of AI», «CDS», «CDO» и прочих людей, вписывающих громкие должности — а по факту руководящих группой 2-20 чел в каком-то кусочке компании. Спросите у такого через сколько уровней он от CEO и все быстро станет ясно
Я бы назвал это кризисом доверия, и он начался задолго до «волков».
HR-инфоцыгане и кадровые агентства советовали и советуют своим клиентам «позиционироваться» — то есть врать — в духе «если вы техлид команды, напишите что вы CTO» и пр.
Поэтому не переживайте так за лычки — они не очень сильно связаны с уровнем дохода и вашим восприятием на рынке — переживайте за задачи — чтобы они были классные, интересные, масштабные. И это обязательно конвертируется в тч в карьерный рост и доход.
PS А вообще, опытным и рукастым DS везде рады — прямо сейчас несколько знакомых из разных компаний (мы, Авито, ДЗО Сбера, Т1 и пр) активно ищет себе синьорных DS или хотя бы middle+ — если актуально, пишите в личку вместе с CV | 4 438 |
| 14 | Tesseract живее всех живых, vllm-ocr видимо еще не прижились | 2 539 |
| 15 | Друзья просят помощи — вдруг кто-то едет в июне на CVPR и согласится постер с собой взять ? А то у парней публикация сгорит по правилам конфы (( Пишите в личку | 3 193 |
| 16 | #корпжиза
https://habr.com/ru/articles/1035342/
Понадобилось всего 25 лет, 18 тысяч собеседований и более сотни статей с экспериментами (например, сторонний наблюдатель за 20-30 сек c начала интервью (без звука!) способен предсказать заключение средней рекрутерши) — чтобы научно точно вывести очевидный факт что рекрутеры и прочие hrd в найме только вредят.
После того как сам видел в заключении рекрута в графе софты — «лапуся нормис» не согласиться с мнением ученых решительно невозможно.
Ждем массового внедрения агентов в найме!
А пока
Или даже так. Если человек очень хорош в театре впечатлений и умеет подать себя как обладателя выдающихся навыков в коммуникативности и добросовестности, то он даже со средними компетенциями может претендовать на зарплату в 2-3 раза выше и иметь всё равно более высокие шансы, чем абсолютное большинство тех, кто качал компетенции и навыки.
и
Так что базовая установка рекрутеров – выбирать тех, кто произвёл на них приятное впечатление.
При этом, что любопытно, что рекрутеры проявляли жесточайший сексизм. И описывали мужчин как уверенных в 7 раз чаще, а женщин – как жизнерадостных в 25 раз чаще. | 4 029 |
| 17 | Я подумал вот чего. Все равно ведь все вы так или иначе используете ИИ для медицинских советов. Но это тоже нужно грамотно уметь делать.
И на самом деле ИИ сейчас прямо очень и очень неплох в этом: я вот зуб даю он не хуже эдак 80-90% онкологов. Я думаю если бы их заменить ИИ - оно все было бы сильно получше.
И я решил создать инструкцию для онкологических пациентов о том как настроить проект в ChatGPT или Claude чтобы ответы были максимально грамотными и полными. В полноценный текст промпта проекта, которые сделает это безопасным и грамотным.
Ловите по этой ссылке полную инструкцию как настроить и чего вставить в настройки проекта чтобы оно отвечало хорошо
P.S. Делитесь инструкцией - не жадничайте. | 3 112 |
| 18 | оффтоп: Илья сам онколог со стажем, чую что этим постом он десяток AI-native стартапов точно прихлопнул 😆 | 2 655 |
| 19 | Вариант с мультивыбором: в конце июля — в какой день проводим митап на весь день? | 3 213 |
| 20 | Собираемся провести Summer Data Science Day в конце июля, в какой день лучше? | 2 805 |
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
