Data Nature 🕊

前往频道在 Telegram

Канал о жизни BI аналитики и инфо-дизайна в корп реалиях с фокусом на работающих практиках управления. Веду как летопись полезного для себя и людей с такими же неврозами. александр бараков @alexbarakov datanature.ru data-nature.com (рекламу не размещаю)

显示更多

俄罗斯95 712 技术与应用16 567

6 163

订阅者

+124 小时

+57 天

+4530 天

6 360

帖子浏览量

~ 89824 小时

~ 98548 小时

103.18%

参与率

无数据

每日帖子数

Ads index

beta

数据加载中...

吸引订阅者

七月 '26

+97

在2个频道中

六月 '26

+59

在1个频道中

Get PRO

五月 '26

+63

在0个频道中

Get PRO

四月 '26

+46

在0个频道中

Get PRO

三月 '26

+83

在1个频道中

Get PRO

二月 '26

+124

在1个频道中

Get PRO

一月 '26

+150

在3个频道中

Get PRO

十二月 '25

+73

在1个频道中

Get PRO

十一月 '25

+90

在1个频道中

Get PRO

十月 '25

+99

在2个频道中

Get PRO

九月 '25

+98

在2个频道中

Get PRO

八月 '25

+130

在4个频道中

Get PRO

七月 '25

+129

在3个频道中

Get PRO

六月 '25

+168

在4个频道中

Get PRO

五月 '25

+115

在1个频道中

Get PRO

四月 '25

+128

在2个频道中

Get PRO

三月 '25

+128

在1个频道中

Get PRO

二月 '25

+143

在0个频道中

Get PRO

一月 '25

+141

在0个频道中

Get PRO

十二月 '24

+251

在2个频道中

Get PRO

十一月 '24

+276

在3个频道中

Get PRO

十月 '24

+139

在4个频道中

Get PRO

九月 '24

+129

在1个频道中

Get PRO

八月 '24

+243

在4个频道中

Get PRO

七月 '24

+108

在4个频道中

Get PRO

六月 '24

+103

在1个频道中

Get PRO

五月 '24

+199

在5个频道中

Get PRO

四月 '24

+146

在5个频道中

Get PRO

三月 '24

+134

在3个频道中

Get PRO

二月 '24

+92

在6个频道中

Get PRO

一月 '24

+86

在2个频道中

Get PRO

十二月 '23

+83

在1个频道中

Get PRO

十一月 '23

+85

在3个频道中

Get PRO

十月 '23

+170

在6个频道中

Get PRO

九月 '23

+223

在0个频道中

Get PRO

八月 '23

+169

在0个频道中

Get PRO

七月 '23

+185

在0个频道中

Get PRO

六月 '23

+122

在0个频道中

Get PRO

五月 '23

+553

在0个频道中

Get PRO

四月 '23

+78

在0个频道中

Get PRO

三月 '23

+412

在0个频道中

Get PRO

二月 '23

+315

在0个频道中

Get PRO

一月 '23

+305

在0个频道中

Get PRO

十二月 '22

+46

在0个频道中

Get PRO

十一月 '22

+243

在0个频道中

Get PRO

十月 '22

+91

在0个频道中

Get PRO

九月 '22

+21

在0个频道中

Get PRO

八月 '22

+77

在0个频道中

Get PRO

七月 '22

+50

在0个频道中

Get PRO

六月 '22

+118

在0个频道中

Get PRO

五月 '22

+16

在0个频道中

Get PRO

四月 '22

+27

在0个频道中

Get PRO

三月 '22

+53

在0个频道中

Get PRO

二月 '22

+148

在0个频道中

Get PRO

一月 '22

+237

在0个频道中

Get PRO

十二月 '21

+618

在0个频道中

日期	订阅者增长	提及	频道
31 七月	0
30 七月	+5
29 七月	+4
28 七月	+4
27 七月	+4
26 七月	+1
25 七月	0
24 七月	0
23 七月	+3
22 七月	+1
21 七月	+2
20 七月	+1
19 七月	+1
18 七月	+3
17 七月	+2
16 七月	+2
15 七月	+3
14 七月	+3
13 七月	+3
12 七月	0
11 七月	+3
10 七月	+4
09 七月	+28
08 七月	+4
07 七月	+3
06 七月	+3
05 七月	+2
04 七月	0
03 七月	+2
02 七月	+4
01 七月	+2

频道帖子

Semantic Layer все понимают по-разному. Кто то помнит про LookML, другой работал с dbt metrics, третий шарит за cube.dev, atscale и другие семантические платформы. В России Semantic Layer принято рисовать в стратегии, но в итоге вечно двигать на будущее. Нет очевидных решений в рынке и слишком много легаси под дешами нужно перелопатить. Да и ущерб от отсутствия был прямо скажем приемлемым. Так было до новой волны инвестиций в ИИ. Пообщались на прошлой неделе с Artyom Keydunov (CEO того самого сube.dev) о том, как концепция семантик слоя для унификации метрик для дешей сменилась на семантик для агентов. Мысли со встречи: 1. Семантический движок и Runtime и становится самым важным компонентом Сложность уже не в унификации метрик, а в их исполнении. Runtime преобразует бизнес-запрос в план выполнения +security, governance, RLS. А Execution Engine - решает: Что материализовать? Что считать на лету? Когда создать новый агрегат? Когда удалить старый? Как не материализовать всё подряд? Материализовывать под каждый нужный разрез — не вариант. Если не материализовать ничего - дорогой Runtime. Вопрос как научить движок выбирать стратегию исполнения — ключевой. 2. Text-to-Sematic > Text-to-SQL. Архитектура, где агент каждый раз пишет SQL, дает хуже точность, стоит дороже. В идеале спрашиваем "Дай Revenue по Country" - а Runtime уже знает: где данные; какие join, grain, формула. 3. Cube больше не считает BI своим основным рынком Раньше Semantic Layer был для Tableau, Power BI и других BI-инструментов. Но это уже не очень хороший бизнес. BI вендоры стремительно теряют клиентов и рынок. Теперь AI-агенты будут напрямую consum'ить Semantic Layer. Уже просматривается следующий уровень, когда не человек будет спрашивать данные, а Product Agent, Marketing Agent, Experiment Agent. То есть вопрос не «как человек получает инсайт», а «как агент получает доверенную метрику». 4. Никто не знает, какие комбинации интерфейсов победят: Claude/codex Desktop, MCP, CLI, Skillhubs, свои дата порталы или чаты в корпмесенджерах. Поэтому Cube развивает все и идет в Ассистентский UI. Главный конкурент в мире не dbt, а Snowflake и Databricks. ——————- Короче сегмент Semantic Layer пришел в движение. Можно сказать, что он разделился на Semantic Editor (про заведение и управление metrics + dims + filters = SQL) и Semantic runtime & engine (про то, как выполнять запросы и материализовывать). Есть хорошая статья Насти Остапенко про эти типы. В России нет решений этого уровня (или есть?). То, что есть пока ориентированы на старую модель работы с BI. Есть движение в эту сторону: Trisigma Авито, Datalens Яндекса. Есть mvp решений, типа dataforge от питерских ребят. Помогите продолжить список. Кажется самое интересное в AI сейчас происходит не вокруг моделей, а вокруг инфраструктуры и архитектуры для них.

2	+1 AI не готовность - пост о том, как препарируем доменные данные и контекст в Авито Антропик напомнил всем кто забыл, что Text2sql бесполезен, если он не шарит в данных домена. Мы догадывались. Одна из тестируемых тут идей - AI-ready score в целях тимлидов доменов. Это булевые проверки условно трех групп: - Роли и в домене (BI-партнёр, Куратор метрик, AI-чемпион). Скучный компонент, но без гавернанс-людей никак; - Разметка каноничных объектов. Смотрим, что доля трафика через сертифицированные здоровые витрины, деши и метрики не ниже таргета. - База знаний домена - 11 типов контекста в репозитории: FAQ с ловушками, глоссарий, lineage, примеры text2sql, eval-кейсы, деревья метрик и др. Генерация этого контекста - это тоже скилл, встроенный в работу - решил задачу -> закинул агентом PR в базу контекста. Автогенерённые объекты засчитываются только после ревью. Всё это пока про покрытие. Качество сразу после: golden sets по типовым задачам + трейсы от AI-дежурных дают базу для тюнинга Будет понято, какие эвалы фейк, какие знания - балласт. AI-дежурные и ассистенты это морковка спереди, рост доли их успешно отвеченных эдхоков в чатах - мотивация вкладываться дальше в контекст. Замеры в этой части пошарю позднее. Если интересно включится - все еще есть вакансии в BI	6 810
3	ахахахах, картинка угар, сори, не мог не запостить 🤨 🎙Через месяц проведем программу «Разработка BI+AI стратегии» — ежегодные живые воркшопы для BI/Data лидеров. 📅 5–28 августа • 11 дней по 2,5 часа в 18.00 AI-стратегии сейчас писать не лучшее время — никто не понимает ничего, кроме вектора и горизонта пары месяцев. Но и развивать BI без ИИ нет смысла. Тот случай, когда программа нужна мне самому. Нужно обстучать весь этот поток гипотез, переопылиться. Старые темы теперь с "ИИ": – Self-Service, Reporting Factory и теперь Agentic BI: что ИИ каннибализирует, а где сертифицированный репортинг остается; – Карго-культы в AI во всех дата-платформах страны: самолёты летающие и соломенные «AI-ассистенты»; – Data и content management: сертификация, health score, архивация — как не утонуть в собственных витринах и отчётах c приходом AI-слопа; – Почему text-to-SQL демо работает, а в проде врёт — и причём тут semantic layer, core-витрины и доменный контекст; – Вайбкодинг в BI-команде: почему это уже обязательный тулинг и «как знать меру»; – Core слой витрин как «здоровое питание» AI-аналитика вместо фастфуда из 6000 витрин низкого качества; – Дата-каталоги и глоссарии наконец взлетят — но не для людей, а для AI-агентов; – Метрики BI и какие новые шансы посчитать таки time-to-insight, Saved FTE и проч Все это и прочее в режиме живых обсуждений, разборов кейсов друг друга — участников и топ-компаний. Апдейт контента примерно 50% vs прошлый год. Заходите. Мест немного. 👉 https://biconsult.ru/bi-strategy-barakov/	2 008
4	+1 Насмотренность на гавернанс данных дает мрачный образ будущего для гавернанса контекста. Сегодня в тех компаниях строятся планы: Соберем весь контекст, свяжем все знания компании в context/knowledge graph. Сделаем AI понимающим бизнес. Десять лет назад примерно так же выглядели обещания от Data Governance: Соберем все метаданные. Построим каталог. Назначим владельцев. Опишем определения. Наступит порядок. Пока у меня есть только вопросы и гипотезы. Делюсь чтобы собрать мнений. 1. Больше контекста = выше качество AI? В кейсе Anthropic агент получил доступ к большому корпусу SQL, дашбордов и аналитических артефактов. Качество почти не выросло. Во многих ошибочных ответах нужная информация находилась внутри доступного корпуса. Проблема была в выборе правильной сущности. Ценность создавал не объем контекста, а уменьшение пространства выбора. Большая часть рынка сегодня инвестирует в: knowledge graph; semantic layer; metadata; context. Anthropic пишет что после определенного уровня зрелости дополнительные знания дают меньший эффект, чем качественные процедуры, зашитые в skills: какие источники когда использовать, в каком порядке, с какими проверками и уточнениями. 2. Можно ли через AI собирать, создавать, валидировать контекст Компании? DataHub исходит, что значительная часть контекста уже существует, просто разбросана по системам. Тут AI явно может помочь с Context Mining — поиском отсутствующего контекста. Anthropic говорит, что самого важного слоя - бизнес-контекста - в системах нет: почему метрика считается именно так; почему существует исключение; почему доверяют именно этому источнику; почему было принято именно такое решение. Такой контекст нужно создавать человеку. Распределенная ответственность за валидацию контекста выглядит одним из главных рисков. То, из-за чего не взлетает DG — человеческий фактор. Тут AI уже умеет: находить противоречия; находить устаревший контекст; выявлять пробелы; сравнивать версии; запускать проверки, evals. Возможно, мы движемся от модели: AI → Human → Approved к модели: AI → AI Review → Human для конфликтов. Но не факт. 3. Что вообще тащить в Context Layer? На первый взгляд хочется построить новую систему и собрать туда все. Сделать еще одну устаревающую копию реальности. Кажется, Context Layer не должен управлять контекстом. Скорее собирать связи о разном контексте из мастер-систем без дублирования (накидал матрицу на фото) ...и добавлять критичную инфу про: Trust; Certification; Freshness; Canonicality; Completeness. 4. Кто такой Context Engineer? Если контекст становится стратегическим активом, кто-то им должен управлять. «Context Engineer» расщепляется на две роли: (1) Context engineering — собирает контекст под конкретного агента: skills, retrieval, tools, evals. Чинит ошибки. Ближе к Analytics Engineer / BI. (2) Context manager — владеет доменным слоем контекста. Эволюция Data Governance / Steward роли. Откуда только этим людям взять capacity на это? Другие задачи никто не снимал. А эффективность от AI массово не наступила.	2 563
5	Эфир Visiology Cortex про их next gen BI прототип вызвал тут обсуждение в закрытых чатах и резонирует с тем, как мы строим свой BI тулинг в Авито. Начну с предложения всем посмотреть, Иван с командой хорошо копает в продуктовые гипотезы, дает часто независимую аналитику. Ищут новые сценарии в BI и делятся. Кто посмотрел - давайте обсудим (тут нет правильных ответов). Закину свои мысли подробнее, с переходом в душноту: 15:05 Иван начал с того, что разложил базу про основные AI+BI группы юзкейсов. Тут все по делу: - вайбкодинг в BI стоит своих токенов, годится для ресерча, прототипа, администрирования, но для прода все еще много правдоподобно ошибается, требует реворка/ревью. Ценность межуется с потерями. Всем пробовать. - чат с базой данных (Text2SQL) работает, но точность сильно зависит от семантического слоя и системы управления контекстом, которые никто в реальной жизни (пока) не построил. - ИИ помощники в BI, тупо полезные встроенные тулы, которые где то сильно (код), где то не сильно (визуал) ускоряют разработчика. Потом начинается демо. Красивое вендорское демо - смелое, с предположениями, иногда далекими от жизни: 32:19 cortex визы, новое поколение self service аналитики в понимании visiology. Вопрос - почему юзера с бизнес-вопросом отправляют конструировать (пусть и с агентом) подключение? В это пойдет casual explorer а их обычно 5-7%. Кажется правильнее исходить, что качественные сорсы/квери уже размечены для агента аналитиками/BI. Наоборот надо предотвращать тут создание новых сорсов, коннектов неаналитиком. Первый кусочек продуктового легаси и идеализма. Из области для атоса (юзера) это слишком много, для графа де ла фер (биайщика) слишком мало. - Далее флоу ведет к генерации метрик. Первый вопрос зачем их давать так свободно генерить, а не брать из сертифицированного стора ? (жесткий риск утраты так долго выстраиваемой версии блять правды) Второй вопрос - как решена в генерации проблема правдоподобных и скрытых ошибок в логике? Ребята стильно обошли семантического слона в комнате, о котором вели речь в начале ролика. Третий вопрос — зачем генерить визы и заставлять в них вникать, когда можно сразу ответить на вопрос. При этом выдача набора виджетов фактоида, динамикой и основными разрезами сам по себе хорошая фича. Но кажется нужна по спец запросу или уже для креатора. - Потом клац - на этом "сорсе" с "метриками" селфсервис юзер создал "деш". Тот же наброс — пушим в старое, не? Такое осядет мусором на сервере. Если только в личный сендбокс без шаринга если приспичило. Сама по себе генерация дешей на базовом виздвижке и доработкой стандартными средствами — это хорошо. Но мы в Авито вероятно от этого пока откажется - слишком дорого, оставим агенту весь JS и не будем мучить всех сборкой дешей на бедной drag-n-drop библиотеке чартов. С UI чата - ожидание от неаналитика в создание визов руками уходит, а профики будут ваять с агентом на JS. - Короче не хватило встроенного гавернанса - иначе ai-driven серфсервис это немного про обезьяну с грантатой - засрет все BI-слопом и положит dwh кверями. 43:53 - Аватар. Не до конца понял. Пока выглядит как простой rules-based алертинг. Проблема всех алертов была и останется - в массовом false positive срабатывании чекеров. Поэтому все дайджесты инсайтов в итоге или отключают или пускают через проверку кожаным. - в плохом выявлении причин событий автоматикой. Тут возврат к системе управления контекстом + агенты судьи. Без этого все тлен (с этом впрочем возможно тоже)). 47:07 - Лаборатория - норм, переупаковка Клода в контуре BI системы. Вопрос - зачем отдельный чат в cortex визы, тут есть mcp dwh/BI и можно его сделать стартовым. Плюс его в мессенджер высадить. Каждая 10 цифра будет фейком, но для self service может и норм. «Не могли этого не сделать. Must have для BI системы» Звучит как продуктовые чемоданы без ручек, которые стоит бросить, раз уже делаем next gen. А вообще крутые эксперименты. Диалог с чатом в левой части экрана — значит все серьезно. AI-first. Понимаю что пост — душнота страшная, но таков путь. Актуалочка.	1 927
6	Простой тест: спроси коллегу, кто у вас в компании самый сильный BI. Если назвали тебя — пора откликаться на вакансии в Авито. Если серьёзно — мы ищем сильных BI на senior и middle. Нам важно: — Автономность и самоменеджмент. Не разжевываем. — End-to-end. Берешь проблему бизнеса и деливеришь результат. — Диапазон. Свободно ходишь от кода и системного анализа к бизнес-логике и визуалу. И обратно. Что получишь кроме зп: масштаб проектов, сильное BI-комьюнити и стек с AI блекджеком. Откликаться мне в личку @alexbarakov или на сайте. Синьорной позиции нет на сайте, но она есть. Больше про BI в Авито — по тегу #AvitoBI в наших каналах.	2 311

查看所有帖子