fa
Feedback
Data Nature 🕊

Data Nature 🕊

رفتن به کانال در Telegram

Канал о жизни BI аналитики и инфо-дизайна в корп реалиях с фокусом на работающих практиках управления. Веду как летопись полезного для себя и людей с такими же неврозами. александр бараков @alexbarakov datanature.ru data-nature.com (рекламу не размещаю)

نمایش بیشتر
6 106
مشترکین
-124 ساعت
-47 روز
+2230 روز
جذب مشترکین
ژوئن '26
ژوئن '26
+23
در 1 کانال‌ها
مه '26
+63
در 0 کانال‌ها
Get PRO
آوریل '26
+46
در 0 کانال‌ها
Get PRO
مارس '26
+83
در 1 کانال‌ها
Get PRO
فوریه '26
+124
در 1 کانال‌ها
Get PRO
ژانویه '26
+150
در 3 کانال‌ها
Get PRO
دسامبر '25
+73
در 1 کانال‌ها
Get PRO
نوامبر '25
+90
در 1 کانال‌ها
Get PRO
اکتبر '25
+99
در 2 کانال‌ها
Get PRO
سپتامبر '25
+98
در 2 کانال‌ها
Get PRO
اوت '25
+130
در 4 کانال‌ها
Get PRO
ژوئیه '25
+129
در 3 کانال‌ها
Get PRO
ژوئن '25
+168
در 4 کانال‌ها
Get PRO
مه '25
+115
در 1 کانال‌ها
Get PRO
آوریل '25
+128
در 2 کانال‌ها
Get PRO
مارس '25
+128
در 1 کانال‌ها
Get PRO
فوریه '25
+143
در 0 کانال‌ها
Get PRO
ژانویه '25
+141
در 0 کانال‌ها
Get PRO
دسامبر '24
+251
در 2 کانال‌ها
Get PRO
نوامبر '24
+276
در 3 کانال‌ها
Get PRO
اکتبر '24
+139
در 4 کانال‌ها
Get PRO
سپتامبر '24
+129
در 1 کانال‌ها
Get PRO
اوت '24
+243
در 4 کانال‌ها
Get PRO
ژوئیه '24
+108
در 4 کانال‌ها
Get PRO
ژوئن '24
+103
در 1 کانال‌ها
Get PRO
مه '24
+199
در 5 کانال‌ها
Get PRO
آوریل '24
+146
در 5 کانال‌ها
Get PRO
مارس '24
+134
در 3 کانال‌ها
Get PRO
فوریه '24
+92
در 6 کانال‌ها
Get PRO
ژانویه '24
+86
در 2 کانال‌ها
Get PRO
دسامبر '23
+83
در 1 کانال‌ها
Get PRO
نوامبر '23
+85
در 3 کانال‌ها
Get PRO
اکتبر '23
+170
در 6 کانال‌ها
Get PRO
سپتامبر '23
+223
در 0 کانال‌ها
Get PRO
اوت '23
+169
در 0 کانال‌ها
Get PRO
ژوئیه '23
+185
در 0 کانال‌ها
Get PRO
ژوئن '23
+122
در 0 کانال‌ها
Get PRO
مه '23
+553
در 0 کانال‌ها
Get PRO
آوریل '23
+78
در 0 کانال‌ها
Get PRO
مارس '23
+412
در 0 کانال‌ها
Get PRO
فوریه '23
+315
در 0 کانال‌ها
Get PRO
ژانویه '23
+305
در 0 کانال‌ها
Get PRO
دسامبر '22
+46
در 0 کانال‌ها
Get PRO
نوامبر '22
+243
در 0 کانال‌ها
Get PRO
اکتبر '22
+91
در 0 کانال‌ها
Get PRO
سپتامبر '22
+21
در 0 کانال‌ها
Get PRO
اوت '22
+77
در 0 کانال‌ها
Get PRO
ژوئیه '22
+50
در 0 کانال‌ها
Get PRO
ژوئن '22
+118
در 0 کانال‌ها
Get PRO
مه '22
+16
در 0 کانال‌ها
Get PRO
آوریل '22
+27
در 0 کانال‌ها
Get PRO
مارس '22
+53
در 0 کانال‌ها
Get PRO
فوریه '22
+148
در 0 کانال‌ها
Get PRO
ژانویه '22
+237
در 0 کانال‌ها
Get PRO
دسامبر '21
+618
در 0 کانال‌ها
تاریخ
رشد مشترکین
اشارات
کانال‌ها
11 ژوئن0
10 ژوئن+1
09 ژوئن+5
08 ژوئن+4
07 ژوئن0
06 ژوئن+1
05 ژوئن0
04 ژوئن+5
03 ژوئن+1
02 ژوئن+3
01 ژوئن+3
پست‌های کانال
Эфир Visiology Cortex про их next gen BI прототип вызвал тут обсуждение в закрытых чатах и резонирует с тем, как мы строим свой BI тулинг в Авито. Начну с предложения всем посмотреть, Иван с командой хорошо копает в продуктовые гипотезы, дает часто независимую аналитику. Ищут новые сценарии в BI и делятся. Кто посмотрел - давайте обсудим (тут нет правильных ответов). Закину свои мысли подробнее, с переходом в душноту: 15:05 Иван начал с того, что разложил базу про основные AI+BI группы юзкейсов. Тут все по делу: - вайбкодинг в BI стоит своих токенов, годится для ресерча, прототипа, администрирования, но для прода все еще много правдоподобно ошибается, требует реворка/ревью. Ценность межуется с потерями. Всем пробовать. - чат с базой данных (Text2SQL) работает, но точность сильно зависит от семантического слоя и системы управления контекстом, которые никто в реальной жизни (пока) не построил. - ИИ помощники в BI, тупо полезные встроенные тулы, которые где то сильно (код), где то не сильно (визуал) ускоряют разработчика. Потом начинается демо. Красивое вендорское демо - смелое, с предположениями, иногда далекими от жизни: 32:19 cortex визы, новое поколение self service аналитики в понимании visiology. Вопрос - почему юзера с бизнес-вопросом отправляют конструировать (пусть и с агентом) подключение? В это пойдет casual explorer а их обычно 5-7%. Кажется правильнее исходить, что качественные сорсы/квери уже размечены для агента аналитиками/BI. Наоборот надо предотвращать тут создание новых сорсов, коннектов неаналитиком. Первый кусочек продуктового легаси и идеализма. Из области для атоса (юзера) это слишком много, для графа де ла фер (биайщика) слишком мало. - Далее флоу ведет к генерации метрик. Первый вопрос зачем их давать так свободно генерить, а не брать из сертифицированного стора ? (жесткий риск утраты так долго выстраиваемой версии блять правды) Второй вопрос - как решена в генерации проблема правдоподобных и скрытых ошибок в логике? Ребята стильно обошли семантического слона в комнате, о котором вели речь в начале ролика. Третий вопрос — зачем генерить визы и заставлять в них вникать, когда можно сразу ответить на вопрос. При этом выдача набора виджетов фактоида, динамикой и основными разрезами сам по себе хорошая фича. Но кажется нужна по спец запросу или уже для креатора. - Потом клац - на этом "сорсе" с "метриками" селфсервис юзер создал "деш". Тот же наброс — пушим в старое, не? Такое осядет мусором на сервере. Если только в личный сендбокс без шаринга если приспичило. Сама по себе генерация дешей на базовом виздвижке и доработкой стандартными средствами — это хорошо. Но мы в Авито вероятно от этого пока откажется - слишком дорого, оставим агенту весь JS и не будем мучить всех сборкой дешей на бедной drag-n-drop библиотеке чартов. С UI чата - ожидание от неаналитика в создание визов руками уходит, а профики будут ваять с агентом на JS. - Короче не хватило встроенного гавернанса - иначе ai-driven серфсервис это немного про обезьяну с грантатой - засрет все BI-слопом и положит dwh кверями. 43:53 - Аватар. Не до конца понял. Пока выглядит как простой rules-based алертинг. Проблема всех алертов была и останется - в массовом false positive срабатывании чекеров. Поэтому все дайджесты инсайтов в итоге или отключают или пускают через проверку кожаным. - в плохом выявлении причин событий автоматикой. Тут возврат к системе управления контекстом + агенты судьи. Без этого все тлен (с этом впрочем возможно тоже)). 47:07 - Лаборатория - норм, переупаковка Клода в контуре BI системы. Вопрос - зачем отдельный чат в cortex визы, тут есть mcp dwh/BI и можно его сделать стартовым. Плюс его в мессенджер высадить. Каждая 10 цифра будет фейком, но для self service может и норм.
«Не могли этого не сделать. Must have для BI системы»
Звучит как продуктовые чемоданы без ручек, которые стоит бросить, раз уже делаем next gen. А вообще крутые эксперименты. Диалог с чатом в левой части экрана — значит все серьезно. AI-first. Понимаю что пост — душнота страшная, но таков путь. Актуалочка.

2
Простой тест: спроси коллегу, кто у вас в компании самый сильный BI. Если назвали тебя — пора откликаться на вакансии в Авито
Простой тест: спроси коллегу, кто у вас в компании самый сильный BI. Если назвали тебя — пора откликаться на вакансии в Авито. Если серьёзно — мы ищем сильных BI на senior и middle. Нам важно: — Автономность и самоменеджмент. Не разжевываем. — End-to-end. Берешь проблему бизнеса и деливеришь результат. — Диапазон. Свободно ходишь от кода и системного анализа к бизнес-логике и визуалу. И обратно. Что получишь кроме зп: масштаб проектов, сильное BI-комьюнити и стек с AI блекджеком. Откликаться мне в личку @alexbarakov или на сайте. Синьорной позиции нет на сайте, но она есть. Больше про BI в Авито — по тегу #AvitoBI в наших каналах.
1 719
3
AI-first data-cтратегии сейчас писать не лучшее время. Никто не понимает ничего кроме вектора. Для работы сделал компромиссны+1
AI-first data-cтратегии сейчас писать не лучшее время. Никто не понимает ничего кроме вектора. Для работы сделал компромиссный сценарий для ориентира. В основе - и наш опыт в Авито и наблюдения/разговоры с мировым техом. Сценарий на 100% неточен и завтра устареет. Но мыслей много и надо записать, что есть "на сейчас": 1. Измеримого эффекта сейчас нет никакого. Пока. Большинство жжет токены, получает локальные эффекты, но не масштабирует пилоты. AI добавляют в устоявшиеся процессы. И AI усложняет систему и вносит в процессы хаос. Без новой AI-native инфраструктуры и процессов идет деградация качества, боттлнеки в review, затраты на реворк, блоки с персдатой. Нужен переход к новой модели работы "AI генерирует - человек проверяет", а это очень дорогая и требовательная система. 2. Изменения в BI понятны примерно (см прикидка на картинке) В пропорции задач будет падать доля разработки BI дашбордов и витрин, доля ad-hoc. Расти: разработка core моделей данных, semantic layer и governance. Новый класс задач - создание и поддержка агентных систем. Экономия будет, но ограниченная и неравномерная и не сразу. Суммарный extra capacity пусть будет: ~ +0.3– 0.6 FTE на 1 BI разработчика к 28 году. И это при скорее бесткейс - частичное ускорение отдельных задач с сильной зависимостью от роста зрелости. Реально есть ускорение - в создании витрин, пайплайнов, написании кода, создании чекеров и документации, ресерчах. Причем больше AI ≠ лучше результат. В разработке оптимум ~30–50% AI-кода (не только наше ощущение). Дальше растёт число ошибок. Похоже это не временное ограничение, а некий предел. Ускорение компенсируется новым оверхедом: human-review, коммуникации с бизнесом, debugging, governance. С дешами тоже пока рано говорить об ускорении. Визы АI делает норм, но для продовых дешей объем реворка сопоставим с ускорением. Вот количество задач упадет - AI based apps заменят те деши, которые делались под разовую аналитическую задачу. 3. Синьоры вайбкодят лучше, получают больше эффекта (не только наш вывод). Новый подход повышает плотность решений и требует высокой итеративности и разборчивости и аутпутам, чтобы получить продовой результат. Мидлы чаще останавливаются и принимают результат ниже качеством, пропускают ошибки. Вайбкодинг нужен таки как отдельных хард (или софт, пофиг). 4. Самый большой эффект — не в ускорении, а в новых до этого не решавшихся задачах: считать 100% вместо 10%, проверять всё, а не выборку, документировать всё, а не частично. То, что раньше не делали из-за ресурса. 5. Главные пререквизиты — semantic layer (как слой метрик и разрезов), trusted сore слой витрин под ним (включая логическую и концептуальную модель) и доменная база знаний сверху (фьюшоты). Без них: text-to-SQL угадывает, делает правдоподобные ошибки, генерит rework, теряется построенная годами консистентность метрик и доверие пользователей. 6. Governance остается и становится важнее AI ускоряет генерацию и валидацию меты, но не помогает с принятием решений, ответственностью. Human-in-the-loop остаётся. Плюсом AI увеличивает объемы контента, генерит AI slop, что требует большего ресурса на его разбор (сертификацию и архивацию). Добавляется гавернанс контекста и скиллов. 7. Основные "стены" в которые все врезаются: bottleneck в review, рост ошибок при росте доли AI-контента, низкий эффект из за недобора в governance, semantic layer, графах знаний и контекста. 8. «Как в любой масштабной трансформации - будущее наступает неравномерно». Если в вашей компании нет волны вайбкода вы вероятно не видите, как сильно меняется профессия работы с данными. Но переживать не имеет смысла, ведь это вне нашего контроля. Можно включаться активнее, можно пока спокойно заниматься работой над AI ready архитектурой и следить. Пока рождаются новые процессы и есть пока только иллюзия ценности AI. Когда начнутся необратимые вещи — все узнаете и успеете.
0
4
Здоровое питание вашего AI аналитика Прикопаем тут еще одну скучную «невидимую» тему, на которую потратил много "мыслетоплива
Здоровое питание вашего AI аналитика Прикопаем тут еще одну скучную «невидимую» тему, на которую потратил много "мыслетоплива". Речь про core-слой сертифицированных витрин. И инженеры и аналитики избегают этой темы. В нем мало низковисящих фруктов, нет готовых подходов, сложно покрыть себя славой. Но он решает сутевую проблему - хаоса витрин и низкого переиспользования. Бич мультидоменных платформ с кросс юзаджем. Поэтому весь прошлый год продавал внутри идею. В итоге скорее продавил, чем продал. В конкуренции с другими инициативами за бюджет - нужен эффект с деньгами. Цели кор-слоя понятийно правильные — быстрее находить, делать меньше джойнов, ускорять расчеты, сокращать количество объектов, экономить инфру. Досчитываем метрики уже параллельно с внедрением. О чем речь. Кор слой это витрины с заявленным статусом доверия certified. — удобные для адхоков (шарокие) и создания других витрин (3НФ) — с покрытием качеством и гарантией (ownership, SLA, DQ-checks, meta) — c продвижением - reuse вместо «соберу ка еще одну витрину» Можно воспринимать как основу или как часть семантического слоя (смотря как широко брать). Ну и из заголовка вы поняли - кор слой - основная часть рациона AI аналитика, вместе с доменным контекстом. Всем нужно думать о здоровом питании. В Авито проект делается смешанным ресурсом платформенным DWH и BI в доменах. Дима Мележиков, лид BI из домена Маркетинга, ворвался в проектную команду, надел шапочку продакта и потащил, под прессингом доменных биай задач. Опасный тип. Читайте его статью на хабре (дайте лайков) про прогресс прошлого года. С того момента снова перебрали подход и продолжаем экспериментировать. Прикручиваем туда: — AI generated DQ checks — AI generated описание витрин — Автоматический health scoring в каталоге У Димы будет доклад на Aha-26. Что сделаем к маю — расскажет. Что не успеем — приукрасит 🙂 Кто решал такую задачу - отзовитесь поболтать. Вот кстати близкий кейс Airbnb. Женя Ермаков еще помнится вскользь рассказывал про схожий проект common data marts в яндекс такси. Давно это было.
0
5
Не знаю, его ли мы все ждали, но шифт на agentic analytics начался. Как минимум в бигтехе. Бигтехи техничны, гибки, управляем
Не знаю, его ли мы все ждали, но шифт на agentic analytics начался. Как минимум в бигтехе. Бигтехи техничны, гибки, управляемы и при деньгах. Когда компания дает добро на работу с условным Claude Code — начинается почти биология: За пару недель появляются MCP ко всем основным сервисам. Самоорганизуются vibe-coding сессии обмена опытом. Знания передаются на стихийных 1-1. Скиллы агентов множатся и шарятся. Мелькают сообщения, доки, код, деши, витрины, написанные агентами. Безопасники хлопают глазами и переглядываются. Но agentic приносит не только wow-эмоции. Он открывает довольно сложные вопросы. Опыт Amazon, на который весь бигтех смотрит как на фронтира, дает пищу для размышлений: - одним из первых озвучили жесткий AI-first на сырых инструментах - первыми обжигаются с кодгеном роняя прод на ~6 часов - вводят обязательный review AI кода синьорами Вектор это, правда, не отменяет. Какие наблюдения: - будет резко расти доля запросов к платформе. Агенты джойнят как угорелые и не всегда элегантно. Возможна деградация перфоманса от перегрузки инфры. Придется думать о фильтрации и семплировании агентских запросов, агентских квотах. - после стратегии «дикого запада» придет подсчет сожженных токенов. Многие сценарии могут просто не окупаться. Для сравнения с трудоемкостью операций «по-старому» пока не хватает данных. - риски доступа к проду. Агент уже может написать код, сделать push и сам же сделать review. Такие кейсы нужно ловить и блокировать (пока). Сейчас доступ агента = доступ пользователя. Но дальше придется думать о регистрации агентов, связанных с сотрудниками, и выдаче им отдельных доступов. Типа сервисных аккаунтов. Но с характером. Появится новый тип observability — мониторинг действий агентов: какие запросы генерируются, сколько токенов потрачено, какой код, что поменял. Такой observability тоже будет агентским. Хорошо ли это. - объем кода, дешей и др дата-артефактов вырастет на порядок. Тем кто выплыл из хаоса контента - нужно снова сделать вдох перед погружением. - и есть парадокс. Все ожидали: AI сократит потребность в инженерах и аналитиках. Пока происходит обратное. Вакансий в мире становится больше. Говорят, жажда легкого и доступного кода привела в инжиниринг компании, которые раньше покупали как SaaS ПО. - Рост AI замедляется стоимостью compute. Если стоимость AI > стоимость человека - автоматизация перестанет быть выгодной. Естественный экономический лимит. Реальный AI адопшн говорят будет тогда как с интернетом или электричеством - замедленным. Ну успокоили. В общем, ощущение, что дамбу открыли. И достаточно квартала, чтобы в погоне за эффективностью затопить всю долину. Надо продумывать Governance. Сразу. Нихрена не понятно, но очень интересно. (На фото - инженеры до изобретения autocad)
0