Data Nature 🕊
رفتن به کانال در Telegram
Канал о жизни BI аналитики и инфо-дизайна в корп реалиях с фокусом на работающих практиках управления. Веду как летопись полезного для себя и людей с такими же неврозами. александр бараков @alexbarakov datanature.ru data-nature.com (рекламу не размещаю)
نمایش بیشتر6 106
مشترکین
-124 ساعت
-47 روز
+2230 روز
در حال بارگیری داده...
کانالهای مشابه
ابر برچسبها
اشارات ورودی و خروجی
---
---
---
---
---
---
جذب مشترکین
ژوئن '26
ژوئن '26
+23
در 1 کانالها
مه '26
+63
در 0 کانالها
Get PRO
آوریل '26
+46
در 0 کانالها
Get PRO
مارس '26
+83
در 1 کانالها
Get PRO
فوریه '26
+124
در 1 کانالها
Get PRO
ژانویه '26
+150
در 3 کانالها
Get PRO
دسامبر '25
+73
در 1 کانالها
Get PRO
نوامبر '25
+90
در 1 کانالها
Get PRO
اکتبر '25
+99
در 2 کانالها
Get PRO
سپتامبر '25
+98
در 2 کانالها
Get PRO
اوت '25
+130
در 4 کانالها
Get PRO
ژوئیه '25
+129
در 3 کانالها
Get PRO
ژوئن '25
+168
در 4 کانالها
Get PRO
مه '25
+115
در 1 کانالها
Get PRO
آوریل '25
+128
در 2 کانالها
Get PRO
مارس '25
+128
در 1 کانالها
Get PRO
فوریه '25
+143
در 0 کانالها
Get PRO
ژانویه '25
+141
در 0 کانالها
Get PRO
دسامبر '24
+251
در 2 کانالها
Get PRO
نوامبر '24
+276
در 3 کانالها
Get PRO
اکتبر '24
+139
در 4 کانالها
Get PRO
سپتامبر '24
+129
در 1 کانالها
Get PRO
اوت '24
+243
در 4 کانالها
Get PRO
ژوئیه '24
+108
در 4 کانالها
Get PRO
ژوئن '24
+103
در 1 کانالها
Get PRO
مه '24
+199
در 5 کانالها
Get PRO
آوریل '24
+146
در 5 کانالها
Get PRO
مارس '24
+134
در 3 کانالها
Get PRO
فوریه '24
+92
در 6 کانالها
Get PRO
ژانویه '24
+86
در 2 کانالها
Get PRO
دسامبر '23
+83
در 1 کانالها
Get PRO
نوامبر '23
+85
در 3 کانالها
Get PRO
اکتبر '23
+170
در 6 کانالها
Get PRO
سپتامبر '23
+223
در 0 کانالها
Get PRO
اوت '23
+169
در 0 کانالها
Get PRO
ژوئیه '23
+185
در 0 کانالها
Get PRO
ژوئن '23
+122
در 0 کانالها
Get PRO
مه '23
+553
در 0 کانالها
Get PRO
آوریل '23
+78
در 0 کانالها
Get PRO
مارس '23
+412
در 0 کانالها
Get PRO
فوریه '23
+315
در 0 کانالها
Get PRO
ژانویه '23
+305
در 0 کانالها
Get PRO
دسامبر '22
+46
در 0 کانالها
Get PRO
نوامبر '22
+243
در 0 کانالها
Get PRO
اکتبر '22
+91
در 0 کانالها
Get PRO
سپتامبر '22
+21
در 0 کانالها
Get PRO
اوت '22
+77
در 0 کانالها
Get PRO
ژوئیه '22
+50
در 0 کانالها
Get PRO
ژوئن '22
+118
در 0 کانالها
Get PRO
مه '22
+16
در 0 کانالها
Get PRO
آوریل '22
+27
در 0 کانالها
Get PRO
مارس '22
+53
در 0 کانالها
Get PRO
فوریه '22
+148
در 0 کانالها
Get PRO
ژانویه '22
+237
در 0 کانالها
Get PRO
دسامبر '21
+618
در 0 کانالها
| تاریخ | رشد مشترکین | اشارات | کانالها | |
| 11 ژوئن | 0 | |||
| 10 ژوئن | +1 | |||
| 09 ژوئن | +5 | |||
| 08 ژوئن | +4 | |||
| 07 ژوئن | 0 | |||
| 06 ژوئن | +1 | |||
| 05 ژوئن | 0 | |||
| 04 ژوئن | +5 | |||
| 03 ژوئن | +1 | |||
| 02 ژوئن | +3 | |||
| 01 ژوئن | +3 |
پستهای کانال
Эфир Visiology Cortex про их next gen BI прототип вызвал тут обсуждение в закрытых чатах и резонирует с тем, как мы строим свой BI тулинг в Авито.
Начну с предложения всем посмотреть, Иван с командой хорошо копает в продуктовые гипотезы, дает часто независимую аналитику. Ищут новые сценарии в BI и делятся.
Кто посмотрел - давайте обсудим (тут нет правильных ответов).
Закину свои мысли подробнее, с переходом в душноту:
15:05 Иван начал с того, что разложил базу про основные AI+BI группы юзкейсов. Тут все по делу:
- вайбкодинг в BI стоит своих токенов, годится для ресерча, прототипа, администрирования, но для прода все еще много правдоподобно ошибается, требует реворка/ревью. Ценность межуется с потерями. Всем пробовать.
- чат с базой данных (Text2SQL) работает, но точность сильно зависит от семантического слоя и системы управления контекстом, которые никто в реальной жизни (пока) не построил.
- ИИ помощники в BI, тупо полезные встроенные тулы, которые где то сильно (код), где то не сильно (визуал) ускоряют разработчика.
Потом начинается демо.
Красивое вендорское демо - смелое, с предположениями, иногда далекими от жизни:
32:19 cortex визы, новое поколение self service аналитики в понимании visiology.
Вопрос - почему юзера с бизнес-вопросом отправляют конструировать (пусть и с агентом) подключение? В это пойдет casual explorer а их обычно 5-7%. Кажется правильнее исходить, что качественные сорсы/квери уже размечены для агента аналитиками/BI. Наоборот надо предотвращать тут создание новых сорсов, коннектов неаналитиком.
Первый кусочек продуктового легаси и идеализма. Из области для атоса (юзера) это слишком много, для графа де ла фер (биайщика) слишком мало.
- Далее флоу ведет к генерации метрик.
Первый вопрос зачем их давать так свободно генерить, а не брать из сертифицированного стора ? (жесткий риск утраты так долго выстраиваемой версии блять правды)
Второй вопрос - как решена в генерации проблема правдоподобных и скрытых ошибок в логике? Ребята стильно обошли семантического слона в комнате, о котором вели речь в начале ролика.
Третий вопрос — зачем генерить визы и заставлять в них вникать, когда можно сразу ответить на вопрос.
При этом выдача набора виджетов фактоида, динамикой и основными разрезами сам по себе хорошая фича. Но кажется нужна по спец запросу или уже для креатора.
- Потом клац - на этом "сорсе" с "метриками" селфсервис юзер создал "деш". Тот же наброс — пушим в старое, не? Такое осядет мусором на сервере. Если только в личный сендбокс без шаринга если приспичило.
Сама по себе генерация дешей на базовом виздвижке и доработкой стандартными средствами — это хорошо. Но мы в Авито вероятно от этого пока откажется - слишком дорого, оставим агенту весь JS и не будем мучить всех сборкой дешей на бедной drag-n-drop библиотеке чартов. С UI чата - ожидание от неаналитика в создание визов руками уходит, а профики будут ваять с агентом на JS.
- Короче не хватило встроенного гавернанса - иначе ai-driven серфсервис это немного про обезьяну с грантатой - засрет все BI-слопом и положит dwh кверями.
43:53 - Аватар. Не до конца понял. Пока выглядит как простой rules-based алертинг. Проблема всех алертов была и останется
- в массовом false positive срабатывании чекеров. Поэтому все дайджесты инсайтов в итоге или отключают или пускают через проверку кожаным.
- в плохом выявлении причин событий автоматикой. Тут возврат к системе управления контекстом + агенты судьи. Без этого все тлен (с этом впрочем возможно тоже)).
47:07 - Лаборатория - норм, переупаковка Клода в контуре BI системы. Вопрос - зачем отдельный чат в cortex визы, тут есть mcp dwh/BI и можно его сделать стартовым. Плюс его в мессенджер высадить.
Каждая 10 цифра будет фейком, но для self service может и норм.
«Не могли этого не сделать. Must have для BI системы»Звучит как продуктовые чемоданы без ручек, которые стоит бросить, раз уже делаем next gen. А вообще крутые эксперименты. Диалог с чатом в левой части экрана — значит все серьезно. AI-first. Понимаю что пост — душнота страшная, но таков путь. Актуалочка.
| 2 | Простой тест: спроси коллегу, кто у вас в компании самый сильный BI. Если назвали тебя — пора откликаться на вакансии в Авито.
Если серьёзно — мы ищем сильных BI на senior и middle.
Нам важно:
— Автономность и самоменеджмент. Не разжевываем.
— End-to-end. Берешь проблему бизнеса и деливеришь результат.
— Диапазон. Свободно ходишь от кода и системного анализа к бизнес-логике и визуалу. И обратно.
Что получишь кроме зп: масштаб проектов, сильное BI-комьюнити и стек с AI блекджеком.
Откликаться мне в личку @alexbarakov или на сайте.
Синьорной позиции нет на сайте, но она есть.
Больше про BI в Авито — по тегу #AvitoBI в наших каналах. | 1 719 |
| 3 | AI-first data-cтратегии сейчас писать не лучшее время. Никто не понимает ничего кроме вектора.
Для работы сделал компромиссный сценарий для ориентира.
В основе - и наш опыт в Авито и наблюдения/разговоры с мировым техом.
Сценарий на 100% неточен и завтра устареет.
Но мыслей много и надо записать, что есть "на сейчас":
1. Измеримого эффекта сейчас нет никакого. Пока. Большинство жжет токены, получает локальные эффекты, но не масштабирует пилоты. AI добавляют в устоявшиеся процессы. И AI усложняет систему и вносит в процессы хаос. Без новой AI-native инфраструктуры и процессов идет деградация качества, боттлнеки в review, затраты на реворк, блоки с персдатой. Нужен переход к новой модели работы "AI генерирует - человек проверяет", а это очень дорогая и требовательная система.
2. Изменения в BI понятны примерно (см прикидка на картинке)
В пропорции задач будет падать доля разработки BI дашбордов и витрин, доля ad-hoc.
Расти: разработка core моделей данных, semantic layer и governance.
Новый класс задач - создание и поддержка агентных систем.
Экономия будет, но ограниченная и неравномерная и не сразу.
Суммарный extra capacity пусть будет: ~ +0.3– 0.6 FTE на 1 BI разработчика к 28 году. И это при скорее бесткейс - частичное ускорение отдельных задач с сильной зависимостью от роста зрелости.
Реально есть ускорение - в создании витрин, пайплайнов, написании кода, создании чекеров и документации, ресерчах.
Причем больше AI ≠ лучше результат. В разработке оптимум ~30–50% AI-кода (не только наше ощущение). Дальше растёт число ошибок. Похоже это не временное ограничение, а некий предел.
Ускорение компенсируется новым оверхедом: human-review, коммуникации с бизнесом, debugging, governance.
С дешами тоже пока рано говорить об ускорении. Визы АI делает норм, но для продовых дешей объем реворка сопоставим с ускорением. Вот количество задач упадет - AI based apps заменят те деши, которые делались под разовую аналитическую задачу.
3. Синьоры вайбкодят лучше, получают больше эффекта (не только наш вывод). Новый подход повышает плотность решений и требует высокой итеративности и разборчивости и аутпутам, чтобы получить продовой результат. Мидлы чаще останавливаются и принимают результат ниже качеством, пропускают ошибки. Вайбкодинг нужен таки как отдельных хард (или софт, пофиг).
4. Самый большой эффект — не в ускорении, а в новых до этого не решавшихся задачах: считать 100% вместо 10%, проверять всё, а не выборку, документировать всё, а не частично. То, что раньше не делали из-за ресурса.
5. Главные пререквизиты — semantic layer (как слой метрик и разрезов), trusted сore слой витрин под ним (включая логическую и концептуальную модель) и доменная база знаний сверху (фьюшоты). Без них: text-to-SQL угадывает, делает правдоподобные ошибки, генерит rework, теряется построенная годами консистентность метрик и доверие пользователей.
6. Governance остается и становится важнее
AI ускоряет генерацию и валидацию меты, но не помогает с принятием решений, ответственностью. Human-in-the-loop остаётся. Плюсом AI увеличивает объемы контента, генерит AI slop, что требует большего ресурса на его разбор (сертификацию и архивацию). Добавляется гавернанс контекста и скиллов.
7. Основные "стены" в которые все врезаются: bottleneck в review, рост ошибок при росте доли AI-контента, низкий эффект из за недобора в governance, semantic layer, графах знаний и контекста.
8. «Как в любой масштабной трансформации - будущее наступает неравномерно».
Если в вашей компании нет волны вайбкода вы вероятно не видите, как сильно меняется профессия работы с данными.
Но переживать не имеет смысла, ведь это вне нашего контроля.
Можно включаться активнее, можно пока спокойно заниматься работой над AI ready архитектурой и следить.
Пока рождаются новые процессы и есть пока только иллюзия ценности AI.
Когда начнутся необратимые вещи — все узнаете и успеете. | 0 |
| 4 | Здоровое питание вашего AI аналитика
Прикопаем тут еще одну скучную «невидимую» тему, на которую потратил много "мыслетоплива".
Речь про core-слой сертифицированных витрин.
И инженеры и аналитики избегают этой темы. В нем мало низковисящих фруктов, нет готовых подходов, сложно покрыть себя славой.
Но он решает сутевую проблему - хаоса витрин и низкого переиспользования. Бич мультидоменных платформ с кросс юзаджем.
Поэтому весь прошлый год продавал внутри идею. В итоге скорее продавил, чем продал. В конкуренции с другими инициативами за бюджет - нужен эффект с деньгами.
Цели кор-слоя понятийно правильные — быстрее находить, делать меньше джойнов, ускорять расчеты, сокращать количество объектов, экономить инфру.
Досчитываем метрики уже параллельно с внедрением.
О чем речь.
Кор слой это витрины с заявленным статусом доверия certified.
— удобные для адхоков (шарокие) и создания других витрин (3НФ)
— с покрытием качеством и гарантией (ownership, SLA, DQ-checks, meta)
— c продвижением - reuse вместо «соберу ка еще одну витрину»
Можно воспринимать как основу или как часть семантического слоя (смотря как широко брать).
Ну и из заголовка вы поняли - кор слой - основная часть рациона AI аналитика, вместе с доменным контекстом. Всем нужно думать о здоровом питании.
В Авито проект делается смешанным ресурсом платформенным DWH и BI в доменах.
Дима Мележиков, лид BI из домена Маркетинга, ворвался в проектную команду, надел шапочку продакта и потащил, под прессингом доменных биай задач. Опасный тип. Читайте его статью на хабре (дайте лайков) про прогресс прошлого года.
С того момента снова перебрали подход и продолжаем экспериментировать. Прикручиваем туда:
— AI generated DQ checks
— AI generated описание витрин
— Автоматический health scoring в каталоге
У Димы будет доклад на Aha-26.
Что сделаем к маю — расскажет. Что не успеем — приукрасит 🙂
Кто решал такую задачу - отзовитесь поболтать.
Вот кстати близкий кейс Airbnb.
Женя Ермаков еще помнится вскользь рассказывал про схожий проект common data marts в яндекс такси. Давно это было. | 0 |
| 5 | Не знаю, его ли мы все ждали, но шифт на agentic analytics начался. Как минимум в бигтехе.
Бигтехи техничны, гибки, управляемы и при деньгах. Когда компания дает добро на работу с условным Claude Code — начинается почти биология:
За пару недель появляются MCP ко всем основным сервисам.
Самоорганизуются vibe-coding сессии обмена опытом.
Знания передаются на стихийных 1-1.
Скиллы агентов множатся и шарятся.
Мелькают сообщения, доки, код, деши, витрины, написанные агентами.
Безопасники хлопают глазами и переглядываются.
Но agentic приносит не только wow-эмоции.
Он открывает довольно сложные вопросы.
Опыт Amazon, на который весь бигтех смотрит как на фронтира, дает пищу для размышлений:
- одним из первых озвучили жесткий AI-first на сырых инструментах
- первыми обжигаются с кодгеном роняя прод на ~6 часов
- вводят обязательный review AI кода синьорами
Вектор это, правда, не отменяет.
Какие наблюдения:
- будет резко расти доля запросов к платформе. Агенты джойнят как угорелые и не всегда элегантно. Возможна деградация перфоманса от перегрузки инфры. Придется думать о фильтрации и семплировании агентских запросов, агентских квотах.
- после стратегии «дикого запада» придет подсчет сожженных токенов. Многие сценарии могут просто не окупаться. Для сравнения с трудоемкостью операций «по-старому» пока не хватает данных.
- риски доступа к проду. Агент уже может написать код, сделать push и сам же сделать review. Такие кейсы нужно ловить и блокировать (пока). Сейчас доступ агента = доступ пользователя. Но дальше придется думать о регистрации агентов, связанных с сотрудниками, и выдаче им отдельных доступов. Типа сервисных аккаунтов. Но с характером. Появится новый тип observability — мониторинг действий агентов: какие запросы генерируются, сколько токенов потрачено, какой код, что поменял. Такой observability тоже будет агентским. Хорошо ли это.
- объем кода, дешей и др дата-артефактов вырастет на порядок. Тем кто выплыл из хаоса контента - нужно снова сделать вдох перед погружением.
- и есть парадокс. Все ожидали: AI сократит потребность в инженерах и аналитиках. Пока происходит обратное. Вакансий в мире становится больше. Говорят, жажда легкого и доступного кода привела в инжиниринг компании, которые раньше покупали как SaaS ПО.
- Рост AI замедляется стоимостью compute. Если стоимость AI > стоимость человека - автоматизация перестанет быть выгодной. Естественный экономический лимит. Реальный AI адопшн говорят будет тогда как с интернетом или электричеством - замедленным. Ну успокоили.
В общем, ощущение, что дамбу открыли.
И достаточно квартала, чтобы в погоне за эффективностью
затопить всю долину.
Надо продумывать Governance. Сразу.
Нихрена не понятно, но очень интересно.
(На фото - инженеры до изобретения autocad) | 0 |
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
