cookie

We use cookies to improve your browsing experience. By clicking «Accept all», you agree to the use of cookies.

avatar

Клуб CDO

Сообщество профессионалов в области работы с данными и искуственным интеллектом

Show more
Advertising posts
2 666
Subscribers
+224 hours
+117 days
+3230 days

Data loading in progress...

Subscriber growth rate

Data loading in progress...

Вопрос к аудитории - кто какие знает тулы для того, что бы сохранять статьи на "почитать" потому? Я очень долго пользовался Pocket - но что то он совсем плох стал последнее время и превращается из списка на прочтение в какой то агрегатор статей которые мне не нужны. Я тут посмотрел быстро и нашел: https://raindrop.io/ Может быть у кого то есть рекомендации?
Show all...
Raindrop.io — All in One Bookmark Manager

All in One Bookmark Manager. For your inspiration, read later, media and stuff.

Доклад Александра Ермакова, технического директора и сооснователя компании Arenadata, на тему «Технологический цикл решений для обработки данных». https://youtu.be/i_3_DdB4pk4?si=mU6IZhwFoDMPMNcL
Show all...

👍 5
Photo unavailableShow in Telegram
📣Уже 16 мая станут известны лауреаты премии Data Award 2024. 🏆 Награды организациям и командам вручаются в номинациях: ✅За повышение эффективности бизнеса ✅За реализацию инновационной идеи ✅За обеспечение качества данных ✅За достижения в подготовке специалистов по управлению данными ✅За реализацию социально значимых инициатив на основе данных ✅За реализацию антикризисного проекта ✅За клиентоцентричность ✅ Кроме того, учредители Data Award 2024 традиционно вручают специальную премию «За вклад в популяризацию профессии» номинанту, активно проявившему себя в продвижении роли директора по данным и в повышении значимости управления данными для бизнеса и общества в профессиональном медиапространстве, на профильных мероприятиях и в социальных сетях. ✅ Приз лауреату в специальной номинации «Данные без границ» вручит премиум-партнер церемонии — компания «Сбер».
Show all...
👍 5
Photo unavailableShow in Telegram
Ну что, попробуем :)
Show all...
👍 6
Дайджест статей Data Governance: Key takeaways from the Gartner Data & Analytics Summit https://medium.com/selectstar/data-governance-key-takeaways-from-the-gartner-data-analytics-summit-41572285a7d9 Data Engineer :Overview of Data Governance https://premvishnoi.medium.com/data-engineer-overview-of-data-governance-769117297c1c DBT in a Nutshell https://blog.devgenius.io/dbt-data-build-tool-in-a-nutshell-29028bc4e164 5 Brilliant Lakehouse Architectures from Tencent, WeChat, and More https://starrocks.medium.com/5-brilliant-lakehouse-architectures-from-tencent-wechat-and-more-dd069facf532 Как пользоваться Claude: знакомство с главным конкурентом ChatGPT и базовые правила его использования https://habr.com/ru/companies/bothub/articles/812659/ Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов https://habr.com/ru/companies/sberbank/articles/812775/ Выбираем инструмент проектирования интерфейсов для аналитика https://habr.com/ru/articles/813037/ Обзор бесплатных чат-ботов ChatGPT в телеграме 2024 https://habr.com/ru/companies/bothub/articles/813193/ Зачем компаниям ML? Разбираемся на примере Netflix https://habr.com/ru/companies/selectel/articles/811585/
Show all...
Data Governance: Key takeaways from the Gartner Data & Analytics Summit

Modernizing data governance processes is no longer optional-it’s imperative.

4
Извините за оффтопик, но о наболевшем 🙂 Вот я всегда говорю, что главно в управлении проектом и компании это даже не столько понять что надо делать, а правильно определить что НЕ НАДО делать. Особенно это важно на ранних стадиях, когда ресурсов мало и каждый неверный шаг может вас направить по дороге в неудаче. Существует очень хорошая методология для продуктов: HADI-циклы которые используются для того, что бы определить СТЕПЕНЬ УВЕРЕННОСТИ в необходимости реаилзации. Концепция очень простая: берете “фичу” и определяете для нее следующие параметры: ⁃ Hypothesis (постановка гипотезы). На этом этапе собираются все возникающие теории и определяются метрики, на которые влияет изменение. Например, новая версия заголовка может повысить конверсию на целевой странице компании. ⁃ Action. (проверка гипотезы) - ключевым моментом метода HADI является возможность проверить гипотезу. Как только принято решение проверить определенную гипотезу, это нужно сделать как можно быстрее. ⁃ Data. (сбор данных). На этом этапе собираются данные, необходимые для проверки гипотезы, чтобы подтвердить или опровергнуть ее. ⁃ Insights. (заключение) На этом этапе оценивается, как была проверена гипотеза и достигнуты ли поставленные цели. Посмотрите статью для деталей. Если вы имеете мало опыта в той области, в которой делаете продукт/компанию (тут не важна степень масштаба, работает везде) - делайте физические эксперименты, если есть большой опыт - делайте хотя бы мысленные эксперименты. https://productstar.ru/hadi-cycles Правда для того, что бы проводить “мысленные” эксперименты, еще надо иметь достаточно мыслетоплива (https://habr.com/ru/companies/oleg-bunin/articles/348714/) - но это отдельная история
Show all...
ProductStar: «Как и зачем использовать HADI-циклы?»

Что это такое и как они помогают следить за изменениями в объемах продаж

👍 8 1
Repost from Data Nature 🕊
Photo unavailableShow in Telegram
Фрейморки, борды, темплейты, сколько можно 😵‍💫 За год я произвел какое-то количество тулов для data/bi менеджеров. Поток этого "творчества" не унять, это побочный продукт основной работы. Но нужно хотя бы структурировать. Вот последние: - Data & Analytics Maturity Canvas - BI Adoption guide и темплейт, PDF версия - Data & Analytics Strategy & Tactics Guide 2.0 - Борд - Почему Data Catalogs не взлетают? - BI Leader Ramble - Info Design Songbooks (вместе с Настей) - Some Dashboards Roasting (вместе с Ромой) Удачные из них останутся, остальные переродятся во что то другое. Все надо касдевить в этой жизни - напишите в коментах кто чем пользовался. Не только вам, но и мне требуется усилие, чтобы переварить эти борды, подружить с новыми мыслями и c задачами в работе, убедиться что они реально помогают решать проблемы. Сложно не скатываться в итоге в инфо-продукты формата so-what и спасибо-кэп. В том числе для этого я использую свой курс по BI стратегии. Кстати логичнее его переназвать в Разработка Data&Analytics стратегии и тактики, чтоб соответствовало содержанию. Старт 15 мая, можем взять еще 2-3 человека, кому интересно, пишите. Если коротко - это 3-недельный марафон с длинными встречами по вечерам, "лекциями и домашками", tg-чатом и общением. 🤱Сейчас в работе есть еще несколько новых исследований - будущих Miro бордов, на разных стадиях: - BI about BI: контент менеджмент гайд о том, что имеет смысл трекать в своей BI системе + примеры дашбордов - Карта d&a болей: типология проблем разных дата и бизнес ролей + шаблон для воркшопа - Коллекция шаблонов упражнений для воркшопа по дата/BI стратегии (полноценный экстеншн к этому гайду) - Data Governance Program Guide 2.0 - сильно переосмысленный и дополненный - Типология Оргструктур дата команд - Tableau Report Optimization Guide - ... ✍️Напишите в коменты, как думаете - в какие темы вложить больше усилий и продвинуть к готовности в первую очередь? Часть добью и покажу на курсе в мае и потом выведу в паблик. Остальные будут созревать дальше. #cамореклама
Show all...
🔥 5
Немного про ChatGTP-5 Если вы интересуетесь перспективами ChatGPT, но у вас нет времени изучать всё, что появляется в информационном пространстве по поводу грядущей версии ChatGPT-5 - вот статья для вас на выходные, где автор собрал и проанализировал всё, что так или иначе касается перспектив и информации по этой версии LLM. Статья интересная, но супердлинная - её объем составляет 14 000 слов. Поэтому я сделал анализ анализа и ниже привожу краткое изложение некоторых моментов, которые показались интересными мне. В комментариях в посту я размещу её текст с моими пометками - потому что сама статья закрыта за paywall - не считайте это нарушением авторских прав, автору большой респект, работа проделана колоссальная, поэтому давайте считать, что делюсь только с узкой аудиторией этого канала. Самые важные выводы из материала: ⁃ Разработка лучших в своем классе больших языковых моделей (LLM) уровня ChatGPT 4 - решенная на данный момент индустрией проблема. ⁃ ChatGPT-5 скорее будет коллаборацией GPT и Q* архитектур, нежели их слиянием, плюс мощный MoE. ⁃ Не ожидается, что ChatGPT-5 будет иметь возможности агента, но тем не менее будет иметь мощные возможности для рассуждения. Об общем положении OpenAI сейчас: ⁃ Они находятся под сильным давлением, и на рынке очень высокие ожидания от ChatGPT-5. ⁃ OpenAI в своё время обогнала индустрию минимум на 1-2 года, но несмотря на год преимущества в работе над моделью по сравнению с конкурентами, простыми методами увеличения размера и объёма данных сейчас уже не обойтись, нужны новые архитектуры сети. Такие архитектуры уже сейчас появляются в конкурирующих моделях, в частности Q*, перспективы которой лежат не столько в области решения математических задач, что является демонстрацией от Meta, сколько в способности имитировать рассуждения и делать логические выводы. ⁃ Также надо отметить, что скорость, с которой конкуренты получают модели, близкие к ChatGPT-4, все возрастает и возрастает. ⁃ При этом ещё важно понимать, что OpenAI - коммерческая компания, и от неё ожидают одновременно и качественную новую модель и экономический успех - что сложно сделать просто увеличивая объём модели, бюджет на GPU и данные - так что тут вдвойне у них сложная задача. Что мы можем предположить о модели ChatGPT-5: ⁃ Самое основное ожидаемое отличие GPT5 - способность к рассуждению и логическому выводу. ⁃ Интересно, что само название GPT - название архитектуры модели. С учётом того, что новая модель может быть не совсем GPT класса, не факт, что они назовут её ChatGPT-5 - тем не менее с другой стороны, это очень сильный бренд, от которого сложно отказаться. Так что тут OpenAI находится в некоторой ловушке. ⁃ Относительно качества модели, то тут можно поделиться ожиданиями Сэма Альтмана: ⁃ “GPT2 was very bad. GPT3 was pretty bad. GPT4 was pretty bad. But GPT5 will be good.” ⁃ “I expect that the delta between 5 and 4 will be the same as between 4 and 3.” ⁃ Размер модели: ChatGPT-5 может иметь 2-5T параметров (против 1.8T у ChatGPT-4). ⁃ Данные для обучения: для увеличения объёма данных для обучения предполагается, что OpenAI делает большую ставку на синтетические данные + данные, полученные от модели Whisper - распознанные диалоги и ролики с YouTube. ⁃ Архитектура: ⁃ Основной модели остаётся модель GPT. ⁃ Следует ожидать, что это будет ансамбль Mixture of Experts (MoE), а не просто большая плотная модель - при этом есть цифра 200, которую можно отнести к количеству “экспертов” (тут надо отметить, что мы опять переизобретаем ансамбль моделей, который стал промывным для известного кекса Netflix Prize). ⁃ Ожидается активное применение архитектуры Q* с применением RL для обучения рассуждениям. ⁃ OpenAI ещё не готова сделать окончательный прыжок к ИИ-агентам со своим самым большим релизом. Предстоит проделать ещё много работы. TPA, несмотря на то, что на данный момент являются единственным потенциальным решением, сами по себе не будут достаточными для достижения искомых агентских возможностей таким образом, чтобы люди рассматривали их использование для серьёзных проектов.
Show all...
👍 8👏 2 1
Про цели OpenAI и GAI: Для реального прорыва в области ИИ модели должны иметь возможность быть агентами. Для достижения человеческого уровня необходимо понимание социально-экономических структур мира и применения этих знаний в неопределённых ситуациях с множеством вариантных деталей. Такая прикладная способность к обобщению выходит за рамки того, что можно описать в любом тексте. Нужно понимание негласных знаний (ноу-хау), которому можно научиться только на практике и непосредственно у тех, кто уже знает, как это делается. Ни один ИИ не может быть полезным агентом и достигать целей в мире без способности приобретать ноу-хау/тактильные знания, каким бы великим он ни был в чистом рассуждении. Чтобы приобрести ноу-хау, люди “делают вещи” - живут и получают опыт. Поэтому ИИ должен стать полноценным “агентом” - должен иметь возможность планировать и выполнять действия и использовать это для обучения. Но надо отметить, что основные исследователи в OpenAI продолжают верить в то, что TPA сможет обладать эмерджентными свойствами для дедукции “негласных знаний” из текста. Когда выйдет модель: ⁃ С учетом всех слухов и намеков автор предполагает очень 24 года (октябрь-ноябрь). ⁃ При этом автор считает, что сама модель уже готова, и обучение было завершено в ноябре прошлого года, и сейчас идет “упаковка, тюнинг и написание обвязки”. https://www.thealgorithmicbridge.com/p/gpt-5-everything-you-need-to-know
Show all...
GPT-5: Everything You Need to Know

An in-depth analysis of the most anticipated next-generation AI model

👍 5 1
В копилку: This repository contains everything you need to become proficient in Data Engineering https://github.com/Coder-World04/Complete-Data-Engineering
Show all...
GitHub - Coder-World04/Complete-Data-Engineering: This repository contains everything you need to become proficient in Data Engineering

This repository contains everything you need to become proficient in Data Engineering - Coder-World04/Complete-Data-Engineering

👍 5