Data Analysis / Big Data

رفتن به کانال در Telegram

Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels

نمایش بیشتر

شبکه:Типичный программист روسيا177 057 فناوری و برنامه‌ها26 806

2 751

مشترکین

-224 ساعت

+37 روز

+1830 روز

662

نمایش های پست

اطلاعاتی وجود ندارد24 ساعت

اطلاعاتی وجود ندارد48 ساعت

24.06%

نرخ مشارکت

اطلاعاتی وجود ندارد

پست های در روز

Ads index

beta

آرشیو پست ها

2 751

Можно ли оценить эффективность цифровой трансформации или это просто дань моде? Цифровая трансформация давно перестала быть громким лозунгом — сегодня это рабочий инструмент, от которого зависит выживание и рост компании. В «Росгосстрахе» я отвечаю за управление отчетностью, и наша задача — не просто автоматизировать процессы, а перестроить архитектуру принятия решений. В этом тексте — о том, как мы измеряем цифровую зрелость, зачем это делать и как использовать метрику как компас в непростом ландшафте изменений. Материал будет полезен тем, кто работает с данными, внедряет новые технологии, управляет трансформацией или просто ищет устойчивые опоры в эпоху цифрового сдвига. Цифровая трансформация — это не про тренды, а про выживаемость. Но прежде чем менять процессы, важно понять: где мы находимся сейчас и куда действительно стоит двигаться. В этом смысле цифровая зрелость — не модное словосочетание, а инструмент навигации. Я расскажу о нашем подходе: какие шаги мы предпринимаем, какие метрики считаем значимыми и как используем их не ради отчётов, а ради движения вперёд. По сути, мы решаем одну из самых сложных задач — пытаемся измерить сам процесс перехода, его глубину и устойчивость. Это непросто: цифры упрямы, а перемены часто текут не по линейной шкале. Но без этих измерений всё превращается в хаотичную трату ресурсов. Чтобы что-то улучшить, нужно сначала научиться видеть — не просто глазами, а данными. Что такое цифровая зрелость и зачем её измерять? Цифровая зрелость — это не абстрактный рейтинг, а срез состояния компании в моменте: насколько глубоко технологии проникают в процессы, насколько органично они встроены в стратегию, управленческие практики и ежедневные решения. Это не про количество IT-систем, а про то, как устроена ткань бизнеса — от культуры до архитектуры данных. Читать: https://habr.com/ru/companies/rgs_it/articles/910094/ #ru @big_data_analysis | Другие наши каналы

2 751

Как создать план тестирования производительности в Apache JMeter для Oracle Analytics Cloud. В статье подробно раскрываются ключевые шаги и рекомендации для эффективного проведения нагрузочного тестирования в облачной аналитике. Полезно для специалистов по тестированию и разработке. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Oracle Fusion Analytics — готовые решения для аналитики в облаке Oracle Fusion Analytics предлагает набор предустановленных облачных приложений для анализа данных из Oracle Fusion Cloud. Это позволяет быстро получать полезные инсайты и улучшать принятие решений, а также настраивать аналитику под нужды компании. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Инициатива Oracle для развития сообщества Fusion Data Intelligence Oracle Analytics Service Excellence команда запускает проект по созданию и распространению повторно используемых ресурсов, чтобы вдохновлять и поддерживать сообщество Fusion Data Intelligence. Подробнее о поддержке совместного развития данных. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Откройте возможности Oracle Analytics Public: как платформа помогает анализировать данные и принимать взвешенные решения. Узнайте, почему этот инструмент становится незаменимым для бизнеса, стремящегося к эффективности и инновациям. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Как объединить внешние семантические модели в Oracle Fusion Data Intelligence В статье подробно рассказано, как интегрировать сторонние семантические модели в Oracle Fusion Data Intelligence: подготовка, использование BI Administration Tool, публикация и переход в продакшен. Полезно для команд, сохраняющих аналитические наработки. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Как зарегистрировать и использовать предобученные модели OCI Vision Video в OAC Статья подробно разбирает процесс регистрации и вызова предобученных моделей OCI Vision Video в Oracle Analytics Cloud. Это поможет ускорить внедрение видеоаналитики и повысить эффективность обработки данных. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Как включить CORS для изображений и видео в Oracle Analytics В статье подробно рассказывается, как настроить поддержку CORS для медиафайлов в визуализациях Oracle Analytics, чтобы обеспечить корректное отображение и избежать проблем с безопасностью при загрузке контента. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Как превратить видеоанализ трафика в информативную панель Статья рассказывает, как преобразовать данные из OCI Vision Video Analysis в удобную дашборд-систему. Это помогает легко визуализировать важные паттерны и тренды, полученные при анализе дорожного видео. Читать подробнее #en @big_data_analysis | Другие наши каналы

2 751

Внедрение программного обеспечения Экстрактор 1С в компании Level Group: результаты и перспективы Компания обратилась к нам для решения задачи по сокращению времени получения данных и оптимизации работы команды разработки 1С. Level Group – один из ведущих застройщиков бизнес-класса в Москве. За три года компания утроила свои масштабы, достигнув оборота в 100 миллиардов рублей в 2024 году. Отличительные черты Level Group – это современные и стильные жилые комплексы, продуманные планировки квартир и оригинальные дизайнерские решения. Читать: https://habr.com/ru/articles/910256/ #ru @big_data_analysis | Другие наши каналы

2 751

Хотели бы, чтобы работодателю было важнее как вы работаете, а не откуда? В Точке у сотрудников есть полная свобода выбора: можно работать в уютных офисах в России, из дома или вообще из любой точки мира. Главное — результат, а не локация. Точка — это финтех-компания, где делают настоящие диджитал-продукты для бизнеса. Здесь создают более 60 сервисов, например, онлайн-бухгалтерию, решения для ВЭД и помощь с выходом на маркетплейсы. Всё, что нужно предпринимателям, чтобы строить и развивать свой бизнес — в одном месте. Над этими продуктами работают 1300 IT-специалистов: разработчики, продакты, тестировщики, дизайнеры, аналитики, дата-сайентисты и девопсы. Это профессиональная среда для тех, кто хочет развиваться и видеть реальный результат своей работы. Если хотите быть частью команды, где ценят профессионализм, доверяют людям и дают свободу — загляните к нам. Вдруг это именно то место, которое вы искали. Ссылка на вакансии Это #партнёрский пост

2 751

Скрытая стоимость BI: что не учитывают 8 из 10 компаний при внедрении аналитических систем Почему, по данным экспертов GlowByte, целых 80% проектов внедрения систем бизнес-аналитики выходят за рамки изначально запланированного бюджета? Ответ парадоксально прост и сложен одновременно: компании систематически недооценивают реальную совокупную стоимость владения BI-системами. Наши наблюдения показывают, что большинство заказчиков концентрируются исключительно на очевидных статьях расходов, игнорируя множество "скрытых" факторов, которые неизбежно проявляются по мере развития проекта. За годы работы с десятками проектов внедрения аналитических систем мы в GlowByte выявили закономерность — даже опытные ИТ-директора порой не учитывают до 40% реальных затрат при планировании бюджета на BI-инициативы. В этой статье я поделюсь инсайтами о наиболее типичных "финансовых ловушках", которые подстерегают компании на этом пути. Читать: https://habr.com/ru/companies/glowbyte/articles/909656/ #ru @big_data_analysis | Другие наши каналы

2 751

Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах: рассказываем, как с помощью ручного и автоматического репартицирования ускорить обработку данных, как правильно настраивать оконные функции и запускать множество небольших Spark-приложений внутри одного процесса для экономии ресурсов. Привет, Хабр! Меня зовут Александр Маркачев и я — Data Engineer команды Голосовой Антифрод в билайн. Расскажу, как борьба с мошенниками может обернуться личным вызовом. Все техники сопровождаются объяснениями, примерами и рекомендациями для самостоятельного повторения. Читать: https://habr.com/ru/companies/beeline_tech/articles/909506/ #ru @big_data_analysis | Другие наши каналы

2 751

Управление отставанием lag в Kafka Consumers: как не просто замерить, а стабилизировать Привет, Хабр! Сегодня рассмотрим, почему отставание у Kafka-консьюмеров — это не просто строчка в kafka-consumer-groups, а метрика, от которой зависит SLA вашего сервиса. Рассмотрим, как её считать без самообмана, как соорудить собственный мониторинг на Python и Go, а главное — чем именно тушить всплески lag’а: throttle, autoscale и backpressure. Читать: https://habr.com/ru/companies/otus/articles/905804/ #ru @big_data_analysis | Другие наши каналы

2 751

Путь в AI: от студента до инженера, исследователя или разработчика Привет, Хабр! Меня зовут Анна Щеникова. Я работаю AI-инженером в Центре RnD МТС Web Services и параллельно лидирую магистерскую программу «Исследования и предпринимательство в искусственном интеллекте» ВШЭ. В МТС занимаюсь всем, что связано с моделями: вместе с коллегами тестирую гипотезы про агентов и мультимодельные подходы. Переход от студенческой жизни к профессиональной деятельности — важный и сложный этап. Это первые серьезные шаги в карьере, первое понимание, как применить полученные знания в реальном бизнесе. Я прошла этот путь несколько раз: сначала сама, а потом помогая магистрантам в ВШЭ. Так я увидела, какие ключевые точки нужно проработать, чтобы комфортно и весело перейти от теории к реальным бизнес-задачам. В этом посте расскажу о своем опыте перехода к полноценной работе и поделюсь видением того, что будет актуальным в сфере AI в ближайшем будущем. Надеюсь, это поможет кому-нибудь правильно спланировать карьеру. Читать: https://habr.com/ru/companies/ru_mts/articles/909316/ #ru @big_data_analysis | Другие наши каналы

2 751

LLM-судья: как LLM отсекает правду от лжи? LLM-as-a-judge — распространённая техника оценки продуктов на основе LLM. Популярность этой техники обусловлена практичностью: она представляет собой удобную альтернативу дорогостоящей человеческой оценке при анализе открытых текстовых ответов. Оценивать сгенерированные тексты сложно, будь то «простой» саммари или диалог с чат-ботом. Метрики типа accuracy плохо работают, поскольку «правильный» ответ может быть сформулирован множеством способов, не обязательно совпадающих с образцом. Кроме того, стиль или тон — субъективные характеристики, которые сложно формализовать. Люди способны учитывать такие нюансы, но ручная проверка каждого ответа плохо масштабируется. В качестве альтернативы появилась техника LLM-as-a-judge: для оценки сгенерированных текстов используются сами LLM. Интересно, что LLM одновременно являются и источником проблемы, и её решением! Читать: https://habr.com/ru/articles/905728/ #ru @big_data_analysis | Другие наши каналы

2 751

Как научить ИИ обслуживать клиентов не хуже человека? Новость о мощи ChatGPT прогремела уже более двух лет назад, однако крупные компании ещё до сих пор полностью не автоматизировали поддержку клиентов. В этой статье разберём на пальцах, какие данные и надстройки нужны для больших языковых моделей, как сделать так, чтобы внедрение было экономически целесообразным и, наконец, что делать с чат-ботами прошлого поколения. Читать: https://habr.com/ru/companies/alfa/articles/904028/ #ru @big_data_analysis | Другие наши каналы

2 751

Федеративное обучение: потенциал, ограничения и экономические реалии внедрения Федеративное обучение (Federated Learning, FL) становится всё более заметным элементом технологической повестки в условиях ужесточающихся требований к конфиденциальности данных и законодательных ограничений на их передачу. На прошлой неделе при поддержке канала @noml_community мы поговорили с коллегами (Дмитрий Маслов, Михаил Фатюхин, Денис Афанасьев, Евгений Попов, Роман Постников, Павел Снурницын) о Federated Learning. Получилось неожиданно интересно и полезно. Много говорили о кейсах, чуть меньше - о практических аспектах реализации, особенностях работы с данными и о специфике конфиденциальных вычислений. С большим удовольствием пообщались с коллегами по цеху и основными экспертами этой отрасли. https://www.youtube.com/watch?v=JpApLfde38I&list=WL&index=1&t=12s Мой вывод - FL как технология и как предмет сделали большой шаг вперед к тому, что бы технологии и потребности рынка “пересеклись” в точки эффективности и кажется что такой момент уже близко. Читать: https://habr.com/ru/articles/909014/ #ru @big_data_analysis | Другие наши каналы

2 751

Пакетная репликация данных в аналитическом ландшафте ХД Наполнение данными хранилища или озера, как правило, является первым большим шагом к доступности аналитической среды для основного функционала и работы конечных пользователей. От эффективной реализации этой задачи зависят стоимость и длительность всего проекта по созданию хранилища данных и сроки предоставления отдельных data-сервисов. В этой публикации я поделюсь опытом реализации пакетной загрузки больших данных в аналитические хранилища и расскажу, когда следует выбрать именно пакетную загрузку, а когда – онлайн-подход. Отдельно раскрою, как многолетний опыт решения подобных задач был воплощен в промышленном инструменте репликации данных. Читать: https://habr.com/ru/companies/datasapience/articles/908882/ #ru @big_data_analysis | Другие наши каналы

2 751

Ну ты это, заходи если чё: как сделать единую систему авторизации в корпоративных ботах Привет, Хабр! На связи команда данных «МосТрансПроекта». Недавно мы рассказывали про бот «Информатум», в котором хранятся служебные презентации. При разработке системы мы уделили особое внимание защите чувствительной информации. Поэтому доступ к материалам предоставляется сотрудникам только после авторизации и подтверждения их данных. Но что, если появится еще несколько ботов? Неужели сотрудникам придется каждый раз проходить проверку для доступа к новым сервисам, а администраторам тратить время на верификацию? Для решения этой задачи мы разработали универсальное и экономящее время решение, о котором расскажем в данной статье. Читать: https://habr.com/ru/companies/mostransproekt/articles/907334/ #ru @big_data_analysis | Другие наши каналы