Data Analysis / Big Data
رفتن به کانال در Telegram
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels
نمایش بیشتر2 751
مشترکین
-224 ساعت
+37 روز
+1830 روز
آرشیو پست ها
Можно ли оценить эффективность цифровой трансформации или это просто дань моде?
Цифровая трансформация давно перестала быть громким лозунгом — сегодня это рабочий инструмент, от которого зависит выживание и рост компании. В «Росгосстрахе» я отвечаю за управление отчетностью, и наша задача — не просто автоматизировать процессы, а перестроить архитектуру принятия решений. В этом тексте — о том, как мы измеряем цифровую зрелость, зачем это делать и как использовать метрику как компас в непростом ландшафте изменений. Материал будет полезен тем, кто работает с данными, внедряет новые технологии, управляет трансформацией или просто ищет устойчивые опоры в эпоху цифрового сдвига.
Цифровая трансформация — это не про тренды, а про выживаемость. Но прежде чем менять процессы, важно понять: где мы находимся сейчас и куда действительно стоит двигаться. В этом смысле цифровая зрелость — не модное словосочетание, а инструмент навигации. Я расскажу о нашем подходе: какие шаги мы предпринимаем, какие метрики считаем значимыми и как используем их не ради отчётов, а ради движения вперёд.
По сути, мы решаем одну из самых сложных задач — пытаемся измерить сам процесс перехода, его глубину и устойчивость. Это непросто: цифры упрямы, а перемены часто текут не по линейной шкале. Но без этих измерений всё превращается в хаотичную трату ресурсов. Чтобы что-то улучшить, нужно сначала научиться видеть — не просто глазами, а данными.
Что такое цифровая зрелость и зачем её измерять?
Цифровая зрелость — это не абстрактный рейтинг, а срез состояния компании в моменте: насколько глубоко технологии проникают в процессы, насколько органично они встроены в стратегию, управленческие практики и ежедневные решения. Это не про количество IT-систем, а про то, как устроена ткань бизнеса — от культуры до архитектуры данных.
Читать: https://habr.com/ru/companies/rgs_it/articles/910094/
#ru
@big_data_analysis | Другие наши каналы
Как создать план тестирования производительности в Apache JMeter для Oracle Analytics Cloud. В статье подробно раскрываются ключевые шаги и рекомендации для эффективного проведения нагрузочного тестирования в облачной аналитике. Полезно для специалистов по тестированию и разработке.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Oracle Fusion Analytics — готовые решения для аналитики в облаке
Oracle Fusion Analytics предлагает набор предустановленных облачных приложений для анализа данных из Oracle Fusion Cloud. Это позволяет быстро получать полезные инсайты и улучшать принятие решений, а также настраивать аналитику под нужды компании.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Инициатива Oracle для развития сообщества Fusion Data Intelligence
Oracle Analytics Service Excellence команда запускает проект по созданию и распространению повторно используемых ресурсов, чтобы вдохновлять и поддерживать сообщество Fusion Data Intelligence. Подробнее о поддержке совместного развития данных.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Откройте возможности Oracle Analytics Public: как платформа помогает анализировать данные и принимать взвешенные решения. Узнайте, почему этот инструмент становится незаменимым для бизнеса, стремящегося к эффективности и инновациям.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Как объединить внешние семантические модели в Oracle Fusion Data Intelligence
В статье подробно рассказано, как интегрировать сторонние семантические модели в Oracle Fusion Data Intelligence: подготовка, использование BI Administration Tool, публикация и переход в продакшен. Полезно для команд, сохраняющих аналитические наработки.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Как зарегистрировать и использовать предобученные модели OCI Vision Video в OAC
Статья подробно разбирает процесс регистрации и вызова предобученных моделей OCI Vision Video в Oracle Analytics Cloud. Это поможет ускорить внедрение видеоаналитики и повысить эффективность обработки данных.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Как включить CORS для изображений и видео в Oracle Analytics
В статье подробно рассказывается, как настроить поддержку CORS для медиафайлов в визуализациях Oracle Analytics, чтобы обеспечить корректное отображение и избежать проблем с безопасностью при загрузке контента.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Как превратить видеоанализ трафика в информативную панель
Статья рассказывает, как преобразовать данные из OCI Vision Video Analysis в удобную дашборд-систему. Это помогает легко визуализировать важные паттерны и тренды, полученные при анализе дорожного видео.
Читать подробнее
#en
@big_data_analysis | Другие наши каналы
Внедрение программного обеспечения Экстрактор 1С в компании Level Group: результаты и перспективы
Компания обратилась к нам для решения задачи по сокращению времени получения данных и оптимизации работы команды разработки 1С.
Level Group – один из ведущих застройщиков бизнес-класса в Москве.
За три года компания утроила свои масштабы, достигнув оборота в 100 миллиардов рублей в 2024 году.
Отличительные черты Level Group – это современные и стильные жилые комплексы, продуманные планировки квартир и оригинальные дизайнерские решения.
Читать: https://habr.com/ru/articles/910256/
#ru
@big_data_analysis | Другие наши каналы
Хотели бы, чтобы работодателю было важнее как вы работаете, а не откуда?
В Точке у сотрудников есть полная свобода выбора: можно работать в уютных офисах в России, из дома или вообще из любой точки мира. Главное — результат, а не локация.
Точка — это финтех-компания, где делают настоящие диджитал-продукты для бизнеса. Здесь создают более 60 сервисов, например, онлайн-бухгалтерию, решения для ВЭД и помощь с выходом на маркетплейсы. Всё, что нужно предпринимателям, чтобы строить и развивать свой бизнес — в одном месте.
Над этими продуктами работают 1300 IT-специалистов: разработчики, продакты, тестировщики, дизайнеры, аналитики, дата-сайентисты и девопсы. Это профессиональная среда для тех, кто хочет развиваться и видеть реальный результат своей работы.
Если хотите быть частью команды, где ценят профессионализм, доверяют людям и дают свободу — загляните к нам. Вдруг это именно то место, которое вы искали.
Ссылка на вакансии
Это #партнёрский пост
Скрытая стоимость BI: что не учитывают 8 из 10 компаний при внедрении аналитических систем
Почему, по данным экспертов GlowByte, целых 80% проектов внедрения систем бизнес-аналитики выходят за рамки изначально запланированного бюджета? Ответ парадоксально прост и сложен одновременно: компании систематически недооценивают реальную совокупную стоимость владения BI-системами. Наши наблюдения показывают, что большинство заказчиков концентрируются исключительно на очевидных статьях расходов, игнорируя множество "скрытых" факторов, которые неизбежно проявляются по мере развития проекта.
За годы работы с десятками проектов внедрения аналитических систем мы в GlowByte выявили закономерность — даже опытные ИТ-директора порой не учитывают до 40% реальных затрат при планировании бюджета на BI-инициативы. В этой статье я поделюсь инсайтами о наиболее типичных "финансовых ловушках", которые подстерегают компании на этом пути.
Читать: https://habr.com/ru/companies/glowbyte/articles/909656/
#ru
@big_data_analysis | Другие наши каналы
Оптимизация Spark-приложений: шаг за шагом от базовых техник до продвинутых приёмов
В этой статье мы делимся опытом оптимизации Spark-кода на реальных задачах: рассказываем, как с помощью ручного и автоматического репартицирования ускорить обработку данных, как правильно настраивать оконные функции и запускать множество небольших Spark-приложений внутри одного процесса для экономии ресурсов.
Привет, Хабр! Меня зовут Александр Маркачев и я — Data Engineer команды Голосовой Антифрод в билайн. Расскажу, как борьба с мошенниками может обернуться личным вызовом.
Все техники сопровождаются объяснениями, примерами и рекомендациями для самостоятельного повторения.
Читать: https://habr.com/ru/companies/beeline_tech/articles/909506/
#ru
@big_data_analysis | Другие наши каналы
Управление отставанием lag в Kafka Consumers: как не просто замерить, а стабилизировать
Привет, Хабр!
Сегодня рассмотрим, почему отставание у Kafka-консьюмеров — это не просто строчка в
kafka-consumer-groups, а метрика, от которой зависит SLA вашего сервиса. Рассмотрим, как её считать без самообмана, как соорудить собственный мониторинг на Python и Go, а главное — чем именно тушить всплески lag’а: throttle, autoscale и backpressure.
Читать: https://habr.com/ru/companies/otus/articles/905804/
#ru
@big_data_analysis | Другие наши каналыПуть в AI: от студента до инженера, исследователя или разработчика
Привет, Хабр! Меня зовут Анна Щеникова. Я работаю AI-инженером в Центре RnD МТС Web Services и параллельно лидирую магистерскую программу «Исследования и предпринимательство в искусственном интеллекте» ВШЭ. В МТС занимаюсь всем, что связано с моделями: вместе с коллегами тестирую гипотезы про агентов и мультимодельные подходы.
Переход от студенческой жизни к профессиональной деятельности — важный и сложный этап. Это первые серьезные шаги в карьере, первое понимание, как применить полученные знания в реальном бизнесе.
Я прошла этот путь несколько раз: сначала сама, а потом помогая магистрантам в ВШЭ. Так я увидела, какие ключевые точки нужно проработать, чтобы комфортно и весело перейти от теории к реальным бизнес-задачам. В этом посте расскажу о своем опыте перехода к полноценной работе и поделюсь видением того, что будет актуальным в сфере AI в ближайшем будущем. Надеюсь, это поможет кому-нибудь правильно спланировать карьеру.
Читать: https://habr.com/ru/companies/ru_mts/articles/909316/
#ru
@big_data_analysis | Другие наши каналы
LLM-судья: как LLM отсекает правду от лжи?
LLM-as-a-judge — распространённая техника оценки продуктов на основе LLM.
Популярность этой техники обусловлена практичностью: она представляет собой удобную альтернативу дорогостоящей человеческой оценке при анализе открытых текстовых ответов.
Оценивать сгенерированные тексты сложно, будь то «простой» саммари или диалог с чат-ботом. Метрики типа accuracy плохо работают, поскольку «правильный» ответ может быть сформулирован множеством способов, не обязательно совпадающих с образцом. Кроме того, стиль или тон — субъективные характеристики, которые сложно формализовать.
Люди способны учитывать такие нюансы, но ручная проверка каждого ответа плохо масштабируется. В качестве альтернативы появилась техника LLM-as-a-judge: для оценки сгенерированных текстов используются сами LLM. Интересно, что LLM одновременно являются и источником проблемы, и её решением!
Читать: https://habr.com/ru/articles/905728/
#ru
@big_data_analysis | Другие наши каналы
Как научить ИИ обслуживать клиентов не хуже человека?
Новость о мощи ChatGPT прогремела уже более двух лет назад, однако крупные компании ещё до сих пор полностью не автоматизировали поддержку клиентов. В этой статье разберём на пальцах, какие данные и надстройки нужны для больших языковых моделей, как сделать так, чтобы внедрение было экономически целесообразным и, наконец, что делать с чат-ботами прошлого поколения.
Читать: https://habr.com/ru/companies/alfa/articles/904028/
#ru
@big_data_analysis | Другие наши каналы
Федеративное обучение: потенциал, ограничения и экономические реалии внедрения
Федеративное обучение (Federated Learning, FL) становится всё более заметным элементом технологической повестки в условиях ужесточающихся требований к конфиденциальности данных и законодательных ограничений на их передачу. На прошлой неделе при поддержке канала @noml_community мы поговорили с коллегами (Дмитрий Маслов, Михаил Фатюхин, Денис Афанасьев, Евгений Попов, Роман Постников, Павел Снурницын) о Federated Learning. Получилось неожиданно интересно и полезно. Много говорили о кейсах, чуть меньше - о практических аспектах реализации, особенностях работы с данными и о специфике конфиденциальных вычислений. С большим удовольствием пообщались с коллегами по цеху и основными экспертами этой отрасли.
https://www.youtube.com/watch?v=JpApLfde38I&list=WL&index=1&t=12s
Мой вывод - FL как технология и как предмет сделали большой шаг вперед к тому, что бы технологии и потребности рынка “пересеклись” в точки эффективности и кажется что такой момент уже близко.
Читать: https://habr.com/ru/articles/909014/
#ru
@big_data_analysis | Другие наши каналы
Пакетная репликация данных в аналитическом ландшафте ХД
Наполнение данными хранилища или озера, как правило, является первым большим шагом к доступности аналитической среды для основного функционала и работы конечных пользователей. От эффективной реализации этой задачи зависят стоимость и длительность всего проекта по созданию хранилища данных и сроки предоставления отдельных data-сервисов.
В этой публикации я поделюсь опытом реализации пакетной загрузки больших данных в аналитические хранилища и расскажу, когда следует выбрать именно пакетную загрузку, а когда – онлайн-подход. Отдельно раскрою, как многолетний опыт решения подобных задач был воплощен в промышленном инструменте репликации данных.
Читать: https://habr.com/ru/companies/datasapience/articles/908882/
#ru
@big_data_analysis | Другие наши каналы
Ну ты это, заходи если чё: как сделать единую систему авторизации в корпоративных ботах
Привет, Хабр! На связи команда данных «МосТрансПроекта». Недавно мы рассказывали про бот «Информатум», в котором хранятся служебные презентации. При разработке системы мы уделили особое внимание защите чувствительной информации. Поэтому доступ к материалам предоставляется сотрудникам только после авторизации и подтверждения их данных. Но что, если появится еще несколько ботов? Неужели сотрудникам придется каждый раз проходить проверку для доступа к новым сервисам, а администраторам тратить время на верификацию? Для решения этой задачи мы разработали универсальное и экономящее время решение, о котором расскажем в данной статье.
Читать: https://habr.com/ru/companies/mostransproekt/articles/907334/
#ru
@big_data_analysis | Другие наши каналы
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
