Data Analysis / Big Data
رفتن به کانال در Telegram
Лучшие посты по анализу данных и работе с Big Data на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels
نمایش بیشتر2 751
مشترکین
-224 ساعت
+67 روز
+1830 روز
آرشیو پست ها
Сколько зарабатывает айтишник и как на это живёт: сравниваем 5 стран
Cобрали опыт зарплат айтишников из пяти стран и узнали, как вписаться в местную культуру и где комфортнее жить.
Читать: «Сколько зарабатывает айтишник и как на это живёт: сравниваем 5 стран»
#ru
@big_data_analysis | Другие наши каналы
Как создать чат-бота с LLM?
История о том как я потратил 5 лет на изучении llm ботов и в итоге написал своего за пол года. Пути реализации и ошибки.
Читать: https://habr.com/ru/articles/988358/
#ru
@big_data_analysis | Другие наши каналы
Сравниваем форматы сериализации на Go: скорость и удобство
Дмитрий Королёв, бэкенд-разработчик в Авито, разобрал на примерах, чем отличаются друг от друга форматы сериализации данных и как выбрать самый удобный.
Читать: «Сравниваем форматы сериализации на Go: скорость и удобство»
#ru
@big_data_analysis | Другие наши каналы
Geeks do it better: как прошла конференция GoCloud 2025 от Cloud.ru
Недавно мы побывали на большой конференции по облакам и искусственному интеллекту GoCloud, которую ежегодно проводит Cloud.ru. Делимся итогами конференции и рассказываем, как компании удается создавать топовые облачные сервисы и драйвить коммьюнити.
Читать: «Geeks do it better: как прошла конференция GoCloud 2025 от Cloud.ru»
#ru
@big_data_analysis | Другие наши каналы
10 телеграм-каналов, которые реально читают сеньоры
Собрали топ-10 каналов для опытных разработчиков, с которыми у вас точно будет что обсудить на дейлике.
Читать: «10 телеграм-каналов, которые реально читают сеньоры»
#ru
@big_data_analysis | Другие наши каналы
Open Table Formats — Iceberg vs Paimon — практика использования
Привет, Хабр. Меня зовут Василий Мельник, я product owner решения для потоковой обработки данных Data Ocean SDI в компании Data Sapience. Наша команда приобрела большой практический опыт работы с Apache Iceberg в задачах на стыке традиционной пакетной обработки и near real-time и конкретно с использованием технологий на базе Flink, поэтому мы не могли пройти мимо нового открытого табличного формата (OTF) Paimon от разработчиков Apache Flink. В этой статье я опишу наш опыт и те практические выводы, которые мы сделали на промышленных средах, в виде репрезентативного тестирования, на котором проиллюстрирую ключевые практические сценарии.
Читать: https://habr.com/ru/companies/datasapience/articles/988308/
#ru
@big_data_analysis | Другие наши каналы
Генерация данных с помощью Python: зачем это нужно и как применять
Генерация данных с помощью Python. Зачем это нужно и как применять. Рассматриваем основные библиотеки и примеры ✔ Tproger
Читать: «Генерация данных с помощью Python: зачем это нужно и как применять»
#ru
@big_data_analysis | Другие наши каналы
Язык Julia: что это и почему он популярен в научных вычислениях
Что такое язык Julia. Показываем сравнение языка Джулия с другими. Рассматриваем преимущества и основные нюансы ✔ Tproger
Читать: «Язык Julia: что это и почему он популярен в научных вычислениях»
#ru
@big_data_analysis | Другие наши каналы
Автоматизированные системы мониторинга моделей машинного обучения с помощью нашего open source фреймворка
Любая модель машинного обучения начинается с данных. Известное выражение «garbage in, garbage out» как нельзя лучше описывает главную уязвимость ML‑систем. В автоматизированном машинном обучении (AutoML) наиболее критичными точками являются процесс сборки данных и проблема мониторинга данных, в т.ч. в онлайне. Если процессы feature engineering и обучения наша библиотека формализует «из коробки» с помощью конфигурационных файлов и единых правил, то ответственность за загрузку и получение данных несет пользователь.
Читать: https://habr.com/ru/companies/vsk_insurance/articles/988282/
#ru
@big_data_analysis | Другие наши каналы
Мультистек: как жить, когда ты и Фронт, и Бэк, и МЛ
Разбираем плюсы и минусы пути мультистек-инженера: когда это работает, где востребовано, и как развиваться, если не хочешь выбирать одно направление.
Читать: «Мультистек: как жить, когда ты и Фронт, и Бэк, и МЛ»
#ru
@big_data_analysis | Другие наши каналы
Python и SQL: что изучать в первую очередь для анализа данных
Python и SQL — самые популярные инструменты для работы с данными. Но какой из них изучать первым? Разбираемся в статье.
Читать: «Python и SQL: что изучать в первую очередь для анализа данных»
#ru
@big_data_analysis | Другие наши каналы
Сравниваем Pandas, Polars и PySpark: что выбрать аналитику?
Pandas, Polars или PySpark — что выбрать для работы с данными? Вместе с Никитой Егоровым, ведущим аналитиком в МТС Диджитал, разбираем отличия, плюсы и минусы каждого инструмента.
Читать: «Сравниваем Pandas, Polars и PySpark: что выбрать аналитику?»
#ru
@big_data_analysis | Другие наши каналы
С помощью чего выучить SQL в 2025 году?
Как выучить SQL с нуля в 2025? Сравниваем 6 платформ: SYNC STUDY, SQL Academy, Karpov Courses и другие. Бесплатные и платные курсы, задачи из реальной аналитики, поддержка PostgreSQL. Советы по выбору для новичков и профессионалов.
Читать: «С помощью чего выучить SQL в 2025 году?»
#ru
@big_data_analysis | Другие наши каналы
Курсы по Big Data, включая онлайн-обучение для аналитиков больших данных
Самые лучшие курсы по Big Data. В предложенной подборке актуальные варианты обучения от проверенных школ, а так же рейтинги и цены на курсы для аналитиков Big Data
Читать: «Курсы по Big Data, включая онлайн-обучение для аналитиков больших данных»
#ru
@big_data_analysis | Другие наши каналы
Рекомендательные системы и реализация Content-based системы
Введение в рекомендательные системы: идеи, типы, метрики, преимущества и недостатки. Реализация content based системы для аниме
Читать: «Рекомендательные системы и реализация Content-based системы»
#ru
@big_data_analysis | Другие наши каналы
Язык Julia: что это и почему он популярен в научных вычислениях
Что такое язык Julia. Показываем сравнение языка Джулия с другими. Рассматриваем преимущества и основные нюансы ✔ Tproger
Читать: «Язык Julia: что это и почему он популярен в научных вычислениях»
#ru
@big_data_analysis | Другие наши каналы
Анатомия данных: как устроено управление информацией
Объем информации растет, но без системного подхода данные превращаются в шум. Разбираемся, как в компаниях структурируют, анализируют и защищают данные, чтобы они работали на бизнес, а не создавали хаос.
Читать: «Анатомия данных: как устроено управление информацией»
#ru
@big_data_analysis | Другие наши каналы
Как мы нашли утекающую маржу в сети кофеен на 240 000 чеков/мес: путь от Excel к ежедневной управляемости
В сети 26 кофеен на 240k чеков в месяц всё выглядело достаточно хорошо (поток гостей, выручка растёт, но прибыль не соответствует ожиданиям). Рассказываю, как мы собрали ежедневную BI аналитику для управления сетью: от R-Keeper и ETL до витрин в ClickHouse и дашбордов в Yandex DataLens. По дороге упёрлись в типичную проблему: справочники, из-за которых отчёты неточны.
Читать: https://habr.com/ru/articles/988222/
#ru
@big_data_analysis | Другие наши каналы
Что значит быть инженером в новых реалиях? И какой смысл мы вкладываем в эти слова — расскажем на GPB CONF!
22 апреля пройдет конференция Газпромбанк.Тех для разработчиков и инженеров.
Читать: «Что значит быть инженером в новых реалиях? И какой смысл мы вкладываем в эти слова — расскажем на GPB CONF!»
#ru
@big_data_analysis | Другие наши каналы
Python vs C++: какой язык быстрее найдет все простые числа до миллиарда
Рассказываем, какие есть алгоритмы для поиска простых чисел и реализуем наиболее популярный и простой на Python и C++.
Читать: «Python vs C++: какой язык быстрее найдет все простые числа до миллиарда»
#ru
@big_data_analysis | Другие наши каналы
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
