cookie

Sizning foydalanuvchi tajribangizni yaxshilash uchun cookie-lardan foydalanamiz. Barchasini qabul qiling», bosing, cookie-lardan foydalanilishiga rozilik bildirishingiz talab qilinadi.

avatar

Труба данных

Авторский канал обо всем, что происходит в мире работы с данными: хранение, обработка, визуализация, как мы принимаем решения и как мы становимся профессионалами в работе с данными. Про рекламу - shorturl.at/dgoR6 Автора канала - @SimonOsipov

Ko'proq ko'rsatish
Reklama postlari
3 270
Obunachilar
Ma'lumot yo'q24 soatlar
+227 kunlar
+5430 kunlar

Ma'lumot yuklanmoqda...

Obunachilar o'sish tezligi

Ma'lumot yuklanmoqda...

Photo unavailableShow in Telegram
Журнал "Зарплатник" @zarplatnik_media Вот это название, конечно 😄 Ко мне пришел Тагир с канала @tagir_analyzes, попросил рассказать про его канал "Зарплатник" @zarplatnik_media И раз уж у меня канал на русскоговорящую аудиторию, знания про рынок РФ (условия работы, зарплаты и так далее) - штука актуальная. В канале описываются анонимно позиции в компаниях, бенефиты, условия работы и так далее. Какое-то представление о текущем рынке можно составить. НО помните, что любая смена работы - штука индивидуальная и ваша компенсация может сильно отличаться (в обе стороны). @ohmydataengineer
Hammasini ko'rsatish...
15👍 6💩 6👎 2🔥 2
Photo unavailableShow in Telegram
Сколько их уже было: Pandas, Dask, Ray, Polars. Вот еще прибыло - Daft https://www.getdaft.io/ @ohmydataengineer
Hammasini ko'rsatish...
🥱 16👍 6💩 4🔥 2
https://medium.com/walmartglobaltech/reliably-processing-trillions-of-kafka-messages-per-day-23494f553ef9 Неплохая статья из инженерного блога Wallmart о том, как они процессят over9000 сообщений в Kafka. @ohmydataengineer
Hammasini ko'rsatish...
Reliably Processing Trillions of Kafka Messages Per Day

Authors: Vilas Athavale, Ravinder Matte, Sid Anand, Shrity Verma, Naresh Gopalani, Bhaven Avalani

👍 5💩 4
https://www.wired.com/story/epam-snowflake-ticketmaster-breach-shinyhunters/ Тут подкинули деталей про утечку у Snowflake. Все просто и банально, установил малварь себе на компуктер. @ohmydataengineer
Hammasini ko'rsatish...
Hackers Detail How They Allegedly Stole Ticketmaster Data From Snowflake

A ShinyHunters hacker tells WIRED that they gained access to Ticketmaster’s Snowflake cloud account—and others—by first breaching a third-party contractor.

😢 7💩 2🥱 1
https://medium.com/@kywe665/unity-catalog-oss-with-hudi-delta-iceberg-and-emr-duckdb-710ab8f8a7dc Databricks выложил свой Unity Catalog в open-source (https://www.databricks.com/blog/open-sourcing-unity-catalog) и народ уже начал к нему всякое подключать. @ohmydataengineer
Hammasini ko'rsatish...
Unity Catalog OSS with Hudi, Delta, Iceberg, and EMR + DuckDB

The Data + AI summit 2024 was jam packed with many exhilarating announcements including AI/BI, Clean Rooms, Serverless everything, and one…

🔥 9💩 1
Photo unavailableShow in Telegram
Пятничный юмор или самый частый вопрос в DE😄 @ohmydataengineer
Hammasini ko'rsatish...
🔥 46😢 13💩 4👍 3 2
Что там по Apache Iceberg? Несколько новостей, связанных с этим популярным форматом: - Dremio и REST Catalog - https://www.youtube.com/watch?v=Bkpj7M6yVdQ&list=PL-gIUf9e9CCtmCcXDWkZJob7SLdgEm3ia&index=5 - Snowflake и Polaris Catalog - https://www.snowflake.com/blog/introducing-polaris-catalog/ - Databrics купили Tabular - https://tabular.io/blog/tabular-is-joining-databricks (писал про это ранее) - Microsoft Fabric добавят Iceberg Support в рамках партнерства с Snowflake - https://www.microsoft.com/en-us/microsoft-fabric/blog/2024/05/22/snowflake-and-microsoft-announce-expansion-of-their-partnership Собственно, если вы все пропустили и не поняли, а что этот Iceberg такое, то вот прекрасная книжка от O'Reilly, еще и бесплатно - https://hello.dremio.com/wp-apache-iceberg-the-definitive-guide-reg.html @ohmydataengineer
Hammasini ko'rsatish...
7💩 5🔥 2👍 1
https://www.definite.app/blog/duckdb-datawarehouse А какой был заголовок! Я уже приготовился ко всякой вкусняшке внутри, про плюсы и минусы, ну и DuckDB, распиаренный не меньше Snowflake... Но ларчик просто открывался, достаточно смотреть детали: Size of data: 1TB Ну и, конечно же, DuckDB is designed for single-user workloads and becomes locked and un-queryable during data writes or table edits. To work around this issue, we set up two DuckDB instances, a write-to database and a read-only database... Как сказали у меня в ленте в твитторе, "Это не Warehouse, это кладовка какая-то" @ohmydataengineer
Hammasini ko'rsatish...
Definite: How We Migrated Our Data Warehouse from Snowflake to DuckDB

👍 9🥱 7 2🔥 2💩 1
Photo unavailableShow in Telegram
Пятничный юмор! @ohmydataengineer
Hammasini ko'rsatish...
💩 18👍 12😢 8🔥 1
https://www.youtube.com/watch?v=Ik0voaZmf5A&t=30316s (видео с PyCon Italia 2024) и расшифровка https://vickiboykis.com/2024/05/20/dont-worry-about-llms/ Don't Worry About LLM. Одновременно смешной и технически фундаментальный доклад про то, что происходит с LLM и стоит ли сильно переживать и испытывать FOMO из-за происходящего @ohmydataengineer
Hammasini ko'rsatish...
PyCon Italia 2024 - Lasagna - Saturday

💩 3👍 2
Boshqa reja tanlang

Joriy rejangiz faqat 5 ta kanal uchun analitika imkoniyatini beradi. Ko'proq olish uchun, iltimos, boshqa reja tanlang.