🧑💻
HyperLogLog: наглядно
Существует целый раздел вероятностных алгоритмов, которые, при небольшой потере точности, позволяют добиться невероятной скорости работы? И один из актуальных — это HyperLogLog, который справляется с нагрузками, типичными для Google, позволяет эффективно оценивать мощность множеств и широко применяется в СУБД. Для оценки множества размером не больше чем n, алгоритму потребуется всего O(log(log(n))) памяти.
В сети трудно найти русскоязычные материалы о практической реализации алгоритма, но не беда: как говорится, на каждую проблему найдется свой парень с Хабра с готовым решением.
Вот и сейчас нашлась статья, в которой максимально доступно описана реализация алгоритма. Для понимания темы не потребуется ни специальных математических знаний, ни предварительного знакомства с алгоритмом.
➡️
Перейти к статьеShow more ...