Jakie istnieją przydatne algorytmy, które działają na ogromnych strumieniach danych, a także ich wyniki są dość małe i można obliczyć wynik dla mieszanki dwóch strumieni, łącząc w jakiś sposób ich wyniki?
Mogę wymienić kilka:
- Oczywiste rzeczy, takie jak suma, min, maksimum, liczba, najwyższe K itp.
- Przybliżone tak zwane „oparte na szkicach” algorytmy strumieniowe dla histogramów, zliczania różnych elementów lub obliczania kwantyli
Jacy są inni
(Jestem zainteresowany, ponieważ piszę projekt hobby do monitorowania systemów rozproszonych, których użyteczność jest bezpośrednio określona przez przydatność takich algorytmów)