Czy są jakieś algorytmy zmiany kolejności danych w celu optymalizacji pod kątem kompresji? Rozumiem, że jest to specyficzne dla danych i algorytmu kompresji, ale czy jest jakieś słowo na ten temat? Gdzie mogę znaleźć badania w tej dziedzinie?
W szczególności mam listę jsonów o wartości 1,5 miliona ciągów i chcę zmienić kolejność ciągów, aby zoptymalizować kompresję gzip (dla HTTP). Sortowanie ciągów ma się całkiem dobrze, ale tak naprawdę nie wiem, czy to jest optymalne.