Jestem nowicjuszem próbującym owinąć głowę wokół OLAP i mam kilka pytań.
- Pytanie 1: Czy kostka OLAP może przechowywać mediany, tryby, percentyle?
- Pytanie 2: Czy zapytanie MDX napisane przez użytkownika może zwrócić podsumowanie danych na poziomie wiersza? (np .:% transakcji> 100 USD). A może projektant kostki musi to dodać do kostki?
- Pytanie 3: Czy jakiekolwiek produkty OLAP zapewniają teraz mechanizmy dostępu do danych na poziomie wiersza? Który?
Nasz dział IT szuka informacji zwrotnych na temat tego, jakie problemy mamy z konkretną kostką ROLAP usług MS Analsis. Nie mamy dostępu do relacyjnej bazy danych za nią i musimy wykonać obliczenia, które obecnie nie są dostępne jako miary w kostce.
Zobaczę, czy mam to prawo.
- Kostka może dostarczać statystyki dla zliczeń, średnich, proporcji, odchyleń standardowych.
- Jeśli dana statystyka nie została uwzględniona w określonej metodzie dostarczonej przez projektanta kostki, czy możemy napisać zapytanie MDX, aby je uzyskać? Czy też muszą zmienić kostkę, aby wstępnie obliczyć ją z danych na poziomie wiersza?
- Kostka nie może dostarczyć statystyk takich jak mediany, tryby lub percentyle, ponieważ statystyki te nie agregują się poprawnie.
Czytam Grammar of Graphics Lelanda Wilkinsona, a także w swoim rozdziale dotyczącym eksploracji danych i OLAP
Te [operacje kostki] działają dobrze ze statystykami takimi jak liczby, średnie, proporcje i odchylenia standardowe. Proste agregacje w podklasach można obliczyć, operując na sumach, sumach kwadratów i innych terminach, które są łączone w funkcje liniowe w celu uzyskania podstawowych statystyk podsumowujących.
Nie działają one poprawnie ze statystykami takimi jak mediana, tryb i percentyle, ponieważ agregacja tych statystyk nie jest statystyką ich agregatów. Mediana median nie jest na przykład medianą agregatu.
Następnie dodaje:
Jednak ostatnio pojawił się bardziej wyrafinowany model ROLAP. Za pomocą kilku technologii można zapewnić algorytmom statystycznym dostęp do surowych danych za pomocą modelu relacyjnego w czasie rzeczywistym. To podejście jest bardziej obiecujące niż sztywne agregacje oferowane przez struktury takie jak kostki danych.
W najbardziej eleganckiej formie tej architektury aplikacje mogą żądać zdalnych połączeń w celu dostarczenia informacji o metodach przetwarzania danych i podjęcia odpowiednich działań w zależności od zwracanych informacji. W tej formie architektura komponentów może osiągnąć prawdziwą obietnicę przetwarzania rozproszonego: projektowanie i wykonywanie niezależne od strony, systemu operacyjnego lub języka.
Zostało to napisane około 2005 roku. Czy ktoś wie o produktach wykorzystujących tę metodologię, aby umożliwić dostęp do danych na poziomie wiersza?