Jak utworzyć mapę błędów w celu obsługi mapy średniej gęstości jądra?

Stworzyłem mapę średniej gęstości jądra, uruchamiając KDE na punktach ułożonych w tym samym zakresie przestrzennym. Załóżmy na przykład, że mamy trzypunktowe pliki kształtu reprezentujące sadzonki w trzech różnych szczelinach leśnych o tym samym kształcie i wielkości. Uruchomiłem KDE dla każdego pliku kształtu. Wyjście z KDE zostały następnie ułożone na podstawie zakresu przestrzennego w celu obliczenia średniej w Arc kalkulatora rastrowych, np Float(("KDE1"+"KDE2"+"KDE3")/3). Oto produkt końcowy:

wprowadź opis zdjęcia tutaj

Teraz jestem zainteresowany stworzeniem mapy przedstawiającej błąd związany ze uśrednionymi KDE. Mam nadzieję, że użyję mapy błędów, aby wizualnie zobrazować, ile błędów jest związanych z punktami dostępowymi (np. Czy punkt dostępowy SW wynika wyłącznie z punktów w jednej szczelinie?). Jak powinienem zacząć tworzyć mapę błędu związanego ze uśrednionymi KDE? Czy MSE byłby najbardziej odpowiednią miarą błędu w tym przypadku?

arcgis-desktop spatial-statistics kernel-density

— Aaron
źródło

To bardzo interesująca analiza. Co rozumiesz przez „błąd standardowy”? Jakieś odchylenie (różnica) każdej mapy gęstości od „średniej” warstwy?

— Analiza krajobrazu

@ Analiza krajobrazu Post edytowany w celu dostosowania komentarzy. Tak, myślę, że oszacowanie MSE może być najbardziej odpowiednie w tym przypadku. Zasadniczo pokazując, jak każde KDE odbiega od przeciętnego KDE. Nie jestem jednak pewien, jak to wszystko połączyć za pomocą ArcGIS i / lub skryptów.

— Aaron

Zastrzeżenie

Błąd standardowy jest użytecznym sposobem oszacowania niepewności na podstawie próbkowanych danych, gdy nie ma błędu systematycznego w danych. To założenie jest wątpliwe w tym kontekście, ponieważ (a) mapy KDE będą lokalnie mieć określone błędy, które mogą systematycznie utrzymywać się między warstwami oraz (b) potencjalnie ogromny składnik niepewności z powodu wyboru promienia jądra (lub „szerokości pasma”) „) w ogóle nie znajdzie odzwierciedlenia w żadnej kolekcji tych map.

Niektóre wybory

Niemniej jednak przedstawienie zmienności wśród zbioru powiązanych, skolokowanych („ułożonych”) map jest świetnym pomysłem - pod warunkiem, że pamiętasz opisane ograniczenia. W tym otoczeniu naturalne byłoby kilka miar lokalnej zmienności, w tym:

Zakres wartości, wyrażone addytywnie (maksymalna minus minimalna) lub multiplikatywnie (maksymalnie podzielone przez minimum).
Wariancji lub odchylenie standardowe wartości. Mnożącą wersją tego byłoby wariancja lub odchylenie standardowe logarytmów wartości.
Solidny estymator dyspersji, taki jak zakres międzykwartylowy (lub stosunek trzeciego do pierwszego kwartylu).

Pod wieloma względami miary multiplikacyjne mogą być bardziej odpowiednie dla gęstości, ponieważ różnica między (powiedzmy) 100 a 101 drzew na akr może być nieistotna, podczas gdy różnica między 2 a 1 drzewem na akr może być stosunkowo ważna. Oba wykazują ten sam (addytywny) zakres 101 - 100 = 2 - 1 = 1, ale ich multiplikatywne zakresy 1,01 i 2,00 różnią się znacznie. (Zwróć uwagę, że zakres multiplikatywny zawsze przekracza 1, więc 2,00 jest sto razy dalej od 1 niż 1,01).

Obliczenie

Obliczenie tych miar wymaga pewnej formy lokalnych statystyk. Funkcja statystyki komórki w programie Spatial Analyst oblicza wariancje, zakresy i odchylenia standardowe. Lokalne kwantyle można znaleźć według rangi . Zamiast być wybrednym w kwestii tego, które szeregi użyć, wybierz wygodne w pobliżu kwartyli. Aby je znaleźć, niech n będzie liczbą siatek na stosie. Mediana ma rangę (n + 1) / 2 - która może nie być liczbą całkowitą, co oznacza, że należy ją obliczyć przez uśrednienie rang n / 2 i n / 2 + 1, z których każda byłaby zbliżona do mediany. Aby przybliżyć kwartyle, zaokrąglij (n + 1) / 2 w dół do najbliższej liczby całkowitej, następnie ponownie dodaj 1 i podziel przez 2. Niech ta liczba będzie r . Posługiwać sięr i n + 1 - r dla szeregów kwartyli.

Na przykład, jeśli stos ma n = 6 siatek, (n + 1) / 2 zaokrąglone w dół to 3, a (3 + 1) / 2 = 2 nie wymaga zaokrąglania. Dla rang użyj r = 2 i r = 6 + 1 - 2 = 5. W efekcie ta procedura zwróciłaby drugą najniższą ( r = 2) i drugą najwyższą ( r = 5) wartość z sześciu wartości w każdej komórce. Możesz zmapować ich różnicę lub stosunek.

— Whuber
źródło

Wyobrażam sobie, że współczynnik zmienności byłby przydatny w tym kontekście.

— Jeffrey Evans

@ jeffrey Dziękuję, to także uwaga. CV uzyskuje się poprzez podzielenie (lokalnej) siatki odchyleń standardowych przez (lokalną) średnią siatkę. Nie wspomniałem o tym, ale w przypadku takich multiplikatywnych podsumowań należy zachować ostrożność, aby zamaskować obszary, w których mianownik (w zależności od przypadku średnia lub minimalna) jest bliski zeru: wyniki mogą być niewiarygodne i prawdopodobne nie odzwierciedlą niczego poza nieprecyzyjnością liczbową i drobnymi niedokładnościami w przybliżeniu jąder.

— whuber

@ Whuber, czy mógłbyś rozwinąć kwestię (a) w swoim pierwszym akapicie? Na przykład, czy masz na myśli błędy w technikach gromadzenia danych, które mogą utrzymywać się w obrębie każdej luki leśnej (a zatem systematycznie objawiają się w każdym rastrze KDE), czy błędy związane z implementacją funkcji ogniskowej?

— MannyG

@whuber Świetne pomysły dookoła - wielkie dzięki!

— Aaron