Decydowanie, jakiej metody interpolacji użyć do ponownego próbkowania danych rastrowych?

40

Czy istnieją twarde i szybkie reguły dotyczące metod interpolacji odpowiednich dla każdego rodzaju danych rastrowych?

1

Co interpolujesz? Czy celem jest po prostu wizualizacja lub faktyczny pomiar jakiegoś rodzaju dystrybucji? Jednak, aby nie wzbudzić twoich nadziei, praktycznie nie są to twarde ani szybkie zasady.

— Andy W

4

@ninesided: Czy na pewno chcesz wskazać dane „rastrowe”? Przyjęta odpowiedź dotyczy wyłącznie metod interpolacji danych wektorowych (punktowych i liniowych).

— whuber

5

Tytuł pytania jest trochę niejednoznaczny. Interpolacja i ponowne próbkowanie słów oznaczają dwie nieznacznie różne rzeczy. Interpolacja polega na pobraniu próbki dyskretnych punktów danych (rastra lub wektora) i obliczeniu z tego ciągłej powierzchni. Ponowne próbkowanie polega na pobraniu grupy punktów (ponownie rastra lub wektora), zastosowaniu do nich jakiegoś algorytmu i wytworzeniu nowego zestawu punktów. Uważam więc, że interpolację można postrzegać jako jeden rodzaj ponownego próbkowania.

— Don Meltz

2

Imho tytuł jest zły. „ponowne próbkowanie danych rastrowych” sprawia, że myślę, że masz raster i chcesz z niego utworzyć nowy większy / mniejszy raster. Jeśli chcesz utworzyć raster przez interpolację punktów wektorowych, „ponowne próbkowanie” jest złym terminem.

— podmroku

3

@ninesided - Ponieważ wybrałeś moją odpowiedź jako odpowiedź na twoje pytanie, zakładam, że chciałeś interpolować zestaw dyskretnych punktów na ciągłej powierzchni rastrowej. Słowo resample jest interpretowane przez większość jako konwersja jednego rastra na inny, w oparciu o pewien algorytm. Nie sądzę, żebyś mylił się, używając tego słowa, ponieważ uważam, że interpolacja jest formą ponownego próbkowania. Po prostu większość nie widzi tego w ten sposób. Nie twierdzę, że jestem ekspertem w tej dziedzinie, więc poprawki do moich założeń są mile widziane.

— Don Meltz

11

Zgadzam się, że nie ma twardych i szybkich reguł, ale istnieją pewne wytyczne dotyczące różnych metod interpolacji. Na przykład, IDW jest najlepszy, gdy masz dość gęste punkty na początek. Kriging wymaga dużej mocy obliczeniowej, zwykle stosowany w modelowaniu gleby / geologii. Splajn jest zwykle używany, gdy pożądana jest gładka powierzchnia, np. Dane dotyczące temperatury Niektóre metody utrzymują wynikowy raster przechodzący przez oryginalne punkty, podczas gdy inne nie.

Chociaż jest skoncentrowany na ArcGIS, dobry przegląd różnych metod można znaleźć na 4-stronicowym dokumencie

Interpolowanie powierzchni w ArcGIS Spatial Analyst

— Don Meltz
źródło

41

Wyjaśnienie tego pytania wskazuje, że poszukuje się metod ponownego próbkowania rastra . Wiele z nich jest używanych w społecznościach zajmujących się obrazowaniem i fotografią . Jednak w przypadku GIS powszechnie stosuje się kilka prostych metod:

Ponowne próbkowanie najbliższego sąsiada . Każda komórka w nowym rastrze ma przypisaną wartość najbliższej komórki (od środka do środka) w oryginalnym rastrze. Użyj tego do danych kategorycznych, takich jak użytkowanie gruntów i inne klasyfikacje.
Interpolacja dwuliniowa . Każda komórka w nowym rastrze ma przypisaną średnią na podstawie czterech najbliższych oryginalnych komórek. Uśrednianie jest liniowe w kierunku poziomym i pionowym. (Jednak wynikowa formuła nie jest liniowa; jest w rzeczywistości kwadratowa). Jest to dobre do wygładzania ogólnego przeznaczenia, ale uśrednianie, które zwykle zachodzi, zazwyczaj przycina lokalne szczyty i doliny.
Sześcienny splot . Jest to duchowo podobne do interpolacji dwuliniowej, ale może nieznacznie ekstrapolować wartości z pobliskich komórek. Robi to w sposób mający na celu odtworzenie lokalnych średnich i zmienności w nowej sieci; w szczególności obcinanie ekstremów lokalnych nie powinno być tak poważne. (Jedną niekorzystną konsekwencją, widoczną jako błąd w ArcGIS ESRI, jest to, że wartości w nowej siatce mogą wykraczać poza zakres starej, powodując, że niektóre nowe skrajności nie są renderowane poprawnie. Ale to kwestia danych tylko wyświetlanie). Kompromis polega na tym, że obliczenie splotu sześciennego zajmuje nieco więcej czasu niż interpolacja dwuliniowa.

Dwie ostatnie metody omawiam bardziej szczegółowo na stronie http://www.quantdec.com/SYSEN597/GTKAV/section9/map_algebra.htm

W przypadku szybkich jednorazowych obliczeń zazwyczaj jestem zadowolony z przeprowadzania interpolacji dwuliniowej (dla danych ciągłych) lub interpolacji najbliższego sąsiada (dla danych kategorycznych). W przypadku wszystkich innych, szczególnie podczas przygotowywania głównych zestawów danych lub przewidywania obszernych manipulacji, zalecam użycie sześciennych splotów (a także zastanowienie się nad uporządkowaniem operacji w celu zminimalizowania propagacji błędu zmiennoprzecinkowego).

— Whuber
źródło

Niektóre użyteczne dodatkowa rada pojawia się w komentarzach w gis.stackexchange.com/questions/17328/... .

— whuber

18

Według ESRI dostępne metody interpolacji (dostępne jako narzędzia w programie Spatial Analyst i innych rozszerzeniach) są porównywane w następujący sposób: (Cytowanie)

Narzędzie IDW (Inverse Distance Weighted) wykorzystuje metodę interpolacji, która szacuje wartości komórek, uśredniając wartości punktów danych próbki w sąsiedztwie każdej komórki przetwarzania. Im bliżej punktu znajduje się środek szacowanej komórki, tym większy wpływ lub waga ma ona na proces uśredniania.

Kriging to zaawansowana procedura geostatystyczna, która generuje oszacowaną powierzchnię z rozproszonego zestawu punktów o wartościach Z. Bardziej niż inne metody interpolacji obsługiwane przez ArcGIS Spatial Analyst, należy dokładnie zbadać zachowanie przestrzenne zjawiska reprezentowanego przez wartości z, zanim wybierzesz najlepszą metodę szacowania do generowania powierzchni wyjściowej.

Interpolacja przez naturalnego sąsiada znajduje najbliższy podzbiór próbek wejściowych do punktu zapytania i przypisuje im wagi na podstawie proporcjonalnych obszarów do interpolacji wartości (Sibson, 1981). Znany jest również jako interpolacja Sibsona lub „kradzieży obszaru”.

Spline narzędzie wykorzystuje metodę interpolacja wartości oszacowania przy użyciu funkcji matematycznej, który minimalizuje ogólny krzywizna powierzchni, co prowadzi do gładkiej powierzchni, która przechodzi dokładnie przez punkty wejściowe.

Splajn z barierami Narzędzie Splajn z barierami wykorzystuje metodę podobną do techniki stosowanej w narzędziu Splajn, przy czym główna różnica polega na tym, że to narzędzie honoruje nieciągłości zakodowane zarówno w barierach wejściowych, jak i danych punktu wejściowego.

Narzędzia Topo to Raster i Topo to Raster by File wykorzystują technikę interpolacji zaprojektowaną specjalnie w celu stworzenia powierzchni, która ściślej reprezentuje naturalną powierzchnię drenażową i lepiej chroni zarówno grzbiety, jak i sieci strumieniowe z wejściowych danych konturowych.

Zastosowany algorytm oparty jest na algorytmie ANUDEM, opracowanym przez Hutchinson i in. Z Australian National University.

Trend jest globalną interpolacją wielomianową, która dopasowuje gładką powierzchnię zdefiniowaną przez funkcję matematyczną (wielomian) do wejściowych punktów próbkowania. Powierzchnia trendu zmienia się stopniowo i przechwytuje zgrubne wzory w danych.

Możesz także zapoznać się z tym artykułem: http://proceedings.esri.com/library/userconf/proc95/to100/p089.html

— Jakub Sisak GeoGraphics
źródło

1

+1 za wybranie czegoś z ESRI pomaga w cytowaniu, który ma sens i jest poprawny!

— whuber

Czy możesz zaktualizować link do postępowania, ten, który zamieściłeś, nie jest już dostępny (nie znaleziono strony). Alternatywnie możesz umieścić tytuł lub informacje, które pozwolą nam go wyszukać na stronie ESRI.

— Renata Dis

2

Dwie inne metody to Średnia4 i Średnia16. Robią tak, jak brzmią i przyjmują średnio 4 lub 16 otaczających komórek.

Przypadek użycia tutaj dotyczy głównie danych DEM. Nie używałbyś go na obrazie rastrowym (szczególnie kolor 3-pasmowy)

Nie jest ważony odległością, ale nie sądzę, żebym użył tego w przypadku rastra (tylko wektor), ponieważ odległość w zbiorze danych rastrowych jest nieco bardziej subiektywna

Zawsze uważałem, że Median4 i Median16 będą dobrym sposobem na usunięcie spadków i skoków z danych DEM, chociaż nie znam żadnych pakietów, które na to pozwalają.

— Mark Ireland
źródło

2

Twoja sugestia, aby użyć median sąsiedztwa do badania lokalnych wartości odstających w DEM, jest dobra, Mark. Pakiet GRID / Spatial Analyst firmy ESRI od bardzo dawna obejmuje mediany sąsiedztwa, wiem, że IDRISI może to zrobić, i prawdopodobnie GRASS i kolektor. Ale te metody byłyby złym wyborem do ponownego próbkowania siatki. Podobnie inne metody, o których wspominasz, nie miałyby dobrych właściwości: skutecznie wygładzają oryginalne dane w rozdzielczości oryginalnej siatki i dlatego nie powinny być w ogóle brane pod uwagę przy ponownym próbkowaniu.

— whuber