pytanie to zaczęło się jako „ klastrowanie danych przestrzennych w R ”, a teraz zostało przeniesione do pytania DBSCAN.
Ponieważ odpowiedzi na pierwsze pytanie sugerowały, że szukałem informacji o DBSCAN i czytałem kilka dokumentów na ten temat. Pojawiły się nowe pytania.
DBSCAN wymaga pewnych parametrów, jednym z nich jest „odległość”. Ponieważ moje dane są trójwymiarowe, długość, szerokość i temperatura, jakiej „odległości” powinienem użyć? który wymiar jest związany z tą odległością? Podejrzewam, że powinna to być temperatura. Jak znaleźć tak minimalną odległość za pomocą R?
Kolejnym parametrem jest minimalna liczba punktów potrzebnych do utworzenia klastra. Czy istnieje metoda znalezienia tego numeru? Niestety nie znalazłem.
Przeszukując Google, nie mogłem znaleźć R dla przykładu użycia dbscan w zbiorze danych podobnym do mojego, czy znasz jakieś strony z tego rodzaju przykładami? Więc mogę czytać i próbować dostosować się do mojej sprawy.
Ostatnie pytanie brzmi: moja pierwsza próba R z DBSCAN (bez poprawnej odpowiedzi na poprzednie pytania) spowodowała problem z pamięcią. R mówi, że nie może przydzielić wektora. Zaczynam od siatki o odległości 4 km z 779191 punktami, która kończy się w przybliżeniu 300000 rzędów x 3 kolumny (szerokość, długość i temperatura) podczas usuwania nieważnych punktów SST. Wszelkie wskazówki dotyczące rozwiązania tego problemu z pamięcią. Czy to zależy od mojego komputera, czy od samej DBSCAN?
Dziękujemy za cierpliwość, aby przeczytać długą i prawdopodobnie nudną wiadomość oraz za pomoc.