Odczytywanie surowych danych do geopand


14

Czy można wczytać surowe dane do pliku geopandas GeoDataFramea la a la pandas DataFrame?

Na przykład następujące prace:

import pandas as pd
import requests
data = requests.get("https://data.cityofnewyork.us/api/geospatial/arq3-7z49?method=export&format=GeoJSON")
pd.read_json(io.BytesIO(r.content))

Następujące nie:

import geopandas as gpd
import requests
data = requests.get("https://data.cityofnewyork.us/api/geospatial/arq3-7z49?method=export&format=GeoJSON")
gpd.read_file(io.BytesIO(r.content))

Innymi słowy, czy można odczytać dane geoprzestrzenne znajdujące się w pamięci bez uprzedniego zapisania tych danych na dysku?

Odpowiedzi:


16

Możesz przekazać json bezpośrednio do konstruktora GeoDataFrame:

import geopandas as gpd
import requests
data = requests.get("https://data.cityofnewyork.us/api/geospatial/arq3-7z49?method=export&format=GeoJSON")
gdf = gpd.GeoDataFrame(data.json())
gdf.head()

Wyjścia:

                                            features               type
0  {'type': 'Feature', 'geometry': {'type': 'Poin...  FeatureCollection
1  {'type': 'Feature', 'geometry': {'type': 'Poin...  FeatureCollection
2  {'type': 'Feature', 'geometry': {'type': 'Poin...  FeatureCollection
3  {'type': 'Feature', 'geometry': {'type': 'Poin...  FeatureCollection
4  {'type': 'Feature', 'geometry': {'type': 'Poin...  FeatureCollection

W przypadku obsługiwanych formatów jednego pliku lub spakowanych plików kształtów możesz użyć fiona.BytesCollectioni GeoDataFrame.from_features:

import requests
import fiona
import geopandas as gpd

url = 'http://www.geopackage.org/data/gdal_sample.gpkg'
request = requests.get(url)
b = bytes(request.content)
with fiona.BytesCollection(b) as f:
    crs = f.crs
    gdf = gpd.GeoDataFrame.from_features(f, crs=crs)
    print(gdf.head())
i dla spakowanych plików kształtów (obsługiwane od wersji Fiona 1.7.2 )
url = 'https://www2.census.gov/geo/tiger/TIGER2010/STATE/2010/tl_2010_31_state10.zip'
request = requests.get(url)
b = bytes(request.content)
with fiona.BytesCollection(b) as f:
    crs = f.crs
    gdf = gpd.GeoDataFrame.from_features(f, crs=crs)
    print(gdf.head())

Możesz dowiedzieć się, jakie formaty obsługuje Fiona, używając czegoś takiego:

import fiona
for name, access in fiona.supported_drivers.items():
    print('{}: {}'.format(name, access))

I hacky obejście do odczytu spakowanych danych w pamięci w Fiona 1.7.1 lub wcześniejszej:

import requests
import uuid
import fiona
import geopandas as gpd
from osgeo import gdal

request = requests.get('https://github.com/OSGeo/gdal/blob/trunk/autotest/ogr/data/poly.zip?raw=true')
vsiz = '/vsimem/{}.zip'.format(uuid.uuid4().hex) #gdal/ogr requires a .zip extension

gdal.FileFromMemBuffer(vsiz,bytes(request.content))
with fiona.Collection(vsiz, vsi='zip', layer ='poly') as f:
    gdf = gpd.GeoDataFrame.from_features(f, crs=f.crs)
    print(gdf.head())

Działa to dla GeoJSON, który odpowiada na pytanie. Ale to nie działałoby w przypadku innych formatów plików geoprzestrzennych, takich jak pliki kształtów lub KML lub KMZ. Czy znasz obejście tych przypadków?
Aleksey Bilogur

Trochę wyjaśnienia jest w porządku. GeoPandas i Fiona obsługują pliki kształtów i KML, ale nie mogą w pełni obsługiwać jednorazowych interfejsów API, takich jak City of New York's. Również BytesCollectioncałkowicie działa, ale prawdopodobnie zostanie usunięty w przyszłej wersji na korzyść jednej z opcji w github.com/Toblerity/Fiona/issues/409 .
sgillies

Dzięki. @sgillies powinno to zostać otwarte jako prośba o dodanie funkcji geopandas, czy lepiej byłoby poczekać na zmiany, o których tu wspominasz ?
Aleksey Bilogur

@ gillies, które twierdzisz, że Fiona obsługuje KML w powyższym komentarzu, ale DriverError: unsupported driver: 'KML'jest podnoszona podczas próby otwarcia KML, ponieważ nie ma go w supported_driversdykcie (za pomocą Fiona 1.7.1) i zauważyłem kilka problemów. brak obsługi KML (# 23 i # 97). Czy Fiona obsługuje KML?
user2856

Dziękujemy za wybranie from_featuresmetody. Uratowałem mój dzień!
jlandercy

3

Ponieważ fiona.BytesCollectionwydaje się, że nie działa TopoJSONtutaj rozwiązanie, które działa dla wszystkich bez potrzeby gdal:

import fiona
import geopandas as gpd
import requests

# parse the topojson file into memory
request = requests.get('https://vega.github.io/vega-datasets/data/us-10m.json')
visz = fiona.ogrext.buffer_to_virtual_file(bytes(request.content))

# read the features from a fiona collection into a GeoDataFrame
with fiona.Collection(visz, driver='TopoJSON') as f:
    gdf = gpd.GeoDataFrame.from_features(f, crs=f.crs)

Z geopandas==0.4.0, Fiona==1.8.4i Pythonie 3, otrzymuję DriverError: unsupported driver: 'TopoJSON'.
edesz

Masz rację. To pracował co najmniej do wersji 1.7.13zFiona
Mattijn

Szkoda, że ​​to nie działa. Próbowałem podążać za twoim przykładem na GitHub dla wykresów choropleth Altair, ale to także rzuca ten sam błąd na linię gdf = gpd.read_file(counties, driver='TopoJSON'). Myślałem, że używanie with fiona.Collection...może działać, ale niestety nie.
edesz

@edesz to był błąd i zostanie naprawiony w Fiona 1.8.5, patrz: github.com/Toblerity/Fiona/issues/721
Mattijn


2

W przypadku korzystania z Fiona 1.8 można to (musi?) Wykonać przy użyciu tego projektu MemoryFilelubZipMemoryFile .

Na przykład:

import fiona.io
import geopandas as gpd
import requests

response = requests.get('http://example.com/Some_shapefile.zip')
data_bytes = response.content

with fiona.io.ZipMemoryFile(data_bytes) as zip_memory_file:
    with zip_memory_file.open('Some_shapefile.shp') as collection:
      geodf = gpd.GeoDataFrame.from_features(collection, crs=collection.crs)

0

Najłatwiejszym sposobem jest wprowadzenie adresu URL GeoJSON bezpośrednio w gpd.read (). Próbowałem wcześniej wyodrębnić plik kształtu z pliku zip za pomocą BytesIO i pliku zip i miałem problemy z tym, że gpd (konkretnie Fiona) akceptuje obiekty podobne do plików.

import geopandas as gpd
import David.SQL_pull_by_placename as sql
import os

os.environ['PROJ_LIB'] = r'C:\Users\littlexsparkee\Anaconda3\Library\share\proj'

geojson_url = f'https://github.com/loganpowell/census-geojson/blob/master/GeoJSON/500k/2018/{sql.state}/block-group.json?raw=true'
census_tracts_gdf = gpd.read_file(geojson_url)

0

Wolę wynik uzyskany przy użyciu nieudokumentowanego GeoDataFrame.from_features()zamiast bezpośredniego przekazywania GeoJSON do konstruktora GDF:

import geopandas as gpd
import requests
data = requests.get("https://data.cityofnewyork.us/api/geospatial/arq3-7z49?method=export&format=GeoJSON")
gpd.GeoDataFrame().from_features(data.json())

Wynik

                       geometry                         name                                url           line objectid                                              notes
0    POINT (-73.99107 40.73005)                     Astor Pl  http://web.mta.info/nyct/service/  4-6-6 Express        1  4 nights, 6-all times, 6 Express-weekdays AM s...
1    POINT (-74.00019 40.71880)                     Canal St  http://web.mta.info/nyct/service/  4-6-6 Express        2  4 nights, 6-all times, 6 Express-weekdays AM s...
2    POINT (-73.98385 40.76173)                      50th St  http://web.mta.info/nyct/service/            1-2        3                              1-all times, 2-nights
3    POINT (-73.97500 40.68086)                    Bergen St  http://web.mta.info/nyct/service/          2-3-4        4           4-nights, 3-all other times, 2-all times
4    POINT (-73.89489 40.66471)             Pennsylvania Ave  http://web.mta.info/nyct/service/            3-4        5                        4-nights, 3-all other times

Wynikowa GeoDataFrame ma poprawnie ustawioną kolumnę geometrii i wszystkie kolumny, jak bym się spodziewał, bez potrzeby cofania jakichkolwiek operacji FeatureCollections

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.