Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

9
Zastąp nieprawidłowe wartości wartością Brak w Pandas DataFrame
Czy istnieje metoda zastępowania wartości Nonew Pandas w Pythonie? Możesz użyć df.replace('pre', 'post')i zastąpić wartość inną, ale nie można tego zrobić, jeśli chcesz zastąpić Nonewartość, co jeśli spróbujesz, otrzymasz dziwny wynik. Oto przykład: df = DataFrame(['-',3,2,5,1,-5,-1,'-',9]) df.replace('-', 0) co zwraca pomyślny wynik. Ale, df.replace('-', None) co zwraca następujący wynik: 0 …

6
Usuń / przycinaj wszystkie ciągi ramki danych
Czyszczenie wartości ramki danych typu multitype w python / pandas, chcę przyciąć ciągi. Obecnie robię to w dwóch instrukcjach: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$', '', regex=True, inplace=True) #end df.values To jest dość powolne, co mogę …

10
Jak wydrukować (na papier) ładnie sformatowaną ramkę danych
Chciałbym wydrukować ładnie sformatowane ramki danych na papierze, najlepiej z poziomu skryptu. (Próbuję zbierać dane za pomocą instrumentu i automatycznie przetwarzać je i drukować za pomocą skryptu R). W tej chwili mogę zapisać ramkę danych do pliku tekstowego za pomocą write.table(), ale ma to dwa problemy: Wynikowy plik tekstowy jest …

3
Utwórz plik data.frame, w którym kolumna jest listą
Wiem, jak dodać kolumnę listy: > df <- data.frame(a=1:3) > df$b <- list(1:1, 1:2, 1:3) > df a b 1 1 1 2 2 1, 2 3 3 1, 2, 3 To działa, ale nie: > df <- data.frame(a=1:3, b=list(1:1, 1:2, 1:3)) Error in data.frame(1L, 1:2, 1:3, check.names = FALSE, …
80 r  list  dataframe 


5
Rozpakować i zwrócić wartość liczy się dla każdej zmiennej?
Mam ramkę danych, która rejestruje odpowiedzi 19717 osób na wybór języków programowania za pomocą pytań wielokrotnego wyboru. Pierwsza kolumna to oczywiście płeć respondenta, a reszta to wybory, które wybrali. Dlatego jeśli wybiorę Python, moja odpowiedź zostanie zapisana w kolumnie Python, a nie bash i odwrotnie. ID Gender Python Bash R …


3
Uzyskaj najbliższą odległość dzięki dwóm ramkom geodezyjnym w pandach
Oto moja pierwsza geobramka: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) Miasto 1 …

4
Oblicz procent podobnych wartości w ramce danych pandy
Mam jedną ramkę danych dfz dwiema kolumnami: Skrypt (z tekstem) i Głośnik Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 I mam następującą listę: L = ['a','b','c'] Za pomocą następującego kodu df = (df.set_index('Speaker')['Script'].str.findall('|'.join(L)) .str.join('|') …

3
Dlaczego przypisywanie za pomocą [:] kontra iloc [:] daje różne wyniki w pandach?
Jestem tak pomylony z różnymi metodami indeksowania ilocużywanymi w pandach. Powiedzmy, że próbuję przekonwertować ramkę danych 1-d na ramkę danych 2-d. Najpierw mam następującą 1-d ramkę danych a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T Zamierzam przekonwertować to na 2-d ramkę danych o rozmiarze 2x4. Zaczynam od przygotowania dwuwymiarowej ramki danych w …

3
Powolne pandy DataFrame MultiIndex reindex
Mam pand DataFrame formularza: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 2019-12-01 00:51:14+00:00 114430 19 …

1
Jak obrócić ramkę danych składającą się z kolumny z sekcją i podsekcją w R.
Mam niżej wymienioną ramkę danych: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", "RE", …

2
Generuj filtrowane binarne produkty kartezjańskie
Opis problemu Szukam wydajnego sposobu generowania pełnych binarnych produktów kartezjańskich (tabele ze wszystkimi kombinacjami prawdy i fałszu z pewną liczbą kolumn), filtrowane według określonych warunków wyłączności. Na przykład dla trzech kolumn / bitów n=3otrzymalibyśmy pełną tabelę df_combs = pd.DataFrame(itertools.product(*([[True, False]] * n))) 0 1 2 0 True True True 1 …



Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.