Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

4
datetime dtypes w pandach read_csv
Czytam w pliku csv z wieloma kolumnami z datą i godziną. Musiałbym ustawić typy danych po wczytaniu pliku, ale czasy dat wydają się być problemem. Na przykład: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Gdy run wyświetla błąd: Błąd typu: …

6
Jak zwięźle napisać formułę z wieloma zmiennymi z ramki danych?
Załóżmy, że mam zmienną odpowiedzi i dane zawierające trzy zmienne towarzyszące (jako przykład zabawki): y = c(1,4,6) d = data.frame(x1 = c(4,-1,3), x2 = c(3,9,8), x3 = c(4,-4,-2)) Chcę dopasować regresję liniową do danych: fit = lm(y ~ d$x1 + d$x2 + d$y2) Czy istnieje sposób na zapisanie wzoru, aby …
127 r  dataframe  glm  lm 

4
Jak utworzyć kolumnę krotki z dwóch kolumn w Pandach
Mam Pandas DataFrame i chcę połączyć kolumny „szerokie” i „długie”, aby utworzyć krotkę. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null values Crime …

10
Zapisz Dataframe do csv bezpośrednio do s3 Python
Mam pandy DataFrame, które chcę przesłać do nowego pliku CSV. Problem w tym, że nie chcę zapisywać pliku lokalnie przed przesłaniem go do s3. Czy istnieje metoda, taka jak to_csv, do bezpośredniego zapisu ramki danych do s3? Używam boto3. Oto, co mam do tej pory: import boto3 s3 = boto3.client('s3', …


12
data.frame do listy
Mam plik data.frame, który chciałbym przekonwertować na listę według wierszy, co oznacza, że ​​każdy wiersz odpowiadałby własnym elementom listy. Innymi słowy, chciałbym otrzymać listę tak długą, jak data.frame zawiera wiersze. Do tej pory rozwiązywałem ten problem w następujący sposób, ale zastanawiałem się, czy istnieje lepszy sposób na rozwiązanie tego problemu. …
123 list  r  dataframe 


8
Dynamicznie wybieraj kolumny ramek danych za pomocą znaku $ i wartości znakowej
Mam wektor z różnymi nazwami kolumn i chcę mieć możliwość zapętlenia każdej z nich, aby wyodrębnić tę kolumnę z data.frame. Na przykład, rozważ zestaw danych mtcarsi niektóre nazwy zmiennych przechowywane w wektorze znakowym cols. Kiedy próbuję wybrać zmienną mtcarsprzy użyciu dynamicznego podzbioru cols, niższego z tych działań cols <- c("mpg", …
122 r  dataframe  r-faq 


7
Jak dołączyć wiersze do ramki danych R.
Rozejrzałem się po StackOverflow, ale nie mogę znaleźć rozwiązania specyficznego dla mojego problemu, który obejmuje dołączanie wierszy do ramki danych R. Inicjalizuję pustą 2-kolumnową ramkę danych w następujący sposób. df = data.frame(x = numeric(), y = character()) Następnie moim celem jest iteracyjne przejrzenie listy wartości i dodanie wartości na końcu …
121 r  merge  append  dataframe  rows 

3
pobieranie indeksu wiersza w pandach stosuje funkcję
Próbuję uzyskać dostęp do indeksu wiersza w funkcji stosowanej w całej DataFramePandas. Mam coś takiego: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 i zdefiniuję funkcję, która ma dostęp do elementów z podanym wierszem def rowFunc(row): return row['a'] + row['b'] * …
121 python  pandas  dataframe 

14
Policz liczbę wierszy w każdej grupie
Mam ramkę danych i chciałbym policzyć wiersze w każdej grupie. Regularnie używam aggregatefunkcji do sumowania danych w następujący sposób: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Chciałbym teraz policzyć obserwacje, ale nie mogę znaleźć odpowiedniego argumentu za FUN. Intuicyjnie pomyślałem, że będzie tak: df2 <- aggregate(x …
121 r  dataframe  aggregate  r-faq 


14
Jak rozebrać (rozbić) kolumnę w DataFrame pandy?
Mam następujący DataFrame, w którym jedna z kolumn jest obiektem (komórka typu listy): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Oczekiwany wynik to: A B 0 1 1 1 1 2 3 2 1 4 2 2 Co mam zrobić, żeby to osiągnąć? Powiązane …
121 python  pandas  dataframe 

5
Przekaż nazwę kolumny data.frame do funkcji
Próbuję napisać funkcję akceptującą data.frame ( x) iz columnniej. Funkcja wykonuje pewne obliczenia na x, a później zwraca kolejną ramkę data.frame. Utknąłem na najlepszej metodzie przekazywania nazwy kolumny do funkcji. Dwa minimalne przykłady fun1ifun2 poniżej uzyskania pożądanego rezultatu, jest w stanie wykonywać operacje na x$columnużywając max()jako przykład. Jednak obaj opierają …
119 r  dataframe  r-faq 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.