Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

3
Jak uzyskać wartość z Pandas DataFrame, a nie z indeksu i typu obiektu
Powiedzmy, że mam następującą ramkę DataFrame Numer listu A 1 B 2 C 3 D 4 Który można uzyskać za pomocą następującego kodu import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) Teraz chcę uzyskać wartość C z kolumny Litery. Wiersz …
104 python  pandas  dataframe 


1
Sposób na przeczytanie pierwszych kilku wierszy dla pandy dataframe
Czy istnieje wbudowany sposób read_csvodczytu tylko pierwszych nwierszy pliku bez wcześniejszej znajomości długości wierszy? Mam duży plik, którego odczytanie zajmuje dużo czasu, i czasami chcę użyć tylko pierwszych, powiedzmy, 20 wierszy, aby pobrać jego próbkę (i wolę nie ładować całej zawartości i zajmować się tym). Gdybym znał całkowitą liczbę wierszy, …
104 python  pandas  csv  dataframe 

10
Filtruj kolumnę ramki danych Pyspark z wartością Brak
Próbuję filtrować ramkę danych PySpark, która ma Nonejako wartość wiersza: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] i mogę poprawnie filtrować za pomocą wartości ciągu: df[df.dt_mvmt == '2016-03-31'] # some results here ale to się nie udaje: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Ale z pewnością są wartości …


5
Jak pobrać wiersz z R data.frame
Mam ramkę danych z nagłówkami kolumn. Jak mogę pobrać określony wiersz z data.frame jako listę (z nagłówkami kolumn jako kluczami do listy)? W szczególności moja data.frame to ABC 1 5 4,25 4,5 2 3,5 4 2,5 3 3,25 4 4 4 4,25 4,5 2,25 5 1,5 4,5 3 Chcę uzyskać …
103 r  indexing  dataframe 

8
Czyszczenie wartości „Inf” z ramki danych R.
W R mam operację, która tworzy pewne Infwartości, gdy przekształcam ramkę danych. Chciałbym zamienić te Infwartości na NAwartości. Kod, który mam, jest wolny w przypadku dużych danych, czy istnieje szybszy sposób na zrobienie tego? Powiedzmy, że mam następującą ramkę danych: dat <- data.frame(a=c(1, Inf), b=c(Inf, 3), d=c("a","b")) W jednym przypadku …
103 r  dataframe  data.table 

2
Obiekt „DataFrame” nie ma atrybutu „sort”
Mam tu jakiś problem, w moim pakiecie Pythona zainstalowałem numpy, ale nadal mam ten błąd Obiekt „DataFrame” nie ma atrybutu „sort” Każdy może dać mi jakiś pomysł .. To jest mój kod: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final = final.iloc[1:].reset_index(drop=True) …




5
jak zmienić kolumnę Dataframe z typu String na typ Double w pyspark
Mam ramkę danych z kolumną jako ciągiem. Chciałem zmienić typ kolumny na Double type w PySpark. Oto droga, którą zrobiłem: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Chciałem tylko wiedzieć, czy to właściwy sposób, aby to zrobić, ponieważ podczas przechodzenia przez regresję logistyczną dostaję jakiś błąd, więc zastanawiam się, …

6
Konwertuj ramkę danych pandy na serię
Jestem trochę nowy w pandach. Mam ramkę danych pandy, która ma 1 wiersz na 23 kolumny. Chcę przekształcić to w serię? Zastanawiam się, jaki jest najbardziej pytoniczny sposób na zrobienie tego? Próbowałem, pd.Series(myResults)ale narzeka ValueError: cannot copy sequence with size 23 to array axis with dimension 1. Nie jest wystarczająco …

7
Jak przesunąć kolumnę w Pandas DataFrame
Chciałbym przesunąć kolumnę w Pandach DataFrame, ale nie udało mi się znaleźć metody na zrobienie tego z dokumentacji bez przepisywania całego DF. Czy ktoś wie, jak to zrobić? Ramka danych: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Pożądane wyjście: …
101 python  pandas  dataframe 


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.