Programowanie dataframe

3

Jak uzyskać wartość z Pandas DataFrame, a nie z indeksu i typu obiektu

Powiedzmy, że mam następującą ramkę DataFrame Numer listu A 1 B 2 C 3 D 4 Który można uzyskać za pomocą następującego kodu import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) Teraz chcę uzyskać wartość C z kolumny Litery. Wiersz …

104 python pandas dataframe

8

Połącz dwie lub więcej kolumn w ramce danych w nową kolumnę z nową nazwą

Na przykład, jeśli mam to: n = c(2, 3, 5) s = c("aa", "bb", "cc") b = c(TRUE, FALSE, TRUE) df = data.frame(n, s, b) n s b 1 2 aa TRUE 2 3 bb FALSE 3 5 cc TRUE Następnie jak połączyć dwie kolumny ni sutworzyć nową kolumnę nazwaną …

104 r dataframe multiple-columns r-faq

1

Sposób na przeczytanie pierwszych kilku wierszy dla pandy dataframe

Czy istnieje wbudowany sposób read_csvodczytu tylko pierwszych nwierszy pliku bez wcześniejszej znajomości długości wierszy? Mam duży plik, którego odczytanie zajmuje dużo czasu, i czasami chcę użyć tylko pierwszych, powiedzmy, 20 wierszy, aby pobrać jego próbkę (i wolę nie ładować całej zawartości i zajmować się tym). Gdybym znał całkowitą liczbę wierszy, …

104 python pandas csv dataframe

10

Filtruj kolumnę ramki danych Pyspark z wartością Brak

Próbuję filtrować ramkę danych PySpark, która ma Nonejako wartość wiersza: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] i mogę poprawnie filtrować za pomocą wartości ciągu: df[df.dt_mvmt == '2016-03-31'] # some results here ale to się nie udaje: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Ale z pewnością są wartości …

104 python apache-spark dataframe pyspark apache-spark-sql

10

Python Pandas - znajdź różnicę między dwiema ramkami danych

Mam dwie ramki danych df1 i df2, gdzie df2 jest podzbiorem df1. Jak uzyskać nową ramkę danych (df3), która jest różnicą między dwiema ramkami danych? Innymi słowy, ramka danych, która ma wszystkie wiersze / kolumny w df1, których nie ma w df2?

104 python pandas dataframe

5

Jak pobrać wiersz z R data.frame

Mam ramkę danych z nagłówkami kolumn. Jak mogę pobrać określony wiersz z data.frame jako listę (z nagłówkami kolumn jako kluczami do listy)? W szczególności moja data.frame to ABC 1 5 4,25 4,5 2 3,5 4 2,5 3 3,25 4 4 4 4,25 4,5 2,25 5 1,5 4,5 3 Chcę uzyskać …

103 r indexing dataframe

8

Czyszczenie wartości „Inf” z ramki danych R.

W R mam operację, która tworzy pewne Infwartości, gdy przekształcam ramkę danych. Chciałbym zamienić te Infwartości na NAwartości. Kod, który mam, jest wolny w przypadku dużych danych, czy istnieje szybszy sposób na zrobienie tego? Powiedzmy, że mam następującą ramkę danych: dat <- data.frame(a=c(1, Inf), b=c(Inf, 3), d=c("a","b")) W jednym przypadku …

103 r dataframe data.table

2

Obiekt „DataFrame” nie ma atrybutu „sort”

Mam tu jakiś problem, w moim pakiecie Pythona zainstalowałem numpy, ale nadal mam ten błąd Obiekt „DataFrame” nie ma atrybutu „sort” Każdy może dać mi jakiś pomysł .. To jest mój kod: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final = final.iloc[1:].reset_index(drop=True) …

103 python pandas numpy dataframe

5

Jak zamienić tekst w kolumnie ramki danych Pandas?

Mam taką kolumnę w mojej ramce danych: range "(2,30)" "(50,290)" "(400,1000)" ... i chcę zamienić ,przecinek na -myślnik. Obecnie używam tej metody, ale nic się nie zmienia. org_info_exc['range'].replace(',', '-', inplace=True) Czy ktoś może pomóc?

103 python replace pandas dataframe

3

Python Pandas zamienia NaN w jednej kolumnie wartością z odpowiedniego wiersza drugiej kolumny

Pracuję z tym DataFrame Pandas w Pythonie. File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT 106 …

103 python pandas dataframe nan fillna

9

Przenieś kolumnę według nazwy na początek tabeli w pandach

Oto mój df: Net Upper Lower Mid Zsore Answer option More than once a day 0% 0.22% -0.12% 2 65 Once a day 0% 0.32% -0.19% 3 45 Several times a week 2% 2.45% 1.10% 4 78 Once a week 1% 1.63% -0.40% 6 65 Jak mogę przenieść kolumnę według …

103 python pandas move dataframe shift

5

jak zmienić kolumnę Dataframe z typu String na typ Double w pyspark

Mam ramkę danych z kolumną jako ciągiem. Chciałem zmienić typ kolumny na Double type w PySpark. Oto droga, którą zrobiłem: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Chciałem tylko wiedzieć, czy to właściwy sposób, aby to zrobić, ponieważ podczas przechodzenia przez regresję logistyczną dostaję jakiś błąd, więc zastanawiam się, …

102 python apache-spark dataframe pyspark apache-spark-sql

6

Konwertuj ramkę danych pandy na serię

Jestem trochę nowy w pandach. Mam ramkę danych pandy, która ma 1 wiersz na 23 kolumny. Chcę przekształcić to w serię? Zastanawiam się, jaki jest najbardziej pytoniczny sposób na zrobienie tego? Próbowałem, pd.Series(myResults)ale narzeka ValueError: cannot copy sequence with size 23 to array axis with dimension 1. Nie jest wystarczająco …

102 python pandas dataframe series

7

Jak przesunąć kolumnę w Pandas DataFrame

Chciałbym przesunąć kolumnę w Pandach DataFrame, ale nie udało mi się znaleźć metody na zrobienie tego z dokumentacji bez przepisywania całego DF. Czy ktoś wie, jak to zrobić? Ramka danych: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Pożądane wyjście: …

101 python pandas dataframe

5

Jak mogę zmienić nagłówki kolumn Dataframe pandas na małe litery?

Chcę, aby wszystkie nagłówki kolumn w moich ramkach danych pandy były małymi literami Przykład Jeśli mam: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Chciałbym zmienić XRAT na xrat, wykonując coś …

101 python pandas dataframe

Pytania otagowane jako dataframe