Programowanie dataframe

6

Pandy: Jak mogę użyć funkcji Apply () dla pojedynczej kolumny?

Mam ramkę danych pand z dwiema kolumnami. Muszę zmienić wartości pierwszej kolumny bez wpływu na drugą i odzyskać całą ramkę danych ze zmienionymi tylko wartościami pierwszej kolumny. Jak mogę to zrobić za pomocą opcji Zastosuj w pandach?

254 python pandas dataframe python-3.5

9

Tytuł lub nazwa kolumny indeksu Pandy

Jak uzyskać nazwę kolumny indeksu w pandach python? Oto przykładowa ramka danych: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 Próbuję uzyskać / ustawić tytuł indeksu ramki danych. Oto, co próbowałem: import pandas as pd data = {'Column 1' : [1., 2., 3., 4.], 'Index Title' …

254 python pandas dataframe columnname

15

Podziel kolumnę ciągu ramki danych na wiele kolumn

Chciałbym wziąć dane z formularza before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 i użyj split()powyższej kolumny „ type”, aby uzyskać coś takiego: attr type_1 type_2 1 1 foo bar 2 30 foo bar_2 3 4 foo bar …

246 r string dataframe split r-faq

6

Dlaczego moja funkcja „Zastosuj” Pandy nie działa w przypadku wielu kolumn? [Zamknięte]

Zamknięte. To pytanie nie jest powtarzalne lub zostało spowodowane literówkami . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte w zeszłym roku . Popraw to pytanie Mam pewne problemy z funkcją stosowania Pand, gdy używam wielu kolumn z następującą ramką danych …

239 python python-2.7 pandas dataframe apply

13

Połącz dwie ramki danych według wierszy (rbind), jeśli mają różne zestawy kolumn

Czy można powiązać wierszami dwie ramki danych, które nie mają tego samego zestawu kolumn? Mam nadzieję, że zachowam kolumny, które nie pasują po powiązaniu.

232 r dataframe r-faq

12

Pandy otrzymują wiersze, które NIE znajdują się w innych ramkach danych

Mam dwie ramki danych pand, które mają wspólne wiersze. Załóżmy, że ramka danych2 jest podzbiorem ramki danych1. Jak mogę uzyskać wiersze ramki danych 1, których nie ma w ramce danych 2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 …

229 python pandas dataframe

19

Normalizuj kolumny ramki danych pand

Mam ramkę danych w pandach, w których każda kolumna ma inny zakres wartości. Na przykład: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Masz pomysł, jak mogę znormalizować kolumny tej ramki danych, w których każda wartość mieści się w przedziale od 0 do 1? Moje …

226 python pandas dataframe normalize

6

Pobierz indeks kolumny z nazwy kolumny w pandach python

W R, gdy musisz pobrać indeks kolumny na podstawie nazwy kolumny, którą możesz zrobić idx <- which(names(my_data)==my_colum_name) Czy istnieje sposób, aby zrobić to samo z ramkami danych pand?

220 python pandas dataframe indexing

8

Pandy Zamień NaN na pusty / pusty ciąg

Mam ramkę danych Pandas, jak pokazano poniżej: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Chcę usunąć wartości NaN z pustym ciągiem, aby wyglądał tak: 1 2 3 0 a "" read 1 b l unread 2 c "" read

218 python pandas dataframe nan

8

Zaktualizuj ramkę danych w pandach podczas iteracji rząd po rzędzie

Mam ramkę danych pand, która wygląda tak (jest to dość duża) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American M 528.205 2014-04-19 1096 2014-03-17 American M 528.205 2014-05-17 teraz chciałbym iterować wiersz …

214 python pandas updates dataframe

7

Jaka jest różnica między łączeniem i łączeniem w Pandach?

Załóżmy, że mam dwie takie ramki danych: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Chcę je scalić, więc próbuję czegoś takiego: pd.merge(left, right, left_on='key1', right_on='key2') I cieszę się key1 lval key2 rval 0 foo 1 foo 4 1 bar 2 bar …

208 python pandas dataframe join

7

Pandy grupowane i sumowane

Używam tej ramki danych: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 …

205 python pandas dataframe group-by aggregate

13

Jak wyświetlić pełną zawartość kolumny w ramce danych Spark?

Korzystam z Spark-CSV do ładowania danych do DataFrame. Chcę zrobić proste zapytanie i wyświetlić zawartość: val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv") df.registerTempTable("tasks") results = sqlContext.sql("select col from tasks"); results.show() Col wydaje się być obcięty: scala> results.show(); +--------------------+ | col| +--------------------+ |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 …

201 apache-spark dataframe spark-csv output-formatting

20

Podziel (rozbij) pandas ciąg danych ramki danych do oddzielnych wierszy

Mam pandas dataframew którym jedna kolumna ciągów tekstowych zawiera wartości oddzielone przecinkami. Chcę podzielić każde pole CSV i utworzyć nowy wiersz dla każdego wpisu (załóżmy, że CSV są czyste i trzeba je tylko podzielić na „,”). Na przykład apowinien stać się b: In [7]: a Out[7]: var1 var2 0 a,b,c …

200 python pandas numpy dataframe

17

Wykrywanie i wykluczanie wartości odstających w ramce danych Pandas

Mam ramkę danych pand z kilkoma kolumnami. Teraz wiem, że niektóre wiersze są wartościami odstającymi na podstawie określonej wartości kolumny. Na przykład kolumna „Vol” ma wszystkie wartości wokół, 12xxa jedna wartość to 4000(odstająca). Teraz chciałbym wykluczyć te wiersze, które mają Vol taką kolumnę. Zasadniczo więc muszę umieścić filtr w ramce …

198 python pandas filtering dataframe outliers

Pytania otagowane jako dataframe