Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.


9
Tytuł lub nazwa kolumny indeksu Pandy
Jak uzyskać nazwę kolumny indeksu w pandach python? Oto przykładowa ramka danych: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 Próbuję uzyskać / ustawić tytuł indeksu ramki danych. Oto, co próbowałem: import pandas as pd data = {'Column 1' : [1., 2., 3., 4.], 'Index Title' …

15
Podziel kolumnę ciągu ramki danych na wiele kolumn
Chciałbym wziąć dane z formularza before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 i użyj split()powyższej kolumny „ type”, aby uzyskać coś takiego: attr type_1 type_2 1 1 foo bar 2 30 foo bar_2 3 4 foo bar …
246 r  string  dataframe  split  r-faq 

6
Dlaczego moja funkcja „Zastosuj” Pandy nie działa w przypadku wielu kolumn? [Zamknięte]
Zamknięte. To pytanie nie jest powtarzalne lub zostało spowodowane literówkami . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte w zeszłym roku . Popraw to pytanie Mam pewne problemy z funkcją stosowania Pand, gdy używam wielu kolumn z następującą ramką danych …



19
Normalizuj kolumny ramki danych pand
Mam ramkę danych w pandach, w których każda kolumna ma inny zakres wartości. Na przykład: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Masz pomysł, jak mogę znormalizować kolumny tej ramki danych, w których każda wartość mieści się w przedziale od 0 do 1? Moje …




7
Jaka jest różnica między łączeniem i łączeniem w Pandach?
Załóżmy, że mam dwie takie ramki danych: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Chcę je scalić, więc próbuję czegoś takiego: pd.merge(left, right, left_on='key1', right_on='key2') I cieszę się key1 lval key2 rval 0 foo 1 foo 4 1 bar 2 bar …
208 python  pandas  dataframe  join 

7
Pandy grupowane i sumowane
Używam tej ramki danych: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 …

13
Jak wyświetlić pełną zawartość kolumny w ramce danych Spark?
Korzystam z Spark-CSV do ładowania danych do DataFrame. Chcę zrobić proste zapytanie i wyświetlić zawartość: val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv") df.registerTempTable("tasks") results = sqlContext.sql("select col from tasks"); results.show() Col wydaje się być obcięty: scala> results.show(); +--------------------+ | col| +--------------------+ |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 …


17
Wykrywanie i wykluczanie wartości odstających w ramce danych Pandas
Mam ramkę danych pand z kilkoma kolumnami. Teraz wiem, że niektóre wiersze są wartościami odstającymi na podstawie określonej wartości kolumny. Na przykład kolumna „Vol” ma wszystkie wartości wokół, 12xxa jedna wartość to 4000(odstająca). Teraz chciałbym wykluczyć te wiersze, które mają Vol taką kolumnę. Zasadniczo więc muszę umieścić filtr w ramce …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.