Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

15
Konstruowanie pand DataFrame z wartości w zmiennych daje „ValueError: Jeśli używasz wszystkich wartości skalarnych, musisz przekazać indeks”
To może być proste pytanie, ale nie mogę wymyślić, jak to zrobić. Powiedzmy, że mam dwie zmienne w następujący sposób. a = 2 b = 3 Chcę zbudować DataFrame z tego: df2 = pd.DataFrame({'A':a,'B':b}) To generuje błąd: ValueError: Jeśli używasz wszystkich wartości skalarnych, musisz przekazać indeks Próbowałem tego także: df2 …

12
Jak zastosować funkcję do dwóch kolumn ramki danych Pandas
Załóżmy, że mam dfco ma kolumny 'ID', 'col_1', 'col_2'. I definiuję funkcję: f = lambda x, y : my_function_expression. Teraz chcę zastosować fdo df„s dwie kolumny 'col_1', 'col_2'do elementu mądry obliczy nową kolumnę 'col_3', trochę jak: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments (1 …
368 python  pandas  dataframe 

6
Wartość prawdy serii jest niejednoznaczna. Użyj a.empty, a.bool (), a.item (), a.any () lub a.all ()
Problem z filtrowaniem wynikowej ramki danych z orwarunkiem. Chcę, aby mój wynik dfwyodrębnił wszystkie varwartości kolumn powyżej 0,25 i poniżej -0,25. Ta logika poniżej daje mi dwuznaczną wartość prawdy, jednak działa, gdy podzielę filtrowanie na dwie osobne operacje. Co tu się dzieje? nie wiem, gdzie użyć sugerowanego a.empty(), a.bool(), a.item(),a.any() …

10
Wyodrębnianie określonych kolumn z ramki danych
Mam ramkę danych R z 6 kolumnami i chcę utworzyć nową ramkę danych, która ma tylko trzy kolumny. Zakładając mój ramkę danych jest dfi chcę, aby wyodrębnić kolumn A, BorazE jest to tylko dowodzić mogę dowiedzieć się: data.frame(df$A,df$B,df$E) Czy istnieje bardziej kompaktowy sposób na zrobienie tego?
365 r  dataframe  r-faq 

15
Jak zsumować zmienną według grupy
Mam ramkę danych z dwiema kolumnami. Pierwsza kolumna zawiera kategorie takie jak „Pierwsza”, „Druga”, „Trzecia”, a druga kolumna zawiera liczby reprezentujące liczbę wyświetleń określonych grup z „Kategorii”. Na przykład: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 Chcę posortować dane według kategorii …
357 r  dataframe  aggregate  r-faq 

17
Konwertuj kolumny data.frame ze współczynników na znaki
Mam ramkę danych. Zadzwońmy do niego bob: > head(bob) phenotype exclusion GSM399350 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399351 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399352 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399353 3- 4- …
352 r  dataframe 

11
Jak uzyskać wartość z komórki ramki danych?
Skonstruowałem warunek, który wyodrębnia dokładnie jeden wiersz z mojej ramki danych: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Teraz chciałbym wziąć wartość z konkretnej kolumny: val = d2['col_name'] Ale w rezultacie otrzymuję ramkę danych, która zawiera jeden wiersz i jedną kolumnę ( tj. Jedną komórkę). Nie tego potrzebuję. …
345 python  pandas  dataframe 

9
Konwertuj listę ramek danych na jedną ramkę danych
Mam kod, który w jednym miejscu kończy się listą ramek danych, które naprawdę chcę przekonwertować na pojedynczą ramkę dużych danych. Dostałem kilka wskazówek z wcześniejszego pytania, które próbowało zrobić coś podobnego, ale bardziej złożonego. Oto przykład tego, od czego zaczynam (jest to rażąco uproszczone dla ilustracji): listOfDataFrames <- vector(mode = …
336 list  r  dataframe 


14
pandy: filtruj wiersze DataFrame z łańcuchem operatorów
Większość operacji w pandasmoże być dokonany z operatorem łączenia ( groupby, aggregate, applyitp), ale jedynym sposobem mam stwierdzono rzędów filtrów odbywa się za pomocą zwykłego zamka indeksowania df_filtered = df[df['column'] == value] Jest to nieprzyjemne, ponieważ wymaga przypisania dfdo zmiennej, zanim będę mógł filtrować jej wartości. Czy jest coś podobnego …
329 python  pandas  dataframe 



7
Pandas read_csv low_memory i dtype opcje
Dzwoniąc df = pd.read_csv('somefile.csv') Dostaję: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Kolumny (4,5,7,16) mają różne typy. Podaj opcję dtype podczas importu lub ustaw low_memory = False. Dlaczego dtypeopcja jest powiązana low_memoryi dlaczego miałaby Falsepomóc w rozwiązaniu tego problemu?

11
Jak przechowywać ramkę danych za pomocą Pand
Obecnie CSVza każdym razem, gdy uruchamiam skrypt, importuję dość dużą ramkę danych. Czy istnieje dobre rozwiązanie, aby utrzymywać tę ramkę danych stale dostępną między uruchomieniami, aby nie musiałem spędzać całego czasu na czekaniu na uruchomienie skryptu?
317 python  pandas  dataframe 


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.