Programowanie dataframe

9

Zastąp nieprawidłowe wartości wartością Brak w Pandas DataFrame

Czy istnieje metoda zastępowania wartości Nonew Pandas w Pythonie? Możesz użyć df.replace('pre', 'post')i zastąpić wartość inną, ale nie można tego zrobić, jeśli chcesz zastąpić Nonewartość, co jeśli spróbujesz, otrzymasz dziwny wynik. Oto przykład: df = DataFrame(['-',3,2,5,1,-5,-1,'-',9]) df.replace('-', 0) co zwraca pomyślny wynik. Ale, df.replace('-', None) co zwraca następujący wynik: 0 …

80 python pandas dataframe replace nan

6

Usuń / przycinaj wszystkie ciągi ramki danych

Czyszczenie wartości ramki danych typu multitype w python / pandas, chcę przyciąć ciągi. Obecnie robię to w dwóch instrukcjach: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$', '', regex=True, inplace=True) #end df.values To jest dość powolne, co mogę …

80 python regex pandas dataframe trim

10

Jak wydrukować (na papier) ładnie sformatowaną ramkę danych

Chciałbym wydrukować ładnie sformatowane ramki danych na papierze, najlepiej z poziomu skryptu. (Próbuję zbierać dane za pomocą instrumentu i automatycznie przetwarzać je i drukować za pomocą skryptu R). W tej chwili mogę zapisać ramkę danych do pliku tekstowego za pomocą write.table(), ale ma to dwa problemy: Wynikowy plik tekstowy jest …

80 r dataframe formatting

3

Utwórz plik data.frame, w którym kolumna jest listą

Wiem, jak dodać kolumnę listy: > df <- data.frame(a=1:3) > df$b <- list(1:1, 1:2, 1:3) > df a b 1 1 1 2 2 1, 2 3 3 1, 2, 3 To działa, ale nie: > df <- data.frame(a=1:3, b=list(1:1, 1:2, 1:3)) Error in data.frame(1L, 1:2, 1:3, check.names = FALSE, …

80 r list dataframe

7

Dodaj nową kolumnę do ramki danych na podstawie słownika

Mam ramkę danych i słownik. Muszę dodać nową kolumnę do ramki danych i obliczyć jej wartości na podstawie słownika. Uczenie maszynowe, dodanie nowej funkcji opartej na niektórych tabelach: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' : [1, …

23 python pandas dataframe dictionary

5

Rozpakować i zwrócić wartość liczy się dla każdej zmiennej?

Mam ramkę danych, która rejestruje odpowiedzi 19717 osób na wybór języków programowania za pomocą pytań wielokrotnego wyboru. Pierwsza kolumna to oczywiście płeć respondenta, a reszta to wybory, które wybrali. Dlatego jeśli wybiorę Python, moja odpowiedź zostanie zapisana w kolumnie Python, a nie bash i odwrotnie. ID Gender Python Bash R …

19 python pandas dataframe

4

Wydajne porównywanie list w dwóch kolumnach pod kątem wierszy

Jeśli masz ramkę danych Pandas taką jak ta: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc Ale mając około …

16 python pandas numpy dataframe

3

Uzyskaj najbliższą odległość dzięki dwóm ramkom geodezyjnym w pandach

Oto moja pierwsza geobramka: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) Miasto 1 …

14 python pandas dataframe geolocation geopandas

4

Oblicz procent podobnych wartości w ramce danych pandy

Mam jedną ramkę danych dfz dwiema kolumnami: Skrypt (z tekstem) i Głośnik Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 I mam następującą listę: L = ['a','b','c'] Za pomocą następującego kodu df = (df.set_index('Speaker')['Script'].str.findall('|'.join(L)) .str.join('|') …

14 python python-3.x pandas dataframe

3

Dlaczego przypisywanie za pomocą [:] kontra iloc [:] daje różne wyniki w pandach?

Jestem tak pomylony z różnymi metodami indeksowania ilocużywanymi w pandach. Powiedzmy, że próbuję przekonwertować ramkę danych 1-d na ramkę danych 2-d. Najpierw mam następującą 1-d ramkę danych a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T Zamierzam przekonwertować to na 2-d ramkę danych o rozmiarze 2x4. Zaczynam od przygotowania dwuwymiarowej ramki danych w …

13 python pandas dataframe

3

Powolne pandy DataFrame MultiIndex reindex

Mam pand DataFrame formularza: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 2019-12-01 00:51:14+00:00 114430 19 …

13 python pandas numpy dataframe

1

Jak obrócić ramkę danych składającą się z kolumny z sekcją i podsekcją w R.

Mam niżej wymienioną ramkę danych: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", "RE", …

12 r dataframe dplyr tidyverse tidyr

2

Generuj filtrowane binarne produkty kartezjańskie

Opis problemu Szukam wydajnego sposobu generowania pełnych binarnych produktów kartezjańskich (tabele ze wszystkimi kombinacjami prawdy i fałszu z pewną liczbą kolumn), filtrowane według określonych warunków wyłączności. Na przykład dla trzech kolumn / bitów n=3otrzymalibyśmy pełną tabelę df_combs = pd.DataFrame(itertools.product(*([[True, False]] * n))) 0 1 2 0 True True True 1 …

12 python pandas dataframe

5

Dodaj identyfikator znaleziony na liście do nowej kolumny w ramce danych pandy

Powiedzmy, że mam następującą ramkę danych (kolumna liczb całkowitych i kolumna z listą liczb całkowitych) ... ID Found_IDs 0 12345 [15443, 15533, 3433] 1 15533 [2234, 16608, 12002, 7654] 2 6789 [43322, 876544, 36789] A także osobna lista identyfikatorów ... bad_ids = [15533, 876544, 36789, 11111] Biorąc to pod uwagę …

11 python python-3.x pandas dataframe

1

Jak usunąć wartości zerowe z dynamicznej pętli generowanej z Pythona?

Mam taką ramkę danych: ORDER_NO 2401 2504 2600 2020020 2019-12-04 2019-12-10 2019-12-12 2020024 2019-12-25 NaN 2019-12-20 2020034 NaN NaN 2019-12-20 2020020 2019-12-12 2019-12-15 2019-12-18 Tworzę XML z powyższej ramki danych. Chcę usunąć pustą wartość w XML. Mój kod powinien upuścić tę konkretną wartość kolumny i wiersza z XML. Mój kod …

11 python-3.x pandas loops dataframe itertools

Pytania otagowane jako dataframe