Pytania otagowane jako group-by

GROUP BY to polecenie w standardzie relacyjnej bazy danych SQL służące do zwijania grupy wierszy, które mają wspólne wartości pól w jeden wiersz. Funkcje agregujące można wykonywać na innych polach w grupie, takich jak SUMA () lub ŚREDNIA (), w celu zestawienia powiązanych danych w jedną wartość.


2
Grupa Pandy według zakresu wartości
Czy w pandach istnieje łatwa metoda wywoływania groupbyz zakresu przyrostów wartości? Na przykład, biorąc pod uwagę poniższy przykład, mogę podzielić i pogrupować kolumnę Bz 0.155przyrostem, aby na przykład pierwsza para grup w kolumnie była Bpodzielona na zakresy między '0 - 0,155, 0,155 - 0,31 ...' import numpy as np import …

6
Jak grupować według tygodni w MySQL?
Oferty serwerowe tabeli Oracle wbudowany funkcji TRUNC(timestamp,'DY'). Ta funkcja konwertuje dowolny znacznik czasu na północ w poprzednią niedzielę. Jaki jest najlepszy sposób na zrobienie tego w MySQL? Oracle oferuje również TRUNC(timestamp,'MM')konwersję sygnatury czasowej na północ pierwszego dnia miesiąca, w którym występuje. W MySQL ten jest prosty: TIMESTAMP(DATE_FORMAT(timestamp, '%Y-%m-01')) Ale ta …




5
Czy kolejność kolumn ma znaczenie w klauzuli group by?
Jeśli mam dwie kolumny, jedną o bardzo wysokiej liczności, a drugą o bardzo małej liczności (unikalna liczba wartości), czy ma znaczenie, w jakiej kolejności grupuję? Oto przykład: select dimensionName, dimensionCategory, sum(someFact) from SomeFact f join SomeDim d on f.dimensionKey = d.dimensionKey group by d.dimensionName, -- large number of unique values …


2
Jak utworzyć nową kolumnę na podstawie danych wyjściowych pandy groupby (). Sum ()?
Próbuję utworzyć nową kolumnę z groupbyobliczeń. W poniższym kodzie otrzymuję poprawne obliczone wartości dla każdej daty (patrz grupa poniżej), ale kiedy próbuję utworzyć nową kolumnę ( df['Data4']) za jej pomocą, otrzymuję NaN. Więc próbuję utworzyć nową kolumnę w ramce danych z sumą Data3wszystkich dat i zastosować ją do każdego wiersza …

5
Python Pandas Jak przypisać wyniki operacji grupowania z powrotem do kolumn w nadrzędnej ramce danych?
Mam następującą ramkę danych w IPythonie, gdzie każdy wiersz jest pojedynczą akcją: In [261]: bdata Out[261]: <class 'pandas.core.frame.DataFrame'> Int64Index: 21210 entries, 0 to 21209 Data columns: BloombergTicker 21206 non-null values Company 21210 non-null values Country 21210 non-null values MarketCap 21210 non-null values PriceReturn 21210 non-null values SEDOL 21210 non-null values …

1
Ogromna różnica w wydajności podczas korzystania z grupowania według i odrębnych
Przeprowadzam testy na HSQLDBserwerze z tabelą zawierającą 500 000 wpisów. Tabela nie zawiera indeksów. Istnieje 5000 różnych kluczy biznesowych. Potrzebuję ich listy. Oczywiście zacząłem od DISTINCTzapytania: SELECT DISTINCT business_key FROM memory WHERE concept <> 'case' or attrib <> 'status' or value <> 'closed' Zajmuje to około 90 sekund !!! Następnie …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.