każdy. Czy ktoś może mi pomóc w następujących kwestiach? Wszelkie wskazówki lub pomoc są mile widziane!
Mam podzbiór zestawu danych z +500 000 wierszy, który wygląda następująco
|— Group —|— Name —|— Value1 —|— Value2 —|
W ramach każdej grupy próbuję zidentyfikować nazwy w pierwszej piątce i górnym 10 percentylu wartości 1 , aby móc przystąpić do obliczania sumy wartości 2 dla każdego zidentyfikowanego percentyla.
Do tej pory udało mi się stworzyć tabelę przestawną, która wygląda tak.
|----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------| Totals for GroupA
|----------|-Name A1--| Values.......
|----------|-Name A2--| Values.......
...
|----------|-Name An--| Values.......
|--GroupB--|----------| Totals for GroupB
... Values.......
|--GroupZ--|----------| Totals for GroupZ
Mógłbym ręcznie zidentyfikować percentyle, ale wyobrażam sobie, że istnieje łatwiejszy sposób. Przeprowadziłem kilka wyszukiwań dotyczących tego, jak postępować, ale spotykam tylko procedury, aby znaleźć percentyle w całym zbiorze danych.
SUMIF
) i percentyla ( LARGE
, SUMIFS
).