Jak interpretować wyniki nakładki intel-gpu-top i intel-gpu-overlay?


10

Mam te polecenia skompilowane i uruchomione, ale ich treść jest dla mnie trochę tajemnicą.

Procesy z intel-gpu-overlayodczytu coś takiego: 15R, 16B, 41ms waits. Co to jest R, co to B, co oznacza ten czas oczekiwania?

Ma procesor: 152% (domyślam się, że to to samo, co otrzymuję od góry). render: 32%, strumień bitów: 6%, blt: 6%. Jakiego rodzaju kod spowodowałby, że wartości te zawęziłyby gardło i jakie byłoby zachowanie systemu, gdyby tak się stało?

Oto próbka intel-gpu-top:

               render busy:  23%: ████▋                                  render space: 12/16384

                      task  percent busy
                       GAM:  29%: █████▉                  vert fetch: 1380772913 (5386667/sec)
                        CS:  23%: ████▋                   prim fetch: 350972637 (1368891/sec)
                      GAFS:   9%: █▉                   VS invocations: 1375586768 (5385212/sec)
                       TSG:   8%: █▋                   GS invocations: 0 (0/sec)
                       VFE:   7%: █▌                        GS prims: 0 (0/sec)
                       SVG:   3%: ▋                    CL invocations: 677098924 (2648400/sec)
                        VS:   3%: ▋                         CL prims: 682224019 (2663834/sec)
                      URBM:   2%: ▌                    PS invocations: 9708568482932 (34396218804/sec)
                        VF:   2%: ▌                    PS depth pass: 15549624948405 (58732230331/sec)
                       SDE:   0%:                      
                        CL:   0%:                      
                        SF:   0%:                      
                       TDG:   0%:                      
                        RS:   0%:                      
                      GAFM:   0%:                      
                       SOL:   0%:

1
Oto całkiem dobra odpowiedź na temat stackoverflow, może po prostu to zamknąć: stackoverflow.com/questions/28876242/…
mpr

Dlaczego mielibyście to zamknąć, czy nie jesteście tu godni tak pochlebnej odpowiedzi?
George Udosen

Odpowiedzi:


4

Zaczerpnięte z linku podanego w komentarzach w OP.

Byłem także ciekawy, więc oto kilka rzeczy, które mogłem pobrać z podręczników . Interesujące jest również źródło intel-gpu-tools , a zwłaszcza lib/instdone.copisujące to, co może pojawić się we wszystkich modelach procesorów graficznych Intel. Ta łatka była również niezwykle pomocna w tłumaczeniu wszystkich tych akronimów!

Niektórzy mogą się mylić, uwielbiam, jeśli ktoś bardziej kompetentny mógłby wejść do środka! Wrócę, aby zaktualizować odpowiedź o więcej, gdy się tego nauczę.

Po pierwsze, trzy linie po prawej:

  • Przestrzeń renderowania jest prawdopodobnie wykorzystywana przez zwykłe operacje 3D.
  • Od Google'a, strumień bitów wydaje się dotyczyć dekodowania dźwięku? Jest to dość ogólny termin, więc trudno go znaleźć w zapytaniu. Nie pojawia się jednak na moim GPU (Skylake HD 530), więc może nie być wszędzie.
  • Blittera opisano w obj. 11 i wydaje się odpowiedzialny za przyspieszenie sprzętowe operacji 2D (blitting).

Jednostki potokowe o stałej funkcji (FF) (oldschoolowe układy GPU):

  • VF: moduł pobierania wierzchołków (vol. 1), pierwsza jednostka FF w potoku 3D odpowiedzialna za pobieranie danych wierzchołków z pamięci.
  • VS: Vertex Shader (vol.1), oblicza rzeczy na wierzchołkach każdej operacji podstawowej narysowanej przez GPU. Całkiem standardowa operacja na GPU.
  • HS: Hull Shader
  • TE: Silnik teselacji
  • DS: Domain Shader
  • GS: Moduł cieniujący geometrię
  • SOL: Logika wyjściowa strumienia
  • CL: Clip Unit
  • SF: Strips and Fans (vol.1), jednostka FF, której główną funkcją jest rozkład pierwotnych topologii, takich jak paski i wentylatory, na prymitywy lub obiekty.

Jednostki stosowane do wątku i zarządzania rurociągu, dla obu jednostek FF i GPGPU (patrz Intel HD Graphics Open Source Programiści Podręcznik dla wielu z informacją o tym, jak to wszystko działa):

  • CS: Command Streamer (vol.1), jednostka funkcjonalna silnika przetwarzania grafiki, która pobiera polecenia, analizuje je i kieruje do odpowiedniego potoku.
  • TDG: Dyspozytor wątków
  • VFE: Interfejs wideo
  • TSG: Thread Spawner
  • URBM: Unified Return Buffer Manager

Inne rzeczy :

  • GAM: patrz GFX Page Walker (vol. 5), zwany także Memory Arbiter , ma związek z tym, jak GPU śledzi strony pamięci, wydaje się dość podobny do tego, co TLB (patrz także SLAT ) robi dla twojej pamięci RAM.
  • SDE: South Display Engine ; według vol. 12, „South Display Engine obsługuje wykrywanie Hot Plug, GPIO, GMBUS, sekwencjonowanie zasilania panelu i modulację podświetlenia”.

Kredyty:

StackOverflow User F.X.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.