Wynika to z połączenia cech nowoczesnych procesorów.
Pierwszą rzeczą, która przyczynia się do wysokiego IPS, jest fakt, że nowoczesne procesory mają wiele jednostek wykonawczych, które mogą działać niezależnie. Na poniższym obrazku (pożyczonym z Wikipedii: Intel Core Microarchitecture ) na dole widać, że jest osiem jednostek wykonawczych (pokazanych na żółto), które mogą wykonywać wszystkie instrukcje jednocześnie. Nie wszystkie z tych jednostek mogą zapewnić takie same instrukcje, ale co najmniej 5 z nich może wykonać operację ALU, a istnieją trzy jednostki obsługujące SSE.
Połączenie tego z długim potokiem instrukcji, który może efektywnie układać instrukcje gotowe dla tych jednostek do wykonania instrukcji ( w razie potrzeby poza kolejnością ) oznacza, że nowoczesny procesor może mieć dużą liczbę instrukcji w dowolnym momencie.
Wykonanie każdej instrukcji może zająć kilka cykli zegara, ale jeśli możesz skutecznie zrównoleglić ich wykonanie, możesz znacznie zwiększyć wydajność IPS kosztem złożoności procesora i wydajności cieplnej.
Utrzymywanie tych dużych rurociągów pełnych instrukcji wymaga również dużej pamięci podręcznej, która może być wstępnie wypełniona instrukcjami i danymi. Wpływa to na wielkość matrycy, a także ilość ciepła wytwarzanego przez procesor.
Powodem tego nie jest w przypadku mniejszych procesorów, ponieważ znacznie zwiększa to logikę sterowania wymaganą wokół rdzeni przetwarzających, a także ilość wymaganej przestrzeni, a także wytwarzanego ciepła. Jeśli potrzebujesz małego, niskiego poboru mocy, szybko reagującego procesora, to potrzebujesz krótkiego potoku bez zbyt wielu „dodatkowych” elementów otaczających rzeczywiste rdzenie funkcjonalne. Zazwyczaj minimalizują pamięć podręczną, ograniczają ją do tylko jednego rodzaju każdego rodzaju jednostki wymaganej do przetwarzania instrukcji i zmniejszają złożoność każdej części.
Że może wykonać mały procesor tak złożone, jak i w większym procesorze osiągnąć podobną wydajność, ale wówczas pobór mocy i chłodzenia będzie gwałtownie wzrosła.