Jak już wspomniano, kompilator JIT (just-in-time) może zoptymalizować pustą pętlę, aby usunąć niepotrzebne iteracje. Ale jak?
W rzeczywistości istnieją dwa kompilatory JIT: C1 i C2 . Najpierw kod jest kompilowany za pomocą C1. C1 zbiera statystyki i pomaga JVM odkryć, że w 100% przypadków nasza pusta pętla niczego nie zmienia i jest bezużyteczna. W tej sytuacji na scenę wkracza C2. Gdy kod jest wywoływany bardzo często, można go zoptymalizować i skompilować za pomocą C2 przy użyciu zebranych statystyk.
Jako przykład przetestuję następny fragment kodu (mój JDK jest ustawiony na wersję 9-wewnętrzną slowdebug ):
public class Demo {
private static void run() {
for (int i = Integer.MIN_VALUE; i < Integer.MAX_VALUE; i++) {
}
System.out.println("Done!");
}
}
Z następującymi opcjami wiersza poleceń:
-XX:+UnlockDiagnosticVMOptions -XX:CompileCommand=print,*Demo.run
Istnieją różne wersje mojej metody uruchamiania , skompilowane odpowiednio z C1 i C2. U mnie ostateczny wariant (C2) wygląda mniej więcej tak:
...
; B1: # B3 B2 <- BLOCK HEAD IS JUNK Freq: 1
0x00000000125461b0: mov dword ptr [rsp+0ffffffffffff7000h], eax
0x00000000125461b7: push rbp
0x00000000125461b8: sub rsp, 40h
0x00000000125461bc: mov ebp, dword ptr [rdx]
0x00000000125461be: mov rcx, rdx
0x00000000125461c1: mov r10, 57fbc220h
0x00000000125461cb: call indirect r10 ; *iload_1
0x00000000125461ce: cmp ebp, 7fffffffh ; 7fffffff => 2147483647
0x00000000125461d4: jnl 125461dbh ; jump if not less
; B2: # B3 <- B1 Freq: 0.999999
0x00000000125461d6: mov ebp, 7fffffffh ; *if_icmpge
; B3: # N44 <- B1 B2 Freq: 1
0x00000000125461db: mov edx, 0ffffff5dh
0x0000000012837d60: nop
0x0000000012837d61: nop
0x0000000012837d62: nop
0x0000000012837d63: call 0ae86fa0h
...
Jest trochę brudny, ale jeśli przyjrzysz się uważnie, możesz zauważyć, że nie ma tu długiej pętli. Istnieją 3 bloki: B1, B2 i B3, a etapy wykonania mogą być B1 -> B2 -> B3
lub B1 -> B3
. Gdzie Freq: 1
- znormalizowana szacowana częstotliwość wykonywania bloku.
javap -v
aby zobaczyć.