Połączenie ECMP (lub innych przyczyn ścieżek asymetrycznych) i HSRP jest domyślnie zepsute w Cisco IOS; domyślne zachowanie w tym projekcie nadmiernie zalewa ruch emisji pojedynczej.
Jaka jest najlepsza praktyka stosowania HSRP z ECMP w celu zapobiegania powodziom nieznanej emisji pojedynczej?
Szczegóły / Tło
Dla wielu naszych obiektów mamy topologię HSRP podobną do pierwszego diagramu poniżej. Nasze routery WAN Cisco mają takie same trasy do wszystkich innych witryn; dlatego możemy cały czas widzieć asymetryczne efekty routingu. Zwykle przypisujemy R1 jako główny HSRP, ale ECMP zezwala na ruch powrotny przez R1 lub R2.
Problem polega na tym, że gdy PC1 montuje zdalny napęd iSCSI w sieci WAN, ruch opuszcza witrynę przez R1, ale może powrócić przez R2. Dopóki ruch iSCSI wraca przez R1, nie ma żadnych problemów.
Problem występuje, gdy ruch PC1 powraca przez R2. Załóżmy, że sesja iSCSI rozpoczyna się o 8:00:00, a oba routery i oba przełączniki uczą się jednocześnie komputera Mac PC1. Pomiędzy 8:00:00 a 8:00:05 nie występują problemy z zalaniem, ponieważ oba przełączniki nadal mają adres mac PC1 w tabeli CAM.
Pięć minut po rozpoczęciu sesji iSCSI wpis CAM S2 dla komputera Mac PC1 wygasa z tabeli CAM, a S2 zalewa ruch PC1 ze wszystkich portów (w tym przypadku do Po1, Gi0 / 3 i Gi0 / 4). Jeśli sesja iSCSI PC1 zużywa dużo przepustowości, to nieznane zalewanie emisji pojedynczej może wyssać nietrywialną pojemność z łączy do PC3 i PC4.
Przełączniki Cisco IOS mają domyślny zegar CAM wynoszący 300 sekund ...
S2# show mac address-table aging-time
Vlan Aging Time
---- ----------
1 300
17 300
Jednak domyślny zegar ARP interfejsu Cisco IOS to 4 godziny ...
R2# show interface gi0/0
GigabitEthernet0/0 is up, line protocol is up
Hardware is AmdP2, address is 000a.dead.beef (bia 000a.dead.beef)
Internet address is 172.17.1.252/24
MTU 1500 bytes, BW 10000 Kbit, DLY 1000 usec,
reliability 255/255, txload 1/255, rxload 1/255
Encapsulation ARPA, loopback not set
Keepalive set (10 sec)
ARP type: ARPA, ARP Timeout 04:00:00 <--------------
Dlatego S2 zaczyna zalewać ruch iSCSI na PC1 po pięciu minutach.