Używam dwugłowicowego NAS wspieranego przez ZFS do współdzielonej pamięci masowej klastra o wysokiej dostępności, w oparciu o architekturę zalecaną przez Nexenta, jak pokazano tutaj:
Dyski w 1 JBOD będą przechowywać pliki bazy danych dla pojedynczej bazy danych Postgres o wielkości 4 TB, a dyski w drugim JBOD przechowują 20 TB dużych surowych plików binarnych płaskich (wyniki klastrów dla symulacji kolizji dużych obiektów gwiazdowych). Innymi słowy, JBOD wspierający pliki Postgres będzie obsługiwał głównie losowe obciążenia, podczas gdy JBOD wspierający wyniki symulacji będzie obsługiwał głównie obciążenia szeregowe. Oba węzły główne mają 256 GB pamięci i 16 rdzeni. Klaster ma około 200 rdzeni, z których każdy utrzymuje sesję Postgres, więc oczekuję około 200 równoczesnych sesji.
Zastanawiam się, czy mądrze jest w mojej konfiguracji, aby węzły główne ZFS działały jednocześnie jako dublowana para serwerów bazy danych Postgres dla mojego klastra? Jedyne wady, które widzę to:
- Mniejsza elastyczność skalowania mojej infrastruktury.
- Nieco niższy poziom redundancji.
- Ograniczona pamięć i zasoby procesora dla Postgres.
Widzę jednak tę zaletę, że ZFS jest dość głupi, jeśli chodzi o automatyczne przełączanie awaryjne i nie muszę poświęcać dużo pracy na to, aby każdy serwer bazy danych Postgres zorientował się, czy wystąpił awaria węzła głównego, ponieważ ulegnie awarii wraz z głową węzeł.
postmaster.pid
) spowodują poważne uszkodzenie danych.