Dlaczego Enterprise Storage jest tak drogi?


107

To jest pytanie kanoniczne dotyczące kosztu pamięci masowej dla przedsiębiorstw.
Zobacz także następujące pytanie:

Odnośnie ogólnych pytań, takich jak:

  • Dlaczego muszę płacić 50 dolców miesięcznie za dodatkowy gigabajt miejsca?
  • Na naszym serwerze plików zawsze brakuje miejsca, dlaczego nasz sysadmin po prostu nie wrzuci tam dodatkowego dysku o pojemności 1 TB?
  • Dlaczego sprzęt SAN jest tak drogi?

Odpowiedzi tutaj postarają się lepiej zrozumieć, jak działa pamięć masowa na poziomie przedsiębiorstwa i co wpływa na cenę. Jeśli możesz rozwinąć Pytanie lub podać wgląd w Odpowiedź, napisz.


17
Zamknij wszystkie pytania „Dlaczego przechowywanie jest tak drogie” i wskaż je tutaj.
Mark Henderson

17
Nie ma to być forum reklamowe dla wszystkich, którzy znaleźli tanich dostawców, chodzi tu o nakreślenie „ukrytych” kosztów pamięci masowej na poziomie przedsiębiorstwa.
Mark Henderson

2
Obowiązkowe odniesienie BOFH („Potrzebuję więcej miejsca!”): Bofh.ntk.net/BOFH/0000/bastard01.php
Massimo,

Jim Salter opublikował podział tego, oferując post na blogu Depressing Storage Calculator . Podsumowując: musisz zapewnić gdziekolwiek od 10 do 25 razy więcej pożądanej ilości miejsca do przechowywania przez użytkownika końcowego , w zależności od założeń i wymagań.
CVn

Odpowiedzi:


116
  1. Pojemność dysku twardego serwera jest niewielka w porównaniu do pojemności dysku twardego komputera stacjonarnego. 450 i 600 GB to nierzadkie rozmiary, które można zobaczyć w zupełnie nowych serwerach, i można kupić wiele dysków stacjonarnych SATA 4 TB w cenie jednego dysku twardego SAS (serwer) 600 GB.

  2. Twardy dysk SATA w komputerze stacjonarnym w domu jest jak samochód sportowy Forda, GM, Mercedesa lub innego producenta samochodów dla codziennych ludzi (duża pojemność V8 lub V12, 5 lub 6 litrów). Ponieważ muszą jeździć ludzie, którzy nie mają prawa jazdy lub rozumieją, jak działa wewnętrzny silnik spalinowy, mają bardzo duże tolerancje. Mają ograniczniki prędkości obrotowej, są zaprojektowane do pracy na dowolnym oleju o określonej wartości, mają odstępy międzyobsługowe co 10 000 km od siebie, ale jeśli przeoczysz odstęp serwisowy o kilka tygodni, nie eksploduje ci w twarz. Nie zapalają się podczas jazdy na duże odległości.

    Dysk SAS na serwerze jest bardziej podobny do silnika Formuły 1. Są naprawdę małe (2,4 litra), ale mają ogromną moc wyjściową ze względu na niewielkie tolerancje. Obracają się wyżej i często nie mają ogranicznika obrotów (co oznacza, że ​​ponoszą poważne obrażenia, jeśli są źle prowadzone), a jeśli przegapisz okres serwisowy (co kilka godzin ), wybuchają.

    Zasadniczo porównujesz kredę i ser. Liczby i pełny podział zostały omówione w dokumencie Intel Whitepaper klasy Enterprise kontra dyski twarde typu Desktop

  3. Porozmawiajmy tutaj o twardych liczbach. Załóżmy, że żądasz 1 MB dodatkowych danych (ładna okrągła liczba). Ile to naprawdę danych ? Twój 1 MB danych trafi do macierzy RAID. Powiedzmy, że są bezpieczni i przekształcają to w RAID1. Twój 1 MB danych jest dublowany, więc w rzeczywistości jest to 2 MB danych.

    Załóżmy, że Twoje dane znajdują się w sieci SAN. W przypadku awarii węzła SAN dane są synchronizowane na poziomie bajtów z drugim węzłem SAN. Więc jest zduplikowany, a twoje 2 MB danych wynosi teraz 4 MB.

    Oczekujesz, że Twój dostawca będzie przechowywać kopie zapasowe na miejscu, aby Twoje dane mogły zostać przywrócone w przypadku awarii niezwiązanej z katastrofą? Każdy przyzwoity dostawca zapewni ci co najmniej 1 kopię zapasową na miejscu, być może więcej. Powiedzmy, że robią migawki raz w tygodniu przez trzy tygodnie na miejscu. To dodatkowe 3 MB danych, więc teraz masz do 7 MB.

    Jeśli dojdzie do krytycznej katastrofy, twój dostawca powinien mieć gdzieś kopię przechowywaną poza witryną. Nawet jeśli ma miesiąc, powinien istnieć. Teraz masz do 8 MB.

    Jeśli jest to naprawdę dostawca wysokiego poziomu, może nawet mieć witrynę odzyskiwania po awarii, która jest zsynchronizowana na żywo. Te dyski również będą RAIDowane, więc to dodatkowe 2 MB, a zatem masz do 10 MB danych.

    W końcu będziesz musiał przenieść te dane. Co? Przenieś to? Tak, transfer danych kosztuje. Kosztuje pieniądze, gdy je pobierasz, uzyskujesz dostęp przez Internet, a nawet kosztuje to jego kopię zapasową (ktoś musi wyjąć te taśmy z biura, a może być tak, że 1 MB danych oznacza, że ​​trzeba kupić dodatkową zestaw taśm i przenieś je gdzieś).

  4. Gdy dysk domowy SATA ulegnie awarii, możesz zadzwonić do pomocy technicznej i przekonać go, że Twój dysk jest martwy. Następnie prześlij dysk do producenta (w większości przypadków na swój własny koszt). Poczekaj tydzień. Odzyskaj nowy dysk z powrotem i musisz go ponownie zainstalować (prawie na pewno nie można go wymieniać podczas pracy lub w zaprzęgu dysków).

    Gdy ten dysk SAS ulegnie awarii, zadzwoń do pomocy technicznej. Prawie nigdy nie kwestionują twojej opinii, że napęd wymaga natychmiastowej wymiany i wysyłają nowy napęd; zazwyczaj nowy dysk jest dostarczany później tego samego dnia, w przeciwnym razie następny dzień jest również bardzo powszechny. Zazwyczaj producent wyśle ​​przedstawiciela, aby faktycznie zainstalował dysk, jeśli nie wiesz, jak to zrobić (bardzo przydatne, jeśli planujesz kiedykolwiek wziąć urlop i potrzebujesz rzeczy do pracy, gdy jesteś daleko).

  5. Dyski dla przedsiębiorstw mają wąskie tolerancje, patrz punkt 2 powyżej i mają tendencję do działania około 10 razy dłużej niż dyski klasy konsumenckiej (MTBF). Dyski Enterprise prawie zawsze obsługują zaawansowane wykrywanie błędów i awarii, które według raportu Google działają przez około 40% czasu, ale jest to coś, co wolałby, żeby komputer nagle umierał.

    Gdy masz jeden dysk w komputerze domowym, jego statystyczna szansa na awarię jest po prostu szansą na dysk. Dyski były oceniane w MTBF (gdzie dyski SAS nadal cieszą się około 50% wyższymi ocenami lub więcej), teraz częściej występują błędy. Typowy dysk SAS ma od 10 do 1000 razy mniejsze prawdopodobieństwo wystąpienia nieodwracalnego błędu (100 razy najczęstszy, jaki ostatnio znalazłem). (poziomy błędów zgodnie z dokumentacją producenta dostarczoną przez Seagate, Western Digital i Hitachi; brak zamierzonego uprzedzenia; wyraźne zrzeczenie się odszkodowania).

    Wskaźniki błędów są szczególnie ważne nie wtedy, gdy napotkasz nieodwracalny błąd na dysku, ale gdy inny dysk w tej samej macierzy ulegnie awarii i nie polegasz na tym, że wszystkie dyski w macierzy są czytelne w celu odzyskania uszkodzonego dysku.

  6. SAS jest pochodną SCSI, która jest protokołem pamięci. SATA jest oparta na ATA, która sama opiera się na magistrali ISA (ta 8/16-bitowa magistrala w komputerach z epoki dinozaurów). Protokół pamięci SCSI zawiera bardziej rozbudowane polecenia do optymalizacji sposobu przesyłania danych z napędów do kontrolerów iz powrotem. Ten wzrost wydajności sprawiłby, że skądinąd równy dysk SAS byłby z natury szybszy, szczególnie przy ekstremalnych obciążeniach roboczych, niż dysk SATA; to także zwiększa koszt.

  7. Jest mniej produkowanych dysków SAS, korzyści skali dyktują, że będą one droższe, a wszystkie inne będą równe.

  8. Dyski SAS mają zazwyczaj prędkości obrotowe 10 000 lub 15 000; podczas gdy SATA zwykle ma 5,4k lub 7,2k. Dyski SAS, w szczególności coraz bardziej popularne rozmiary 2,5 cala, mają krótsze czasy wyszukiwania. Oba połączone radykalnie zwiększają liczbę operacji we / wy na dysku, zazwyczaj dysk SAS jest około 3 razy szybszy. Gdy wielu użytkowników wymaga różnych danych, operacje we / wy pojemność napędu / macierzy staje się krytycznym wskaźnikiem wydajności.

  9. Dyski w centrum danych są zwykle zasilane cały czas. Badania wykazały, że na awarię napędu ma wpływ liczba cykli ogrzewania / chłodzenia, przez które przechodzi (od uruchomienia do wyłączenia). Utrzymywanie ich przez cały czas zwykle wydłuża żywotność dysku. Konsekwencją tego jest to, że napędy zużywają prąd. Ta energia elektryczna musi być przez coś dostarczana (w przypadku dużego prądu stałego same napędy mogą pobierać więcej energii niż małe sąsiedztwo domów). Muszą także gdzieś rozproszyć to ciepło, co wymaga systemów chłodzenia (które same potrzebują więcej energii do działania).

  10. Koszty infrastruktury i personelu. Dyski te znajdują się w wysokiej klasy urządzeniach NAS lub SAN. Te jednostki są drogie, nawet bez drogich napędów. Wymagają kosztownego personelu do ich rozmieszczenia i utrzymania. Budynki, w których znajdują się te urządzenia NAS i SAN, są drogie w obsłudze (patrz punkt dotyczący chłodzenia powyżej, ale dzieje się tam o wiele więcej.) Oprogramowanie do tworzenia kopii zapasowych zazwyczaj nie jest darmowe (podobnie jak licencje na tworzenie kopii lustrzanych) , a pracownicy zajmujący się wdrażaniem i utrzymywaniem kopii zapasowych są zwykle również kosztowni. Koszt wynajmu dostarczania i przechowywania taśmy poza siedzibą firmy to tylko jedna z wielu rzeczy, które zaczynają się kumulować, gdy potrzebujesz więcej miejsca.

Pamiętając, że pojemność ich dysków może być równa 1/10 wielkości dysku stacjonarnego i pięciokrotnie wyższa cena, twój 1 MB danych to tak naprawdę 10, a wszystkie inne różnice, nie ma możliwości, aby narysować jakąkolwiek znaczącą wnioski między ceną miejsca na komputerze a ceną miejsca na poziomie przedsiębiorstwa.


3
Obecnie dyski 2-4 TB SAS / SATA 7.2K są używane do pamięci masowej, więc niektóre z nich nie mają już uniwersalnego zastosowania.
Mircea Chirea

1
@ Dyski MirceaChirea 2-4 TB używane w pamięci masowej dla przedsiębiorstw to NL lub ML SAS i różnią się od dysków SATA 2-4 TB. Cena za GB jest nadal bardzo różna dla obu platform.
MDMarra,

@MDMarra, większość nie różni się znacznie bardziej niż wersje komputerów stacjonarnych: oprócz SAS mają lepszą gwarancję i są pakowane w grupy pod kątem niezawodności.
Mircea Chirea

1
Są one przeznaczone do użytku 24x7, gdzie nie ma większości dysków SATA. Zawodzą również z gracją i nie zawieszają całej macierzy RAID . Tylko dyski SATA, które obsługują TLER, zniosą błąd i unikną tego. Nie ma również podwójnych dysków SATA, podczas gdy dwuportowy SAS jest powszechny i ​​umożliwia przezroczyste przełączanie awaryjne kontrolerów. Ponownie, jeśli masz niewielki budżet, to SATA może być twoim jedynym wyborem, ale istnieją znaczne różnice, na które interesują firmy między NL-SAS i SATA.
MDMarra,

3
Backblaze powiedział na swoim blogu, że dyski korporacyjne nie są mniej narażone na awarie niż dyski konsumenckie
Bert

31

Nie dodam tego do górnej odpowiedzi CW głównie dlatego, że jest to różnica zdań. Jeśli chcesz, możesz je scalić / edytować.

Często powodem, dla którego pamięć masowa „na poziomie przedsiębiorstwa” jest tak droga, może być to, że pytający nie rozumie wymogu, ale czasami także administrator nie rozumie wymogu, nie może przekazać tego wymogu komuś z organem zakupowym lub po prostu otrzymuje zignorowany przez wspomniany organ.

Wysokowydajne, wysoce dostępne, wymagające niewielkiej konserwacji gotowe macierze do przechowywania są drogie . Częścią pracy projektanta systemu jest wiedzieć, gdzie są one odpowiednie, a gdzie właściwe jest inne projektowanie.

Nie sądzę, aby względne koszty różnych rodzajów napędów dyskowych były w rzeczywistości istotne w jednym z przykładowych pytań.

Dlaczego muszę płacić 50 dolców miesięcznie za dodatkowy gigabajt miejsca?

Jest to wyraźnie skierowane do pewnego rodzaju usługodawcy. Dwie możliwe odpowiedzi dla mojego umysłu to:

  1. Masz 5 dziewięciu godzin nieprzerwanej pracy, wsparcie 24/7, na Manhattanie / Londynie / Hongkongu. Obracające się talerze to tylko niewielka część stosu, za który płacisz.

  2. Płacisz za dużo. Negocjuj, zmień dostawcę lub weź go do domu.

Na naszym serwerze plików zawsze brakuje miejsca, dlaczego nasz sysadmin po prostu nie wrzuci tam dodatkowego dysku o pojemności 1 TB?

To prawie na pewno zły projekt (i prawdopodobnie z powodów politycznych). Dane na tym serwerze plików mieszczą się gdzieś w tym spektrum:

  • Dane warto przechowywać w konfiguracji o wysokiej wydajności, wysokiej dostępności i kosztach. Przestoje spowodowane brakiem miejsca wpływają na wysoką dostępność i są niepowodzeniem projektu lub planowania.

  • Dane są nieważne lub dopuszczalne są powolne działanie lub dłuższy przestój. Tanie dyski i tanie rozwiązania do tworzenia kopii zapasowych są dopuszczalne. Regularne przestoje z powodu braku miejsca na dysku nadal wydają się dziwnym kompromisem, ponieważ większość kosztów w tym przypadku to prawdopodobnie czas administratora, a na dłuższą metę spędzą więcej czasu na rozwiązywaniu problemów z niskim dyskiem przestrzeń.

Zauważ, że powiedziałem, że jest to spektrum i większość wymagań występuje gdzieś pomiędzy tymi dwoma.


5
Warto zauważyć, że z punktu widzenia użytkownika „brak miejsca” może równie dobrze „wypełniać swój przydział” z punktu widzenia sysadmin.
Richard Gadsden

6

Koszt wytworzenia dowolnego przedmiotu jest bezpośrednio związany z wielkością jednostki, którą sprzedaje w pętli sprzężenia zwrotnego.

W przypadku konwencjonalnego dysku twardego z obracającym się zardzewiałym szkłem i elektroniką istnieje potencjalnie ogromna różnica w kosztach komponentów mechanicznych i elektronicznych - pojawiły się jednak 2 wyraźne przedziały ceny / jakości - Enterprise i Commodity.

Zmniejszony wolumen sprzedaży dysków dla przedsiębiorstw odbija się jednak na tym, co dostajesz za swoje pieniądze - coś, co kosztuje siedem razy tyle, nie będzie siedem razy lepsze.

Jednostki korporacyjne (dla danej pojemności) są nieco szybsze niż jednostki towarowe, np. Porównując dyski Seagate Barracuda SATA (towar) i Cheetah SAS (firma):

model            Barracuda            Cheetah
capacity(Gb)     500                  450
sustained data   125                  168
   rate (Mb/s)
cache(Mb)        16                   64
annual failure   <1%                  0.44%
   rate
Price GBP        42                   275
Price USD        67                   440

Ale w kontekście przedsiębiorstwa żaden rozsądny administrator systemu nigdy nie przechowywałby ważnych danych na jednym dysku - użycie wielu dysków zapewnia większą niezawodność i przepustowość oraz skutecznie zmniejsza opóźnienia; cztery dyski Barracuda skonfigurowane jako RAID10 będą znacznie szybsze niż pojedynczy dysk Cheetah, przy znacznie mniejszym ryzyku utraty danych przy około 60% ceny.

Z pewnością uzyskasz lepszą gwarancję na dysk Enterprise, a sprzedawca zwykle będzie w stanie uzyskać go dla ciebie tego samego dnia - ale prawdopodobnie będziesz w stanie pozyskać dysk towarowy od lokalnego dostawcy szybciej niż twój sprzedawca może wysyłać dysk zastępczy. Z drugiej strony dysk korporacyjny może być dokładnym zamiennikiem uszkodzonego dysku.

Więc może zyskujesz znacznie większą niezawodność z dysków korporacyjnych? Chociaż ludzie, którzy produkują i sprzedają dyski, często twierdzą, że tak jest (Seagate jest raczej nieskory do tego na swojej stronie internetowej - ale nawet zaciemnione liczby, które publikują, pokazują, że jest to mniej niż 2-krotność). Niezależne badania sugerują, że nie ma znaczącej różnicy .

Zestaw poleceń SCSI ma pewne zalety techniczne w porównaniu z zestawem poleceń ATA - szczególnie pod względem umożliwiania systemowi operacyjnemu dokładnego sprawdzenia, co jest zapisywane na dysku - ale to znowu robi efektywną różnicę, patrząc na wydajność i niezawodność systemu plików zaimplementowane na jednym dysku.

Jeśli dostawca usług obsługuje sieć Fibre Channel SAN, koszt gigabajta pamięci będzie co najmniej 8 razy wyższy niż zakup dysku z półki w najbliższym sklepie z narzędziami. Istnieją jednak inne podejścia, które mogą znacznie obniżyć koszty.

Pamiętaj, że to nigdy nie będzie tańsze niż zakup gotowego dysku, ponieważ płacisz również za nadmiarowość, moc, klimatyzację i wsparcie, ale koszty te powinny być niewielkie w stosunku do kosztu przechowywania.


5

Zgadzam się z innymi postami dotyczącymi jakości oferty firmy hostingowej. Ale ostatnio zmieniliśmy umowę o hosting i robiliśmy zakupy i nikt nie był konkurencyjny w zakresie przestrzeni dyskowej, podobnie jak ceny nie były niższe niż w naszym poprzednim trzyletnim kontrakcie. Dyski SAS spadają w cenie, półka dyskowa / macierze / SAN / FC / przełączniki spadają, wszystko spada. Ale nie miejsce na dysku?

Kolega z dużo większym doświadczeniem zwrócił uwagę na taktykę. Ceny procesorów, pamięci i przepustowości były olśniewające! Podpisz tutaj! Zarejestruj się teraz i zignoruj ​​problem z miejscem na dysku! Nie będziesz potrzebować tyle miejsca na dysku. Spójrz na procesor i pamięć!

Gdy tylko zgodzisz się na ich umowę, naprawdę cię dopadają, a oni zarabiają na przestrzeni dyskowej. Tak, jest to RAID-5 i wysoka wydajność itp., Ale kopie zapasowe kosztują dodatkowo, replikacja poza siedzibą kosztuje więcej.

Dla firm hostingowych jest to model biznesowy. Większość firm robi coś podobnego ze swoimi cenami - obniż tę cenę tutaj, ale zwiększ ją tam, aby uzyskać dochód gdzie indziej. Muszą również płacić czynsz i pensje.

W przypadku serwerów wewnętrznych masz różne problemy. Nie możesz po prostu wejść do serwerowni z pudełkiem Fedex, który ma twój nowy dysk twardy 3 TB. Jeśli planujesz rozbudowę, jest to łatwiejsze, ale serwery / stelaże / macierze mogą już mieć pojemność pod względem gniazd, we / wy, kart kontrolerów, mocy.

To jak patrzeć pod skałą, będziesz zaskoczony tym, co możesz znaleźć.


Koszt dysków może spadać, ale siła robocza rośnie. CapEx nie jest największą częścią TCO.
Chris S

5

Ważne jest również, aby pamiętać, że „lokalne” miejsce do przechowywania może kosztować więcej niż myślisz.

W ramach ćwiczenia polegającego na przeniesieniu niektórych naszych „zarchiwizowanych” danych do chmury niedawno zakończyłem wycenę porównującą koszt dostępnego (np. Sformatowanego, a nie surowego) miejsca na dysku dostępnego w naszej najnowszej sieci SAN z kosztem magazynu w usłudze danych w chmurze Amazon.

Biorąc pod uwagę cenę zapłaconą za samą sieć SAN, w tym dyski, zakładając 5-letni okres użytkowania sprzętu SAN, a nie „ogólne” koszty prowadzenia naszej serwerowni, nasza cena za 150 GB lokalnego magazynu wynosi 31,88 USD miesięcznie w porównaniu z 28,41 USD Amazon ( przy założeniu, że miesięczny wskaźnik ruchu wzrośnie o 20%).

Teraz nie zamierzam się spieszyć i przenieść całej naszej pamięci do chmury, ponieważ istnieją inne korzyści z posiadania pamięci lokalnej, ale myślę, że tego rodzaju wycena cenowa jest przydatna: jeśli uważasz, że pamięć w chmurze jest droga, to ile czy naprawdę płacisz za lokalne przechowywanie?


4

Moje podejście do tego pytania jest proste IO ... plik, który znajduje się na pojedynczym twardym dysku towarowym bez raidu i prawdopodobnie bez wymiany na gorąco, i zwykle jest dostępny dla jednej osoby i prawdopodobnie nigdy nie jest tworzony. Jest to tania i łatwa metoda IO ...

W naszej firmie zastosowałem jedną z najdroższych metod raidu (raid 10), która wymaga minimum 4 napędów; używamy 6 ... to daje nam wysokie wskaźniki IO i odporność na awarie.

Ta konfiguracja znacznie zaoszczędziła mi $$, a wynik ten oznaczał wyższą wydajność i mniej przestojów dla użytkowników końcowych .. w przypadku prostych operacji we / wy jest tylko jedna osoba do rozczarowania i prawdopodobnie niewielka wartość finansowa związana z przestojem.

Mamy również dedykowany serwer iSCSI, który jest używany do wirtualizacji Xen i który jest również skonfigurowany do raidu 10 ...

Im więcej IO jest potrzebnych do wykorzystania i tworzenia kopii zapasowych, tym droższe jest wdrożenie ... jeśli twoje wymagania korporacyjne zaakceptują utratę danych, bardzo wolne prędkości i brak nadmiarowości - wtedy pamięć masowa klasy biznesowej może być wykonana na tani!!! Po prostu przygotuj się na zwolnienie ...

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.