Istnieją pewne różnice, jednak niekoniecznie dotyczą one sprzętu lub specyfikacji. Pamiętaj, że to wszystkie informacje, które zdobyłem na forach lub w wiadomościach, więc weź to wszystko z odrobiną soli.
Pierwszym z nich jest „skalowalność i niezawodność” ( źródło ). K20 został zaprojektowany do pracy w systemie klastrowym i działania z pełnym pochyleniem 24/7. Titan jest bardziej zaprojektowany do gier, więc będzie działał w tym cyklu pracy, ale może być narażony na długotrwałe problemy z życiem, jeśli zostanie użyty w ten sposób.
Sterowniki są również różne, ale nie jestem pewien głównych różnic. Różnica w projekcie kart prawdopodobnie prowadzi do stosunkowo niewielkiego wzrostu wydajności kart Tesla na tym froncie.
„Niektóre funkcje dostępne wyłącznie w Tesli obejmują:
- NVIDIA GPUDirect RDMA dla wydajności InfiniBand
- Hyper-Q dla MPI (Hyper-Q dla strumieni CUDA jest obsługiwany przez GeForce GTX TITAN)
- Ochrona ECC dla wszystkich wewnętrznych i zewnętrznych rejestrów i pamięci
- Obsługiwane narzędzia do zarządzania GPU i klastrami, takie jak Bright Computing, Ganglia. ”( Źródło )
Wskazuje to na fakt, że główną różnicą jest ich skalowalność. Jeśli chcesz uruchomić na biurku w swoim biurze, trudno byłoby argumentować przeciwko Titanowi o K20 o różnicę cen. Jeśli potrzebujesz dodatkowej wydajności wielu K20, znajdź centrum HPC i kup czas na ich serwery.
Edytować:
Po głębszym przyjrzeniu się ECC aktualizuję tę odpowiedź, aby wskazać implikacje posiadania jej na K20, a nie na Tytanie. Poniższe informacje to parafraza informacji znalezionych tutaj .
ECC sprawdza błędy w pamięci DRAM i rejestruje procesor graficzny. Błędy miękkie występują, gdy bit jest nieprawidłowo przesyłany / przechowywany. Im szybsze i bliżej siebie obwody, tym większe prawdopodobieństwo wystąpienia błędu miękkiego. Jeśli rozwiązujesz zestaw sprzężonych ODE lub układ liniowy, pojedyncza liczba wyłączona o jeden bit może znacznie zmienić wyniki w sposób niemożliwy do odtworzenia. Większość standardowych pamięci RAM i pamięci podręcznych w procesorze jest sprawdzana pod kątem tych błędów za pomocą ECC.
GPU, z drugiej strony, generalnie nie mają ECC, chociaż ich szyna pamięci jest znacznie szybsza niż na CPU. Jest tak, ponieważ jeśli piksel na ekranie jest nieco wyłączony dla jednej klatki, jakość programu nie ulega pogorszeniu. Te błędy również nie propagują. W związku z tym można zaoszczędzić wiele nieruchomości (i kosztów) na chipach, pomijając tę funkcję. Ta dodatkowa złożoność prawdopodobnie powoduje dużą część dodatkowych kosztów linii Tesla.