Mały klaster przetwarzania rozproszonego


13

Jestem uczniem szkoły średniej, który próbuje zbudować klaster linuksowy dla projektu (mam kilka porządnych komputerów, które mają zostać ponownie zaprojektowane tego lata, więc dział techniczny w zasadzie mówi, o ile fizycznie ich nie zniszczę) rób cokolwiek.

W każdym razie tak naprawdę nie wiem nic o budowaniu klastra, ale jestem całkiem dobry w Linuksie.

Muszę wiedzieć te rzeczy: - Jakiej dystrybucji powinienem użyć? Czy to w ogóle ma znaczenie? -Jakie oprogramowanie może skonfigurować klaster? -Na pokładzie lub rozproszonym FS? -Jakie witryny, które oferują przyzwoite przewodniki lub poradniki?


Jaki byłby cel klastra?
Frederik Deweerdt

Nowoczesne klastry są budowane do określonego celu. Zwykle do aplikacji internetowej lub do przechowywania danych. Może możesz wypróbować LVS .
David S.

Jak napisali inni, „klaster” często oznacza równoległe wykonywanie, które wymaga specjalnych kodów lub programowania. Innym, ale fajnym zastosowaniem wielu komputerów pracujących razem jest przełączanie awaryjne lustrzanych systemów plików. Poświęć chwilę i spójrz na DRBD i klastrowe systemy plików. To również może dać ci pomysły: xenamo.sourceforge.net
pboin

Odpowiedzi:


6

To naprawdę zależy od tego, co próbujesz osiągnąć i co masz na myśli przez „klaster obliczeń rozproszonych”. Podobne działanie zrobiłem kiedyś w Uni, używając starych maszyn i PVM , czyli „Klastra” w sensie grupy maszyn działających jako pojedynczy komputer do równoległego przetwarzania - pomyśl klastry Beowulf. Oczywiście będziesz potrzebować napisanego kodu, aby z tego skorzystać.

Dobrym miejscem do rozpoczęcia byłoby ustalenie, czego chcesz się nauczyć z tego projektu. Polecam przeczytanie artykułu w Wikipedii na temat obliczeń równoległych na początek, a następnie udoskonalenie swoich potrzeb w oparciu o to, co chcesz zrobić.

Prosty system kolejkowania zadań (jak gearman ) może wystarczyć, aby szybko uzyskać fajne wyniki.

Problem, który miałem, kiedy tworzyłem klaster obliczeń równoległych, polegał na tym, że nie miałem z tym nic wspólnego, po prostu siedziałem tam, ale był to zabawny projekt i sporo się nauczyłem. W każdym razie możesz się sporo nauczyć i jednocześnie dobrze się bawić, niezależnie od tego, co zdecydujesz się wdrożyć.

Jeśli chodzi o wybór dystrybucji, wybrałbym to, co było dla mnie najwygodniejsze, ponieważ prawdopodobnie będziesz musiał zainstalować rzeczy ze źródła. Kiedy już wszystko będzie w porządku, możesz wszystko skonfigurować, a następnie możesz znaleźć dystrybucję bardziej dostosowaną do twoich potrzeb. Ale każda dystrybucja powinna wystarczyć.

Jakie oprogramowanie skonfigurować klaster? Zależy to całkowicie od rodzaju tworzonego klastra.

Wbudowany czy rozproszony FS? Znowu zależy to od wymagań dotyczących klastra. Czy każdy węzeł będzie przekazywał dane tam iz powrotem między innymi węzłami? Czy będą działać jako niewolnicy z jednym panem? czy będą operować całkowicie niezależnie? Te pytania zaczną informować o twoich wyborach. I oczywiście zawsze są kompromisy.

Niektóre inne linki, które mogą okazać się interesujące:

http://hadoop.apache.org/

http://www.csm.ornl.gov/oscar/

https://computing.llnl.gov/tutorials/parallel_comp/

http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/

http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/



-1

Wypróbuj Linux HA (High Availability), jest to swobodnie dostępne rozwiązanie klastrowe dla Linuksa, które działa w kilku dystrybucjach.

To prawdopodobnie tylko jedno z kilku rozwiązań. Nie wiem, jak wypada w porównaniu z innymi, ani nawet jakie są jego specyficzne cechy, po prostu wiem, że niektórzy koledzy z pracy przysięgli na to, że poważnie komercyjne oprogramowanie.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.