Graphical Processing Unit - wyspecjalizowana, stosunkowo niedroga jednostka sprzętowa zbudowana do szybkich obliczeń graficznych i obliczeń naukowych z dużą równoległością danych.
Mam więc przyzwoitą uwagę, z jakimi problemami, z którymi pracuję, najlepiej rozwiązać szeregowo, i którymi można zarządzać równolegle. Ale w tej chwili nie mam pojęcia, co najlepiej poradzić sobie z obliczeniami opartymi na procesorze i co powinno zostać odciążone na GPU. Wiem, że jest to podstawowe pytanie, ale większość moich …
Jak CUDA i OpenCL porównują się ze sobą pod koniec 2013 roku z perspektywy programisty? Moja grupa myśli o próbie wykorzystania obliczeń na GPU. Czy ograniczalibyśmy się znacznie, wybierając sprzęt obsługujący tylko OpenCL, ale nie CUDA? Aby być bardziej szczegółowym, czy poniższe założenia są prawidłowe? Wszystko, co jest możliwe w …
Właśnie zainstalowałem kartę graficzną Nvidia GT660 na pulpicie i po pewnym czasie udaje mi się połączyć ją z R. Grałem z kilkoma pakietami R korzystającymi z GPU, szczególnie z gputools, i porównywałem czas, jaki mój procesor graficzny i procesor wykonywały podstawowe operacje: odwracanie macierzy (szybszy procesor) rozkład qr (szybszy procesor) …
Chciałbym wiedzieć, czy istnieje szybki sposób na obliczenie odległości euklidesowej dwóch wektorów w oktawie. Wydaje się, że nie ma do tego żadnej specjalnej funkcji, więc czy powinienem po prostu użyć formuły z sqrt?
Uruchomiłem kod dynamiki molekularnej (MD) GROMACS w klastrze Ubuntu Linux składającym się z węzłów zawierających 24 procesory Intel Xeon. Moje szczególne zainteresowanie okazuje się nieco wrażliwe na zmiennoprzecinkową precyzję arytmetyczną, więc musiałem uruchomić GROMACS z podwójną precyzją, a nie z pojedynczą precyzją - pomimo wyższych kosztów obliczeniowych podwójnej precyzji. Tak …
Chciałbym wdrożyć systemy rozwiązywania ODE na GPU w „trywialnie równoległym” ustawieniu. Na przykład, wykonując analizę wrażliwości z 512 różnymi zestawami parametrów. Idealnie chciałbym wykonać rozwiązywanie ODE za pomocą inteligentnego adaptacyjnego solvera pomiaru czasu, takiego jak CVODE, zamiast stałego pomiaru czasu, takiego jak Forward Euler, ale działającego na GPU NVIDIA zamiast …
Czy ktoś tutaj używał obliczeń naukowych o podwójnej precyzji z procesorami graficznymi nowej generacji (np. K20) za pośrednictwem Pythona? Wiem, że ta technologia szybko się rozwija, ale jaki jest obecnie najlepszy sposób? GPU nie wchodzi w zakres popularnych naukowych bibliotek Pythona numpy i scipy, a ja chciałem użyć theano, ale …
Mam kolekcję modeli obliczeniowych, które można opisać jako asynchroniczne automaty komórkowe. Modele te przypominają model Isinga, ale są nieco bardziej skomplikowane. Wydaje się, że takie modele skorzystałyby na GPU, a nie na CPU. Niestety równoległość takiego modelu nie jest łatwa i wcale nie jest dla mnie jasne, jak sobie z …
Na przykład nVidia ma CUBLAS, który obiecuje 7-14-krotne przyspieszenie. Naiwnie nie jest to teoretyczna przepustowość żadnej z kart GPU nVidii. Jakie są wyzwania związane z przyspieszaniem algebry liniowej na GPU i czy są już dostępne szybsze trasy algebry liniowej?
Próbuję zrozumieć różnicę między tymi dwiema kartami graficznymi dla komputerów akademickich, szczególnie dla komponentu DGEMM. Jeśli spojrzymy na surowe statystyki, oba mają ten sam układ GK110, mają porównywalne statystyki w praktycznie każdej kategorii i, moim zdaniem, mają tę samą architekturę rdzenia. Przed wszelkimi rabatami K20X jest około 4x większy niż …
Jestem bardzo nowy w programowaniu GPGPU, więc proszę wybacz mi, jeśli pytanie nie jest szczególnie odpowiednie. Z tego, co rozumiem, programowanie na GPU to bardzo skomplikowana praca inżynierska w porównaniu do zwykłego programowania procesora. Należy bardzo uważać na problemy z rozbieżnościami, kafelkami, przypiętą pamięcią i nakładaniem się komunikacji host-urządzenie / …
Musimy obliczyć macierze kowariancji o rozmiarach od do . Mamy dostęp do GPU i klastrów, zastanawiamy się, jakie jest najlepsze równoległe podejście do przyspieszenia tych obliczeń.10000×10000dziesięć tysięcy×dziesięć tysięcy10000\times10000100000×100000100000×100000100000\times100000
Mam problem, w którym muszę znaleźć wszystkie pozytywne (jak w wartości własnej dodatniej) pary własne małej (zwykle mniejszej niż 60 x 60) macierzy niesymetrycznej. Mogę przestać obliczać, kiedy wartość własna jest mniejsza niż pewien próg. Wiem, że wartości własne są prawdziwe. Jakieś sugestie dotyczące algorytmów, których mógłbym użyć, aby wycisnąć …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.