To pytanie jest rozszerzeniem dwóch dyskusji, które pojawiły się ostatnio w odpowiedziach na „ C ++ vs Fortran for HPC ”. I jest to trochę więcej wyzwanie niż pytanie ... Jednym z najczęściej słyszanych argumentów na korzyść Fortrana jest to, że kompilatory są po prostu lepsze. Ponieważ większość kompilatorów C …
Szukałem bibliotek algebry liniowej C ++ w projekcie, nad którym pracowałem. Coś, czego wciąż nie mam pojęcia, to połączenie BLAS i LAPACK z innymi bibliotekami algebry liniowej. Przeglądając ten artykuł na temat bibliotek algebry liniowej , zainteresowałem się tym, że: niektóre biblioteki są niezależne od BLAS i LAPACK niektóre wymagają …
Chciałbym wiedzieć, czy istnieje szybki sposób na obliczenie odległości euklidesowej dwóch wektorów w oktawie. Wydaje się, że nie ma do tego żadnej specjalnej funkcji, więc czy powinienem po prostu użyć formuły z sqrt?
Biorąc pod uwagę dwie różne implementacje BLAS, czy możemy oczekiwać, że wykonają dokładnie takie same obliczenia zmiennoprzecinkowe i zwrócą te same wyniki? Lub może się zdarzyć, na przykład, że oblicza się produkt skalarny jako i jeden jako co może dać inny wynik w zmiennoprzecinkowym IEEE arytmetyka?( ( x1y1+ x2)y2)) + …
Przepraszam za długi post, ale chciałem załączyć wszystko, co uważałem za istotne za pierwszym razem. Czego chcę Wdrażam równoległą wersję Krystalicznych metod podprzestrzeni dla gęstych matryc. Głównie GMRES, QMR i CG. Zdałem sobie sprawę (po profilowaniu), że moja procedura DGEMV była żałosna. Postanowiłem więc skoncentrować się na tym, izolując to. …
Gdziekolwiek widziałem, tutorial / dokumenty PETSc itp. Mówią, że jest to przydatne w algebrze liniowej i zwykle określa, że korzyści będą miały systemy rzadkie. Co z gęstymi matrycami? Jestem zaniepokojony rozwiązywania dla gęstej A .A x = bAx=bAx=bZAZAA W Fortranie napisałem własny kod dla CG i QMR. Podstawowa konstrukcja jest …
Kompleks iloczyn skalarny dwa różne definicje ustalone przez konwencje: ˂ u, T, V lub u T ˂ v . W BLAS znalazłem procedury cdotu, zdotu i cdotc, zdotc. Dwie poprzednie procedury faktycznie obliczają u T v (fałszywy produkt wewnętrzny!), A dwie ostatnie procedury koniugują pierwszy wektor w produkcie wewnętrznym. Ponadto, …
Implementacja BLAS w netlib jest doskonałym źródłem informacji, ponieważ jest w większości niezoptymalizowana i dobrze udokumentowana (np. Zgemm ). Jest jednak w Fortran 77, co czyni go nieco niedostępnym dla osób z bardziej nowoczesnym wykształceniem programistycznym. Czy istnieje implementacja BLAS na poziomie odniesienia, taka jak netlib, w C / C …
Na przykład nVidia ma CUBLAS, który obiecuje 7-14-krotne przyspieszenie. Naiwnie nie jest to teoretyczna przepustowość żadnej z kart GPU nVidii. Jakie są wyzwania związane z przyspieszaniem algebry liniowej na GPU i czy są już dostępne szybsze trasy algebry liniowej?
Czy kompilacja PETSc z zewnętrzną biblioteką BLAS / LAPACK znacząco wpływa na wydajność na rzadkich macierzach, czy używa tych bibliotek tylko do matematyki gęstej macierzy?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.