Pytania otagowane jako performance

Pytania dotyczące szybkości wykonywania i wykorzystania pamięci przez algorytmy, struktury danych, języki i biblioteki.

4
Jak radzić sobie ze zbyt dużą ilością danych?
Nasze symulacje dynamiki plazmy często generują zbyt wiele informacji. Podczas symulacji rejestrujemy różne właściwości fizyczne na siatce (x, y, z, t), która jest tak duża jak (8192x1024x1024x1500), dla co najmniej 10 właściwości. Informacje te są przetwarzane po zakończeniu symulacji. Dzięki temu my robić filmy o nieruchomościach, wykonać analizę Fouriera, obliczyć …


5
Obliczanie struktury rzadkości dla macierzy elementów skończonych
Pytanie: Jakie metody są dostępne w celu dokładnego i wydajnego obliczenia struktury rzadkości matrycy elementów skończonych? Informacje: Pracuję nad solwerem Poissona Równania Ciśnienia, stosując metodę Galerkina z kwadratową podstawą Lagrange'a, napisaną w C, i używam PETSc do rzadkiego przechowywania macierzy i procedur KSP. Aby efektywnie korzystać z PETSc, muszę wstępnie …


4
Zliczanie FLOP dla funkcji bibliotecznych
Oceniając liczbę FLOP w prostej funkcji, często można po prostu zejść w dół wyrażenia zestawiając podstawowe operatory arytmetyczne. Jednak w przypadku wyrażeń matematycznych obejmujących parzysty podział nie można tego zrobić i można oczekiwać, że będzie można porównać z liczbą FLOP z funkcji z tylko dodatkami i mnożeniami. Sytuacja jest jeszcze …

2
Jaki jest najszybszy sposób obliczenia wszystkich wartości własnych bardzo dużej i rzadkiej macierzy przylegania w pythonie?
Próbuję dowiedzieć się, czy istnieje szybszy sposób obliczenia wszystkich wartości własnych i wektorów własnych bardzo dużej i rzadkiej macierzy przylegania niż przy użyciu scipy.sparse.linalg.eigsh O ile mi wiadomo, metody te wykorzystują tylko rzadkość i atrybuty symetrii macierzy. Macierz przylegania jest również binarna, co sprawia, że ​​myślę, że istnieje szybszy sposób, …


3
W jakich przypadkach zastosowania schematy wstępnego kondycjonowania addytywnego są lepsze od multiplikatywnych?
Zarówno w przypadku metod dekompozycji domen (DD), jak i metod wielosiatkowych (MG), można skomponować zastosowanie aktualizacji bloków lub zgrubnych korekt jako addytywne lub multiplikatywne . W przypadku solverów punktowych jest to różnica między iteracjami Jacobiego i Gaussa-Seidela. Multiplikatywną wygładzacz dla działającego jako S ( x o l d , b …


1
Modele statystyczne lokalnej pamięci / obliczeń, opóźnień sieci i fluktuacji przepustowości w HPC
Obliczenia równoległe są często modelowane przy użyciu deterministycznej lokalnej szybkości obliczeń, obciążenia związanego z opóźnieniami i przepustowości sieci. W rzeczywistości są one zmienne przestrzennie i niedeterministyczne. Badania takie jak Skinner i Kramer (2005) obserwują rozkłady multimodalne, ale analiza wydajności wydaje się zawsze wykorzystywać albo rozkłady deterministyczne, albo gaussowskie (nie tylko …


3
Nvidia K20X vs GeForce Titan dla przyspieszenia GPGPU
Próbuję zrozumieć różnicę między tymi dwiema kartami graficznymi dla komputerów akademickich, szczególnie dla komponentu DGEMM. Jeśli spojrzymy na surowe statystyki, oba mają ten sam układ GK110, mają porównywalne statystyki w praktycznie każdej kategorii i, moim zdaniem, mają tę samą architekturę rdzenia. Przed wszelkimi rabatami K20X jest około 4x większy niż …


3
Literatura referencyjna do modelowania bieżących i przyszłych kosztów energii operacji zmiennoprzecinkowych i transferu danych
Szukam najważniejszej literatury i slajdów do modelowania bieżących i przyszłych kosztów energii operacji zmiennoprzecinkowych i transferu danych w procesorze, pamięci, sieci i pamięci. Oznacziłem to pytanie jako wiki społeczności i wolę ograniczyć każdą odpowiedź do następującego formatu: Tytuł, autorzy, lokalizacja / konferencja / czasopismo, rok, DOI / URL, podsumowanie informacji, …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.