Programowanie simd

12

Jak skompilować Tensorflow z instrukcjami SSE4.2 i AVX?

Oto wiadomość otrzymana z uruchomienia skryptu, aby sprawdzić, czy Tensorflow działa: I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.so.5 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcuda.so.1 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcurand.so.8.0 …

289 tensorflow x86 compiler-optimization simd compiler-options

5

Pliki nagłówkowe dla elementów wewnętrznych x86 SIMD

Które pliki nagłówkowe zawierają elementy wewnętrzne dla różnych rozszerzeń zestawu instrukcji x86 SIMD (MMX, SSE, AVX, ...)? Znalezienie takiej listy w Internecie wydaje się niemożliwe. Popraw mnie, jeśli się mylę.

132 x86 header-files sse simd intrinsics

8

Odejmowanie spakowanych 8-bitowych liczb całkowitych w 64-bitowej liczbie całkowitej przez 1 równolegle, SWAR bez sprzętowej karty SIMD

Jeśli mam 64-bitową liczbę całkowitą, którą interpretuję jako tablicę spakowanych 8-bitowych liczb całkowitych z 8 elementami. Muszę odjąć stałą 1od każdej spakowanej liczby całkowitej podczas obsługi przelewu bez wpływu jednego elementu na wynik innego elementu. Mam ten kod w tej chwili i działa, ale potrzebuję rozwiązania, które odejmuje każdą zapakowaną …

77 c++ c bit-manipulation simd swar

1

Nowoczesne podejście do przydzielania wyrównanej pamięci std :: vector

Następujące pytanie związane jest jednak odpowiedzi są stare, i komentarz od użytkownika Marc Glisse sugeruje nowych podejść od C ++ 17 do tego problemu, które nie mogą być należycie rozpatrzone. Próbuję uzyskać wyrównaną pamięć działającą poprawnie dla SIMD, wciąż mając dostęp do wszystkich danych. W przypadku Intela, jeśli utworzę wektor …

11 c++ c++17 stdvector simd memory-alignment

Pytania otagowane jako simd