Pytania otagowane jako x86

x86 to architektura wywodząca się z procesora Intel 8086. Rodzina x86 obejmuje 32-bitowe architektury IA-32 i 64-bitowe x86-64, a także starsze architektury 16-bitowe. Pytania dotyczące tego ostatniego powinny być oznaczone tagami [x86-16] i / lub [emu8086]. Użyj tagu [x86-64], jeśli Twoje pytanie dotyczy 64-bitowej architektury x86-64. W przypadku FPU x86 użyj tagu [x87]. W przypadku SSE1 / 2/3/4 / AVX * użyj również [sse] i dowolnego z [avx] / [avx2] / [avx512], które mają zastosowanie

10
Zastąpienie 32-bitowego licznika pętli 64-bitowym wprowadza szalone odchylenia wydajności od _mm_popcnt_u64 na procesorach Intel
Szukałem najszybszego sposobu na popcountduże tablice danych. Spotkałem bardzo dziwny efekt: zmiana zmiennej pętli z unsignedna uint64_tsprawiła, że ​​wydajność spadła o 50% na moim komputerze. Benchmark #include <iostream> #include <chrono> #include <x86intrin.h> int main(int argc, char* argv[]) { using namespace std; if (argc != 2) { cerr << "usage: array_size …




4
Deoptimizacja programu dla potoku w procesorach z rodziny Intel Sandybridge
Przez tydzień pracowałem nad mózgiem, próbując wykonać to zadanie i mam nadzieję, że ktoś tutaj poprowadzi mnie na właściwą ścieżkę. Zacznę od instrukcji instruktora: Twoje zadanie jest przeciwieństwem naszego pierwszego zadania laboratoryjnego, które polegało na optymalizacji programu liczb pierwszych. Twoim zadaniem w tym zadaniu jest pesymalizacja programu, tzn. Spowolnienie jego …

12
Jak skompilować Tensorflow z instrukcjami SSE4.2 i AVX?
Oto wiadomość otrzymana z uruchomienia skryptu, aby sprawdzić, czy Tensorflow działa: I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.so.5 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcuda.so.1 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcurand.so.8.0 …

3
Co to jest retpolina i jak działa?
Aby zminimalizować ryzyko ujawnienia pamięci jądra lub pamięci międzyprocesowej ( atak Spectre ), jądro Linux 1 zostanie skompilowane z nową opcją , -mindirect-branch=thunk-externwprowadzoną w gcccelu wykonywania wywołań pośrednich za pośrednictwem tak zwanej retpoliny . To wydaje się być nowo wynalezionym terminem, ponieważ wyszukiwarka Google pojawia się tylko bardzo niedawno (ogólnie …

10
Jak wygląda język asemblera?
Dawno, dawno temu, aby na przykład napisać asembler x86, miałbyś instrukcję mówiącą: „załaduj rejestr EDX wartością 5”, „zwiększ rejestr EDX” itp. W nowoczesnych procesorach, które mają 4 rdzenie (lub nawet więcej), na poziomie kodu maszynowego wygląda to tak, jakby były 4 oddzielne procesory (tj. Czy są tylko 4 różne rejestry …
243 assembly  x86  cpu  multicore  smp 



5
Czym różni się architektura ARM od x86? [Zamknięte]
Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 4 lata temu . Popraw to pytanie Czy architektura x86 została specjalnie zaprojektowana do współpracy z klawiaturą, podczas gdy ARM oczekuje, że będzie …
192 x86  arm 


4
Co się stanie, gdy uruchomi się program komputerowy?
Znam ogólną teorię, ale nie mogę dopasować się do szczegółów. Wiem, że program znajduje się w dodatkowej pamięci komputera. Gdy program rozpocznie wykonywanie, jest całkowicie kopiowany do pamięci RAM. Następnie procesor pobiera jednocześnie kilka instrukcji (w zależności od wielkości magistrali), umieszcza je w rejestrach i wykonuje je. Wiem również, że …



Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.