W miarę jak coraz bardziej angażuję się w teorię programowania, fascynują mnie i oszałamiają pozornie proste rzeczy. Zdaję sobie sprawę, że moje rozumienie większości podstawowych procesów jest uzasadnione poprzez logikę kołową

P : Jak to działa?

Odp . : Ponieważ tak jest!

Nienawidzę tej realizacji! Uwielbiam wiedzę, a ponadto uwielbiam uczyć się, co prowadzi mnie do mojego pytania (choć jest ono szerokie).

Pytanie:

Jak oceniane są podstawowe operatory matematyczne za pomocą języków programowania?

Jak ulepszono obecne metody?

Przykład

var = 5 * 5;

Moja interpretacja:

$num1 = 5; $num2 = 5; $num3 = 0;
while ($num2 > 0) {
    $num3 = $num3 + $num1;
    $num2 = $num2 - 1;
}
echo $num3;

Wydaje się to bardzo nieefektywne. Przy wyższych czynnikach ta metoda jest bardzo wolna, podczas gdy standardowa metoda wbudowana jest natychmiastowa. Jak symulowałbyś mnożenie bez iteracyjnego dodawania?

var = 5 / 5;

Jak to się w ogóle robi? Nie mogę wymyślić sposobu, aby dosłownie podzielić go na 5 równych części.

var = 5 ^ 5;

Iteracje iteracji dodawania? Moja interpretacja:

$base = 5;
$mod = 5;
$num1 = $base;
while ($mod > 1) {

    $num2 = 5; $num3 = 0;
    while ($num2 > 0) {
        $num3 = $num3 + $num1;
        $num2 = $num2 - 1;
    }
    $num1 = $num3;
    $mod -=1;
}
echo $num3;

Ponownie, jest to BARDZO nieefektywne, ale nie mogę wymyślić innego sposobu na zrobienie tego. To samo pytanie dotyczy wszystkich funkcji matematycznych obsługiwanych automatycznie.

math evaluation

— Korvin Szanto
źródło

1

Trochę historii o mnie, idę na studia informatyczne, a później teorię matematyki, a także filozofię i fizykę teoretyczną. Wiele aspiracji, mało czasu.

— Korvin Szanto

10

Czy można bezpiecznie założyć, że przeglądałeś wszystkie linki z en.wikipedia.org/wiki/Category:Computer_arithmetic ?

— JB King,

2

Zasadniczo jest to podobne do tego, w jaki sposób nauczono Cię, jak wykonywać wielocyfrowe mnożenie i długie dzielenie w szkole podstawowej. Weź jedną cyfrę A, pomnóż ją przez B. Przesunięcie przez dziesięć. Weź następną cyfrę A, pomnóż ją przez B. Powtórz dla wszystkich cyfr, dodaj wszystko razem. Ponieważ jest to wartość binarna, mnożenie jednocyfrowe jest prostsze (albo x0 albo x1) i zamiast przesuwania o dziesięć, podwajamy. Podział jest podobny.

— Zapytaj o Monikę

35

Aby naprawdę zrozumieć, jak działa arytmetyka wewnątrz komputera, musisz mieć zaprogramowany język asemblera. Najlepiej taki z małym rozmiarem słowa i bez instrukcji mnożenia i dzielenia. Coś jak 6502.

W 6502 praktycznie cała arytmetyka odbywa się w rejestrze zwanym akumulatorem. (Rejestr to specjalna pamięć w procesorze, do której można szybko uzyskać dostęp). Aby dodać dwie liczby, należy załadować pierwszą liczbę do akumulatora, a następnie dodać do niej drugą liczbę.

Ale to upraszcza. Ponieważ 6502 jest 8-bitowym procesorem, może obsługiwać liczby od 0 do 255. Przez większość czasu będziesz chciał pracować z większymi liczbami. Musisz dodać je we fragmentach po 8 bitów na raz. Procesor ma flagę Carry, która jest ustawiona, gdy wynik dodania dwóch liczb przepełni akumulator. Procesor dodaje to podczas dodawania, więc można go użyć do „przenoszenia 1”, zakładając, że zaczynasz od bajtu najniższego rzędu liczby. Wielobajtowy dodatek na 6502 wygląda następująco:

Flaga Clear Carry (CLC)
Załaduj bajt najniższego rzędu pierwszego numeru (LDA, ładuj akumulator)
Dodaj bajt najniższego rzędu drugiego numeru (ADC, dodaj z przeniesieniem)
Przechowuj bajt wyniku najniższego rzędu (STA, akumulator akumulatora)
Powtórz kroki 2–4 z kolejnymi bajtami wyższego rzędu
Jeśli na końcu przeniesienie jest ustawione, przepełniłeś się; podjąć odpowiednie działania, takie jak wygenerowanie komunikatu o błędzie (BCS / BCC, rozgałęzienie, jeśli przeniesienie ustawione / wyczyść)

Odejmowanie jest podobne, z tym wyjątkiem, że najpierw ustawisz przeniesienie, użyj instrukcji SBC zamiast ADC, a na końcu przeniesienie jest jasne, jeśli wystąpił niedopełnienie.

Ale poczekaj! Co z liczbami ujemnymi? Cóż, z 6502 są one przechowywane w formacie zwanym dopełnieniem dwóch. Zakładając liczbę 8-bitową, -1 jest zapisywane jako 255, ponieważ kiedy dodasz do czegoś 255, dostajesz o jeden mniej w akumulatorze (plus przeniesienie). -2 jest przechowywane jako 254 i tak dalej, aż do -128, która jest przechowywana jako 128. Tak więc dla liczb całkowitych ze znakiem, połowa zakresu 0-255 bajtu jest używana dla liczb dodatnich, a połowa dla liczb ujemnych. (Ta konwencja pozwala po prostu sprawdzić najwyższy bit liczby, aby sprawdzić, czy jest ona ujemna).

Pomyśl o tym jak o 24-godzinnym zegarze: dodanie 23 do godziny spowoduje godzinę wcześniejszą (następnego dnia). Zatem 23 jest modułowym odpowiednikiem zegara dla -1.

Jeśli używasz więcej niż 1 bajtu, musisz użyć większej liczby dla negatywów. Na przykład 16-bitowe liczby całkowite mają zakres od 0 do 65536. Tak więc 65535 jest używany do reprezentowania -1 i tak dalej, ponieważ dodanie 65535 do dowolnej liczby daje jedną mniej (plus przeniesienie).

W 6502 są tylko cztery operacje arytmetyczne: dodawanie, odejmowanie, mnożenie przez dwa (przesunięcie w lewo) i dzielenie przez dwa (przesunięcie w prawo). Mnożenie i dzielenie można wykonać przy użyciu tylko tych operacji w przypadku plików binarnych. Rozważmy na przykład pomnożenie 5 (binarne 101) i 3 (binarne 11). Podobnie jak w przypadku mnożenia dziesiętnego długiego, zaczynamy od prawej cyfry mnożnika i mnożymy 101 przez 1, dając 101. Następnie przesuwamy mnożnik w lewo i mnożymy 1010 przez 1, dając 1010. Następnie dodajemy te wyniki razem, dając 1111 lub 15. Ponieważ zawsze mnożymy tylko przez 1 lub 0, tak naprawdę nie mnożymy; każdy bit mnożnika służy po prostu jako flaga, która mówi nam, czy dodać (przesunięty) mnożnik, czy nie.

Podział jest analogiczny do ręcznego dzielenia długiego przy użyciu dzielników próbnych, z wyjątkiem binarnych. Jeśli dzielisz przez stałą, możesz to zrobić w sposób analogiczny do odejmowania: zamiast dzielenia przez X, mnożysz przez wstępnie obliczone odwzorowanie 1 / X, które daje pożądany wynik plus przepełnienie. Nawet dzisiaj jest to szybsze niż podział.

Teraz spróbuj wykonać matematykę zmiennoprzecinkową w asemblerze lub przekonwertować liczby zmiennoprzecinkowe na ładne formaty wyjściowe w asemblerze. I pamiętajcie, jest 1979 rok, a częstotliwość taktowania wynosi 1 MHz, więc musicie to zrobić tak efektywnie, jak to możliwe.

Rzeczy nadal działają podobnie do dzisiaj, z wyjątkiem większych rozmiarów słów i większej liczby rejestrów, i oczywiście większość matematyki jest teraz wykonywana przez sprzęt. Ale nadal odbywa się to w ten sam fundamentalny sposób. Jeśli na przykład zsumuje się liczbę przesunięć i sum wymaganych do zwielokrotnienia, koreluje to raczej dobrze z liczbą cykli wymaganych dla instrukcji zwielokrotnienia sprzętowego na wczesnych procesorach posiadających taką instrukcję, na przykład 6809, w której została wykonana w mikrokodzie w podobny sposób, jak robiłbyś to ręcznie. (Jeśli masz większy budżet tranzystora, istnieją szybsze sposoby wykonywania zmian i dodawania, więc nowoczesne procesory nie wykonują tych operacji sekwencyjnie i mogą wykonywać multiplikacje w zaledwie jednym cyklu).

— kindall
źródło

3

Hej, dziękuję za bardzo szczegółowe wyjaśnienie! Właśnie tego chciałem! Będąc na moim poziomie, często zapominacie, że to, co was wspiera, jest ogólnie bardziej złożone niż cokolwiek, co robicie. Właśnie z tego powodu chcę studiować informatykę. Nienawidzę faktu, że gdybym cofnął się w czasie, nie wiedziałbym, że świat się zmieni, tylko jak sformułować poprawną instrukcję SQL;) W każdym razie bardzo dziękuję za poświęcenie czasu na napisanie tej odpowiedzi, dałeś mi tester smaku do tego, co zamierzam zagłębić.

— Korvin Szanto

7

nie zgadzam się, asemblowanie jest wciąż zbyt wysokie, jeśli chcesz wiedzieć, jak arytmetyka komputerów, musisz spojrzeć na sprzęt, a przynajmniej algorytmy sprzętowe

— jk.

Eh Kiedy już wiesz, że istnieją addery i przełączniki, łatwo jest wyobrazić sobie, że są one kontrolowane przez sprzęt i oprogramowanie, i łatwiej jest grać z oprogramowaniem.

— kindall

4

-1. Mnożenie sprzętowe nie było wykonywane z przesunięciami i dodawaniem przez prawie 3 dekady, a wiele procesorów może wykonać mnożenie w jednym cyklu. Szczegółowe informacje można znaleźć w artykule w Wikipedii Binary Multiplier.

— Mason Wheeler

24

Ostatecznie podstawowe operacje arytmetyczne są wykonywane sprzętowo. Mówiąc dokładniej, w procesorze (lub w rzeczywistości jego podsekcji)

Innymi słowy, są to układy elektroniczne. Ustaw odpowiednie bity jako dane wejściowe, a otrzymasz odpowiednie bity jako dane wyjściowe. Jest to połączenie podstawowych bramek logicznych.

http://en.wikipedia.org/wiki/Adder_%28electronics%29

http://en.wikipedia.org/wiki/Binary_multiplier

— Dagnele
źródło

3

Algorytmy dla sprzętu są dokładnie określone i mogą być badane oddzielnie od sprzętu.

— S.Lott,

@ S.Lott: Twój komentarz jest mylący. Dla mnie algorytmy obejmują szereg kroków, które wykonujesz, procedurę, coś, co możesz zaprogramować. Mówimy tutaj o obwodach elektronicznych wykonujących podstawowe operacje arytmetyczne. Innymi słowy, tylko sekwencja bramek, w których płynie prąd. W najlepszym razie jest to bardziej „logiczne” niż „algorytmiczne”. ... moje 2 centy.

— Dagnelies

6

Algorytm jest „skończony, określony i skuteczny”. Może być wykonywany w obwodach lub wykonywany za pomocą papieru i ołówka, lub za pomocą Tinkertoyów lub cząsteczek w naczyniu lub DNA. Algorytm może być dowolny. Obwód elektroniczny musi być zgodny z określonym algorytmem. W magiczny sposób nie pokonuje potrzeby algorytmów.

— S.Lott,

1

Czy proces składający się tylko z jednego kroku byłby uważany za „algorytm”? FWIW, obwody elektroniczne na ogół podążają za tabelą prawdy - jednoetapowe przetwarzanie. To, że tablica prawdy zostaje „skompilowana” w wielowarstwowe bramy, nie neguje faktu, że jest to proces jednoetapowy.

— slebetman

2

@ S.Lott: Bardziej odpowiednim pierwszym komentarzem byłoby: „logika” sprzętu jest dokładnie określona i może być badana oddzielnie od sprzętu. I rzeczywiście tak jest. Badanie logiki binarnej nazywa się Algebrą Boolean.

— slebetman

6

Wszystko to pokryte jest dokładną cierpliwością w sztuce programowania komputerowego Dona Knutha.

Wydajne algorytmy dodawania, odejmowania, mnożenia i dzielenia są opisane szczegółowo.

Możesz dobrze przeczytać takie rzeczy, które obejmują podział.

http://research.microsoft.com/pubs/151917/divmodnote.pdf

— S.Lott
źródło

5

Odbywa się to w pikosekundach za pomocą obwodów elektronicznych. „Mnożnik sprzętowy” Google itp., Aby uzyskać szczegółowe informacje. Nowoczesne procesory to niezwykle złożony wynik dziesięcioleci ciągłego doskonalenia.

BTW, skoro nie mnożycie przez wielokrotne dodawanie, dlaczego wyobrażacie sobie, że komputer by to zrobił?

— Kevin Cline
źródło

Moje pytanie dotyczy uzasadnienia funkcji, a nie samych funkcji. Rozumiem, że jest to interpretowane przez procesor, jestem ciekawy, jak to zrobić. W szczególności leżąca u podstaw teoria i sposób jej replikacji w pseudokodzie.

— Korvin Szanto

1

Mnożenie w mojej głowie to pamięć. Również długie mnożenie wymaga iteracji w sposób, w jaki to zrobiłem. Pójdę naprzód i

— stworzę

2

@Korvin, książka, którą poleciłem, będzie ci dobrze służyć, jeśli leży to w twoim interesie. Polecam także „Strukturę i interpretację programów komputerowych” Harolda Abelsona i Geralda Jaya Sussmana. Dogłębnie zajmuje się tymi pytaniami.

— Jonathan Henson

Kilka wczesnych komputerów obsługiwało tylko dodawanie i odejmowanie. Niektóre obsługiwane tylko odejmowanie! Tak więc operacja x = y * z została zaimplementowana tak jak do (z razy) {x + y} podobnie podział x = y / z został zaimplementowany, gdy (y> z) {x + 1; y = y - z}

— James Anderson

@James: czy wspierali zmianę? Spodziewałbym się, że mnożenie nastąpiło przez przesunięcie i dodanie, podczas gdy podział był przesunięciem, porównaniem, odjęciem.

— kevin cline

4

W żadnym wypadku nie jest to dokładna odpowiedź, ale powinna dać ci pojęcie, jak rzeczy są realizowane. Jak zapewne wiesz, liczby są reprezentowane w postaci binarnej. Na przykład komputer może oznaczać liczbę 5 jako 00000101. Bardzo podstawową operacją, którą może wykonać komputer, jest przesunięcie w lewo, co dałoby 00001010, który jest dziesiętny 10. Gdyby dwukrotnie przesunąć w prawo, byłby to 00010100 (dziesiętnie 20). Za każdym razem, gdy przesuwamy cyfry w lewo, 1 raz podwajamy liczbę. Powiedzmy, że mam liczbę x i chciałem ją pomnożyć przez 17. Mogłem przesunąć x w lewo 4 razy, a następnie dodać x do wyniku (16x + x = 17x). Byłby to skuteczny sposób na pomnożenie liczby przez 17. To powinno dać ci pewien wgląd w to, jak komputer może pomnożyć duże liczby bez konieczności wielokrotnego dodawania.

Podział może używać kombinacji dodawania, odejmowania, przesunięcia w prawo, przesunięcia w lewo itp. Istnieje również wiele sztuczek służących do podnoszenia liczb do wykładników.

— WuHoUnited
źródło

Dla jasności możesz generalnie przesuwać o więcej niż jeden bit na raz. Więc te 4 operacje przesunięcia są właściwie tylko jedna operacja, jak: shl r0, 4.

— Caleb

4

Kiedy byłem dzieckiem, nauczyłem się rozmnażać i dzielić za pomocą długopisu i papieru, nie marnując czasu na zbyt wiele dodatków. Później dowiedziałem się, że pierwiastki kwadratowe są również obliczalne w ten sposób.

Na uniwersytecie nauczyłem się obliczać operacje trygonometryczne i logarytmiczne z kilkunastoma multiplikacjami, podziałami i dodatkami. Nazwali to serią Taylor.

Wcześniej mój ojciec dał mi książkę, w której te złożone operacje zostały już obliczone dla setek wartości i przedstawione w tabelach. Było także kilka wyjaśnień dotyczących szacowania błędu, gdy potrzebowano sinusa wartości między dwiema obliczonymi wartościami.

Jednostki całkowite, zmiennoprzecinkowe, GPU i DSP po prostu wdrażają wszystkie te stare techniki na krzemie.

— mouviciel
źródło

3

Spróbuję dać ci wyobrażenie o tym, w jaki sposób obwody cyfrowe są zaprojektowane do rozwiązywania problemów z przetwarzaniem cyfrowym, wykorzystując postawione problemy: w jaki sposób procesory implementują dodawanie i mnożenie.

Po pierwsze, usuńmy bezpośrednie pytanie: w jaki sposób język programowania skutecznie ocenia mnożenia i uzupełnienia. Odpowiedź jest prosta: zestawiają je w mnożenie i dodają instrukcje. Na przykład następujący kod:

a = 1 + 1;
b = a * 20;

jest po prostu skompilowany do czegoś takiego jak:

ADD 1 1  a
MUL a 20 b

(zauważ, że powyższy zestaw jest dla wyimaginowanego procesora, który nie istnieje, dla uproszczenia).

W tym momencie zdajesz sobie sprawę, że powyższa odpowiedź po prostu przesuwa problem i rozwiązuje go za pomocą magii sprzętowej. Kolejne pytanie brzmi oczywiście, jak działa ta magia sprzętowa?

Najpierw spójrzmy na prostszy problem: dodanie.

Najpierw wykonujemy znany problem, dodając w regularnej bazie 10 liczb:

 17
+28

Pierwszym krokiem byłoby dodanie 7 i 8. Ale daje to 15, która jest więcej niż jedną cyfrą. Nosimy więc 1:

(1)
 17
+28
= 5

Teraz dodajemy 1, 1 i 2 razem:

 17
+28
=45

Z tego otrzymujemy następujące zasady:

gdy wynikiem dodawania jest więcej niż jedna cyfra, zachowujemy najmniej znaczącą cyfrę i przenosimy najbardziej znaczącą cyfrę do przodu
jeśli mamy cyfrę przeniesioną do naszej kolumny, dodajemy ją wraz z liczbami, które dodajemy

Teraz nadszedł czas, aby zinterpretować powyższe reguły w bazie 2 - algebra boolowska.

Tak więc w algebrze boolowskiej, dodanie 0 i 1 razem = 1. Dodanie 0 i 0 = 0. I dodanie 1 i 1 = 10, co jest więcej niż jedną cyfrą, więc przenosimy 1 do przodu.

Z tego możemy zbudować tabelę prawdy:

a b  |  sum  carry
-------------------
0 0  |   0     0
0 1  |   1     0
1 0  |   1     0
1 1  |   0     1

Na tej podstawie możemy zbudować dwa obwody / równania boolowskie - jeden dla wyniku sumy, a drugi dla wyniku przeniesienia. Najbardziej naiwnym sposobem jest po prostu wypisanie wszystkich danych wejściowych. Dowolna tabela prawdy, bez względu na to, jak duże i złożone można przekształcić w tej formie:

(AND inputs in first row) OR (AND of inputs in second row) OR ...

Jest to w zasadzie suma postaci produktów. Patrzymy tylko na wyniki, które dają 1 i ignorujemy 0:

sum = (NOT a AND b) OR (a AND NOT b)

Zastąpmy AND AND i NOT symbolami języka programowania, aby ułatwić czytanie:

sum = (!a & b) | (a & !b)

Zasadniczo przekonwertowaliśmy tabelę tak:

a b  |  sum  equation
-------------------
0 0  |   0   
0 1  |   1   (!a & b)
1 0  |   1   (a & !b)
1 1  |   0

Można to bezpośrednio zaimplementować jako obwód:

                _____
 a ------------|     |
    \          | AND |-.     ____
     \  ,-NOT--|_____|  \   |    |
      \/                 `--| OR |----- sum
      /\        _____    ,--|____|
     /  `-NOT--|     |  /
    /          | AND |-`
 b ------------|_____|

Obserwatorzy czytający w tym miejscu zauważą, że powyższą logikę można faktycznie zaimplementować jako pojedynczą bramę - bramę XOR, która dogodnie ma zachowanie wymagane przez naszą tabelę prawdy:

                _____
 a ------------|     |
               | XOR |---- sum
 b ------------|_____|

Ale jeśli twój sprzęt nie zapewnia ci bramki XOR, powyższe kroki opisują, jak możesz ją zdefiniować i wdrożyć w zakresie bramek AND, OR i NOT.

Sposób przejścia na bramkę logiczną na rzeczywisty sprzęt zależy od posiadanego sprzętu. Można je zaimplementować przy użyciu różnych mechanizmów fizycznych, o ile mechanizm zapewnia pewien rodzaj przełączania. Wdrożono bramki logiczne ze wszystkim, od strumieni wody lub zaciągów powietrza (płynów), tranzystorów (elektronika) po spadające kulki. To duży temat sam w sobie, więc po prostu go pomaluję i powiem, że możliwe jest zaimplementowanie bramek logicznych jako urządzeń fizycznych.

Teraz robimy to samo dla sygnału przenoszenia. Ponieważ jest tylko jeden warunek, w którym sygnał przenoszenia jest prawdziwy, równanie jest po prostu:

carry = a & b

Noszenie jest proste:

                _____
 a ------------|     |
               | AND |---- carry
 b ------------|_____|

Łącząc je razem otrzymujemy tak zwany pół sumator:

                _____
 a ------;-----|     |
         |     | XOR |---- sum
 b --;---|-----|_____|
     |   |      _____
     |   '-----|     |
     |         | AND |---- carry
     '---------|_____|

Nawiasem mówiąc, równania dla powyższego obwodu wyglądają następująco:

sum = a ^ b
carry = a & b

W połowie sumatora czegoś brakuje. Wdrożyliśmy pierwszą zasadę - jeśli wynik jest więcej niż jedna cyfra niż przeniesienie, ale nie wdrożyliśmy drugiej reguły - jeśli istnieje przeniesienie, dodaj ją wraz z liczbami.

Aby więc wdrożyć pełny sumator, obwód sumowania, który może dodawać liczby, które są więcej niż jedną cyfrą, musimy zdefiniować tabelę prawdy:

a b c  |  sum  carry
---------------------
0 0 0  |   0     0
0 0 1  |   1     0
0 1 0  |   1     0
0 1 1  |   0     1
1 0 0  |   1     0
1 0 1  |   0     1
1 1 0  |   0     1
1 1 1  |   1     1

Równanie sumy jest teraz:

sum = (!a & !b & c) | (!a & b & !c) | (a & !b & !c) | (a & b & c)

Możemy przejść przez ten sam proces, aby wyliczyć i uprościć równanie i zinterpretować je jako obwód itp., Jak to zrobiliśmy powyżej, ale myślę, że ta odpowiedź jest zbyt długa.

Do tej pory powinieneś dowiedzieć się, jak zaprojektowana jest logika cyfrowa. Są inne sztuczki, o których nie wspomniałem, takie jak mapy Karnaugh (używane w celu uproszczenia tabel prawdy) i kompilatory logiczne, takie jak espresso (abyś nie musiał ręcznie uwzględniać równań boolowskich), ale podstawową zasadą jest to, co mam przedstawione powyżej:

Rozłóż problem, aż będziesz mógł pracować na poziomie jednego bitu (cyfry).
Zdefiniuj pożądane wyniki za pomocą tabeli prawdy.
Przekształć tabelę w równanie boolowskie i uprość równanie.
Interpretuj równanie jako bramki logiczne.
Przekształć obwód logiczny w rzeczywiste obwody sprzętowe, wdrażając bramki logiczne.

W ten sposób naprawdę rozwiązuje się podstawowe (a raczej niskopoziomowe) problemy - mnóstwo tabel prawdy. Prawdziwa twórcza praca polega na rozkładaniu złożonego zadania, takiego jak dekodowanie MP3 do poziomu bitowego, aby można było pracować nad nim przy użyciu tabel prawdy.

Niestety nie mam czasu na wyjaśnienie, jak zaimplementować mnożenie. Możesz spróbować złamać go, ustalając zasady działania mnożenia, a następnie interpretując go w formacie binarnym, a następnie próbując rozbić go na tabele prawdy. Lub możesz przeczytać Wikipedię: http://en.wikipedia.org/wiki/Binary_multiplier

— Slebetman
źródło

2

podstawowe instrukcje arytmetyczne są wykonywane z instrukcjami montażu, które są bardzo wydajne.

Bardziej złożone (lub abstrakcyjne) instrukcje są wykonywane w asemblerze za pomocą mechanizmów zapętlających lub obsługiwane w standardowej bibliotece.

Studiując matematykę na studiach, zaczniesz studiować takie rzeczy, jak rachunek Lambda i notacja Big-O. Wszystkie te i wiele innych są wykorzystywane przez programistów do oceny i tworzenia wydajnych algorytmów. W każdym razie, podstawowe rzeczy są zwykle osiągane na niskim poziomie, na przykład w asemblerze lub w c za pomocą wskaźników.

Świetnym wprowadzeniem do tego tematu jest „Kod” Charlesa Petzolda.

— Jonathan Henson
źródło

1

Lub tabele wyszukiwania. Znacznie szybciej jest wstępnie obliczać wartości i sprawdzać je. Przykłady Sin / Cos / Tan (podział na liczby całkowite, choć jest on wcześniej obliczany i przechowywany w sprzęcie).

— Martin York,

1

Zdobądź książkę podobną do Fundamentals of Digital Logic ... , która moim zdaniem jest wciąż dość standardowa dla studentów Freshman / Sophomore EE, i pracuj nad nią (wyd .: kosztuje niewielką fortunę, więc poszukaj używanej lub wcześniejszej wersji to). To poprowadzi cię przez sumatory i mnożniki i da ci wystarczająco dużo tła, aby zacząć rozumieć niektóre zasady stojące za tym, co robi sprzęt.

W krótkim czasie twoja odpowiedź brzmi: „ponieważ pasuje do siebie kilka kawałków prostszej logiki, aby wywołać to złożone zachowanie” zamiast „ponieważ tak jest”.

Jeśli chcesz spróbować zrozumieć wszystkie zasady kompilowania i uruchamiania programów, wybierz to w połączeniu, aby ostatecznie zobaczyć, jak wszystko spotyka się w środku.

— jonsca
źródło

1

Tutaj jest wiele dobrych odpowiedzi. Zacząłeś też od właściwego pomysłu: złożone operacje, takie jak mnożenie, są zbudowane z prostszych operacji. Jak się domyślacie, istnieją szybsze sposoby mnożenia bez instrukcji mnożenia niż przy użyciu szeregu dodatków. Każde zwielokrotnienie może być zaimplementowane jako suma pomnożonych zwielokrotnień lub jako kombinacja przesunięć i dodatków. Przykłady:

a = 5 + 5 + 5 + 5 + 5;           // 5*5, but takes 5 operations
b = (5 << 2) + 5;                // 5*5 in only 2 operations
c = (41 << 4) + (41 << 2) + 41   // 41*21 in 4 operations

Podział można również podzielić na mniejsze operacje. XOR (^) to wbudowana instrukcja na każdym procesorze, na który kiedykolwiek patrzyłem, ale mimo to może być zaimplementowana jako kombinacja AND, OR i NOT.

Mam jednak wrażenie, że konkretne odpowiedzi będą dla Ciebie mniej satysfakcjonujące niż ogólne wyobrażenie o rodzajach instrukcji dostarczanych przez procesor i sposobie łączenia tych instrukcji w bardziej złożone operacje. Dla tego rodzaju ciekawości nie ma nic lepszego niż zdrowa dawka języka asemblera. Oto bardzo przystępne wprowadzenie do języka asemblera MIPS.

— Caleb
źródło

1

Oto jak współczesny procesor może zaimplementować mnożenie dwóch 64-bitowych liczb całkowitych:

Wiesz, jak wykonać mnożenie długiej ręki. Aby pomnożyć dwie liczby 10-cyfrowe, należy pomnożyć jedną 10-cyfrową liczbę przez każdą z 10 cyfr drugiego numeru, zapisać wynik 11 cyfr jeden pod drugim i przesunąć, a następnie dodać całą liczbę.

Nowoczesny procesor robi to z wszystkimi bitami 64 na 64. Jednak mnożenie dwóch liczb pojedynczych bitów jest bardzo proste: 1 x 1 = 1, wszystkie inne produkty są zerowe. Jest to realizowane za pomocą logicznego i. I w przeciwieństwie do iloczynu dziesiętnego, w którym wynikiem mogą być dwie cyfry, iloczyn binarny liczb jednobitowych ma zawsze jeden bit.

Teraz masz 64 wiersze po 64 bity, które należy dodać. Ale 64 dodatki 64-bitowych liczb są zbyt wolne. Tak więc procesor używa sumatora 3/2 lub sumatora 7/3: Jeśli dodasz 3 liczby jednobitowe, wynikiem może być 0, 1, 2 lub 3, co pasuje do dwóch bitów. Jeśli dodasz 7 liczb jednobitowych, wynikiem będzie liczba od 0 do 7, którą można przedstawić za pomocą 3 bitów. IBM twierdzi, że może zrobić adder 7/3 za pomocą zaledwie 18 prymitywnych obwodów (dokumentacja PowerPC), założę się, że Intel i ARM mogą to zrobić.

Masz 4096 bitów, zgrupuj je w około 600 grup 7 bitów w tych samych pozycjach bitów i użyj około 600 7/3 sumatorów, aby zmniejszyć wynik z 4096 bitów do mniej niż 2000. Następnie robisz to samo raz za razem, dopóki nie skończysz z parami bitów, które można wprowadzić do zwykłego pełnego sumatora.

— gnasher729
źródło

Jak skutecznie ocenia się podstawową matematykę za pomocą języków programowania?

Pytanie:

Przykład