Dlaczego większa przepustowość oznacza wyższą przepływność w transmisji cyfrowej?


9

Rozumiem, że podobne pytania, takie jak to, zostały zadane wcześniej na tej stronie, wymienione poniżej. Jestem jednak zdezorientowany co do odpowiedzi. Jeśli wyjaśnię, co myślę, że rozumiem, czy ktoś może wskazać, gdzie się mylę?

Zacznę od tego, co wiem:

Prawo Shannona daje teoretyczną górną granicę

Cnoisy=Blog2(1+SN)

jeśli S = N, to C = B

Jak N → ∞, C → 0

Jak N → 0, C → ∞

Nyquist Formula podaje w przybliżeniu liczbę poziomów potrzebnych do osiągnięcia tego limitu

Cnoiseless=2Blog2M

(Jeśli nie używasz wystarczającej liczby poziomów logicznych, nie możesz zbliżyć się do limitu shannon, ale używając coraz większej liczby poziomów nie przekroczysz limitu shannon)


Mój problem polega na tym, że trudno mi zrozumieć, dlaczego przepustowość w ogóle ma związek z przepływnością. Wydaje mi się, że ważnym czynnikiem jest górna granica częstotliwości, którą można wysłać kanałem.

Oto bardzo uproszczony przykład: brak szumów, 2 poziomy logiczne (0 V i 5 V), brak modulacji i szerokość pasma 300 Hz (30 Hz - 330 Hz). Będzie miał limit Shannona ∞ i limit Nyquista 600 bps. Załóżmy również, że kanał jest doskonałym filtrem, więc wszystko poza pasmem jest całkowicie rozproszone. Gdy podwajam przepustowość, podwajam przepływność itp.

Ale dlaczego to jest? Dla dwupoziomowej transmisji cyfrowej Przy szerokości pasma 300 Hz (30 Hz - 330 Hz) sygnał cyfrowy „0 V” i „5 V” będzie (z grubsza) falą kwadratową. Ta fala prostokątna będzie miała rozproszenie harmonicznych poniżej 30 Hz i powyżej 330 Hz, więc nie będzie idealnie kwadratowa. Jeśli ma częstotliwość podstawową przy minimum 30 Hz, (więc „0 V” i „5 V” przełączają się 30 razy na sekundę), wówczas będzie dużo harmonicznych i ładna fala prostokątna. Jeśli ma częstotliwość podstawową przy maks. 330 Hz, sygnał będzie czystą falą sinusoidalną, ponieważ nie ma harmonicznych wyższego rzędu, które by ją ułożyły. Ponieważ jednak nie ma szumu, odbiornik nadal będzie w stanie odróżnić zera od zer. W pierwszym przypadku szybkość transmisji będzie wynosić 60 bps, ponieważ „0V” i „5 V” przełączają się 30 razy na sekundę. W drugim przypadku szybkość transmisji będzie wynosić maksymalnie 660 b / s (jeśli napięcie przełączania progu odbiornika wynosi dokładnie 2,5 V), a nieco mniej, jeśli napięcie progowe będzie inne.

Różni się to jednak od oczekiwanej odpowiedzi 600 bps dla górnej granicy. W moim wyjaśnieniu liczy się górna granica częstotliwości kanału, a nie różnica między górną a dolną granicą (szerokość pasma). Czy ktoś może wyjaśnić, co źle zrozumiałem?

Również gdy moja logika jest zastosowana do tego samego przykładu, ale przy użyciu modulacji FSK (kluczowanie z przesunięciem częstotliwości), mam ten sam problem.

Jeżeli zero jest wyrażone jako częstotliwość nośna 30 Hz, to jedno jest wyrażone jako częstotliwość nośna 330 Hz, a sygnał modulacji wynosi 330 Hz, wówczas maksymalna przepływność wynosi 660 b / s.

Znów, czy ktoś może wyjaśnić moje nieporozumienie?

Po co w ogóle korzystać z fali kwadratowej? Dlaczego nie możemy po prostu wysłać fal sinusoidalnych i zaprojektować odbiorniki tak, aby napięcie progowe przełączania znajdowało się dokładnie pośrodku między wartością maksymalną i minimalną fali sinusoidalnej? W ten sposób sygnał zająłby znacznie mniejszą szerokość pasma.

Dziękuje za przeczytanie!


Przepraszam za bardzo słabe formatowanie, którego podglądu nie opublikowałem. Naprawiłem to teraz.
Blue7

@Ignacio Vazquez-Abrams, no dobra, to mnie zaskakuje; Zakładałem, że uprości to mój przykład. 5 lub więcej Harmoniczne zwykle dają całkiem przyzwoitą falę kwadratową, więc dlaczego miałbyś mieć częstotliwości poza pasmem, aby uniknąć zniekształceń?
Blue7

Zamiast myśleć o tym, co dzieje się z pasmem pasmowym 30–300 Hz, wyobraź sobie, co by się stało, gdyby na przykład pasmo pasma wynosiło 1,0 do 1,3 kHz.
Photon

@ThePhoton: Przypuszczam, że w tym przypadku nie będzie można uzyskać harmonicznych wyższego rzędu, ponieważ gdy częstotliwość podstawowa wynosi 1 kHz, pierwsza harmoniczna wynosi 3 kHz, co jest znacznie poza pasmem pasmowym. Ale nadal mnie to myli. Jaka szkoda miałaby sama transmisja częstotliwości podstawowej?
Blue7

najpierw trochę terminologii. Podstawa jest taka sama jak pierwsza harmoniczna. Jeśli podstawą jest 1 kHz, to 3 kHz jest trzecią harmoniczną.
Photon

Odpowiedzi:


5

To subtelna kwestia, ale twoje myślenie idzie na manowce, gdy myślisz o tonie 330 Hz jako jakimś stopniu przekazującym 660 bitów / sekundę informacji. Nie - i w rzeczywistości czysty ton nie przekazuje żadnej informacji poza jej obecnością lub nieobecnością.

Aby przesłać informacje przez kanał, musisz być w stanie określić dowolną sekwencję stanów sygnalizacyjnych, które mają być transmitowane, i - to jest kluczowy punkt - umieć odróżnić te stany na drugim końcu.

Za pomocą kanału 30-330 Hz możesz określić 660 stanów na sekundę, ale okaże się, że 9% tych sekwencji stanów będzie naruszać ograniczenia przepustowości kanału i będzie nie do odróżnienia od innych sekwencji stanów na drugim końcu, więc nie możesz ich użyć. Właśnie dlatego przepustowość informacji wynosi 600 b / s.


W rzeczywistości, wysyłając tylko 30 symboli 2 stanów na sekundę, szybkość transmisji danych wynosi 30 bps. Nyquist mówi nam o górnej granicy szybkości transmisji danych, biorąc pod uwagę szerokość pasma i liczbę stanów na symbol. Wybrane kodowanie FSK nie zbliża się do tego limitu, ponieważ wybrane częstotliwości nie są optymalne. Nyquist mówi, że możemy wybrać lepsze częstotliwości.
le_top

@le_top: Żeby było jasne, nie mówiłem o modulacji FSK, chociaż OP wspomniał o tym w swoim pytaniu. Mówię o prostej sygnalizacji pasma podstawowego (np. Dwa poziomy napięcia). Nie sądzę, żeby cokolwiek napisałem było warte pochwały. Czy możesz wyjaśnić, co Twoim zdaniem jest nie tak z tym, co napisałem?
Dave Tweed

* Obecność lub brak tonu 330Hz przekazuje informacje, ponieważ jego obecność można interpretować jako 1, a jego brak jako 0. Modulacja jest włączona / wyłączona. * Tak więc 330Hz może przekazywać informacje 660bps przy braku tonu 30Hz. Który byłby hałasem w formule Shannona. * Po przeczytaniu ten błąd nadal występował. * Nie wyjaśniono, że 9% strata jest wyjaśniona twierdzeniem Nyquista o próbkowaniu, wskazującym, że sygnał jest doskonale odtwarzany z dokładnie 2B próbek na sekundę.
le_top

* Jeśli spróbujesz zrobić więcej, uzyskasz efekty aliasingu, stąd symbole ograniczenia 2B równe liczbie próbek. * Symbole 2B na każdy 1 bit (2 stany) to 600 bps przy B = 300. * Możliwe są 660 stanów, jeśli symbole reprezentują co najmniej 2,2 stany.
le_top

1
@le_top: Naprawdę nie rozumiem, do czego zmierzasz. W ogóle nie mówiliśmy o systemach próbkowanych (z czasem dyskretnym), więc kwestia aliasingu nigdy nie powstaje. Jaki jest twój punkt widzenia na pytanie?
Dave Tweed,

3

To tylko częściowa odpowiedź, ale mam nadzieję, że trafi ona do głównych punktów, w których nie rozumiesz.

Mój problem polega na tym, że trudno mi zrozumieć, dlaczego przepustowość w ogóle ma związek z przepływnością. ...

Jeżeli zero jest wyrażone jako częstotliwość nośna 30 Hz, to jedno jest wyrażone jako częstotliwość nośna 330 Hz, a sygnał modulacji wynosi 330 Hz, wówczas maksymalna przepływność wynosi 660 b / s.

Jeśli zmienisz zero na 30 Hz, musisz mieć około 1/60 s, aby naprawdę wiedzieć, że masz 30 Hz, a nie 20 Hz lub 50 Hz lub coś w tym rodzaju. Naprawdę w tym przypadku właśnie włączasz i wyłączasz kluczowanie swojej nośnej 300 Hz, a sygnał 30 Hz wysyłany przez 1/660 s podczas zer jest po prostu mylący.

Mówiąc o FSK, weźmy bardziej realistyczny przykład. Załóżmy, że używasz 1 MHz dla zera i 1,01 MHz dla jednego. Okazuje się, że musisz zmierzyć sygnał przez około1/2Δf, w tym przypadku 1/20 000 s, aby móc niezawodnie rozróżnić te dwie częstotliwości. Jeśli właśnie zmierzyłeś sygnał dla 1 nas, tak naprawdę nie byłbyś w stanie odróżnić sygnału 1 MHz od sygnału 1,01 MHz (chociaż w idealnym, pozbawionym szumu scenariuszu możesz to zrobić, podobnie jak wzór Shannona mówi, że możesz przesyłać nieskończone dane z zerową przepustowością, gdy SNR przechodzi w nieskończoność)

Tak więc w tym przykładzie szybkość transmisji, którą można wysłać, wynosi około 20 kHz, co odpowiada dwukrotności różnicy między częstotliwościami 1 i 0, tak jak formuła Nyquista prowadzi do oczekiwania na kod dwupoziomowy.


0

Twoje pytania są ważne i droga do właściwego zrozumienia tego, co teoria oznacza ;-).

Na pytanie, w jaki sposób większa przepustowość oznacza wyższą przepływność, wyjaśnienie może wydawać się proste, ale jednocześnie złe.

Oto „złe” wyjaśnienie, które wygląda dobrze. Jest to jednak początek zrozumienia, dlaczego większa przepustowość to więcej danych. Załóżmy, że mam pierwszy kanał WiFi numer 1 działający z prędkością 1 Mb / s, biorąc pod uwagę warunki zasilania i kodowania. Następnie wybieram inny kanał WiFi numer 2, który ma taką samą przepustowość, moc i warunki kodowania. Działa również z prędkością 1 Mb / s. Kiedy sumuję te dwa razem, podwoiłem przepustowość (dwa różne kanały) i podwoiłem przepustowość danych (2x1 Mb / s).

Jeśli uważasz, że to wygląda na idealne wyjaśnienie, zapominasz, że podwoiliśmy moc. Podobnie podwójna przepustowość danych wynika z podwojonej mocy lub z podwójnej przepustowości. Właściwie to trochę oba.

Jeśli utrzymuję całkowitą moc na tym samym poziomie, podwajając przepustowość, muszę porównać pierwszy kanał Wi-Fi działający z prędkością 1 Mb / s z sumą dwóch innych kanałów Wi-Fi działających z połową odbieranej mocy. Nie zamierzam sprawdzać kart danych modemów Wi-Fi, ale byłoby to interesujące ćwiczenie do porównania z następującym podejściem teoretycznym. Shannon pomaga nam przewidywać, co stanie się mniej więcej, jeśli kodowanie dostosuje się do poziomów mocy (co ma miejsce w przypadku WiFi). Jeśli kodowanie nie dostosowuje się, szybkość danych pozostaje stała, dopóki poziom odbioru nie będzie zbyt niski, a wtedy spadnie do 0.

Tak więc shannon mówi: C = B ∗ log2 (1 + S / N). Przy zachowaniu całkowitej mocy, ale podwojeniu przepustowości, C2 = 2 * B * log2 (1+ (S / 2) / N), gdzie C2 jest potencjalną szybkością transmisji danych. Podając liczby rzeczywiste, możemy założyć, że S = 2xN, więc log2 (1 + 2) = 1,58 i log2 (1 + 1) = 1. Zatem C = B * 1,58 i C2 = B * 2. Innymi słowy, kiedy mój poziom sygnału przy największej szerokości pasma jest równy poziomowi szumu, potencjalna szybkość transmisji danych jest o około 26% wyższa niż ta sama łączna moc emitowana w połowie szerokości pasma. Teoretycznie ultra wąskie pasmo nie może być bardziej wydajne niż pasmo ultrawydajne oparte na twierdzeniu Shannona. Podwojenie przepustowości przy tym samym całkowitym poziomie mocy nie podwaja przepustowości, jak sugerował nasz przykład WiFi. Ale przepustowość jest wyższa. Jeśli możemy pominąć termin „1” w log2 wyrażenia Shannona,

Jednak, jak wspomniałem, kodowanie musi się dostosować, musi być zoptymalizowane do rzeczywistej dostępnej mocy i przepustowości. Jeśli kodowanie pozostaje takie samo, po prostu przechodzę od operacyjnego do dysfunkcyjnego.

Przechodząc do twojego drugiego pytania, jeśli mam sygnał FSK zmieniający się przy 30 Hz z dwiema częstotliwościami, wtedy mogę emitować tylko przy 30 bps, ponieważ wysyłam 30 symboli na sekundę, każdy odpowiadający bitowi 1 lub 0. Jeśli wprowadzę 4 stany ( = 4 częstotliwości) poprzez wprowadzenie dwóch częstotliwości pomiędzy poprzednimi, ponieważ mój poziom hałasu na to pozwala, a następnie emituję z prędkością 4x30bps = 120bps. W przypadku FSK nie sądzę, aby szerokość pasma pozostała stała podczas zwiększania liczby stanów w ten sposób, ale z pewnością można znaleźć sposób na utrzymanie jej mniej więcej na stałym poziomie (biorąc pod uwagę ograniczenia 3dB, ponieważ teoretyczne spektrum częstotliwości jest nieograniczone).

Po co używać fali prostokątnej do sygnału „modulującego”? Jest to wybór w tym kodowaniu, który ułatwia „dekodowanie”, ponieważ po stronie odbiornika wystarczy filtr pasmowy dla każdej częstotliwości. Nadal emitujesz „fale sinusoidalne” - jeśli emitujesz tylko wartości „1”, masz tylko jedną częstotliwość. Jednak przesunięcia częstotliwości sugerują obecność „harmonicznych”, które pozwalają / towarzyszą tym przesunięciom częstotliwości. Inne kodowania mają inne zalety i wady. Na przykład widmo rozproszone z bezpośrednią sekwencją pozwala mieć sygnał poniżej poziomu szumu (a zatem mają niższe wymagania mocy anteny dla podobnej przepływności w wielu innych kodowaniach), ale trudniej jest dekodować (a zatem wymagać większej (obliczeniowej) mocy i złożoność w obwodzie dekodującym).

Niezależnie od wybranego kodowania, musi ono przestrzegać twierdzenia Shannona, które ustala górną granicę. Nie możesz po prostu zastosować Shannon do kodowania takiego jak FSK, jeśli nie dostosujesz poziomu mocy, liczby stanów i innych parametrów sygnału FSK, gdy zmienia się poziom szumu lub poziom sygnału (odległość). Shannon pozwala sprawdzić absolutną minimalną moc dla danej przepustowości i szybkości transmisji danych. Metoda kodowania zwiększy minimalny limit mocy. A gdy poziomy mocy przekroczą ten limit, szybkość transmisji pozostanie po prostu stała. Zastosowanie Shannon jest po prostu niepoprawne, jeśli chcesz wyjaśnić, że większa przepustowość oznacza wyższą przepływność. Przykład WiFi może bardzo dobrze mieć zastosowanie w praktyce do wyjaśnienia w tym miejscu, ale nie jest to ogólna odpowiedź oparta na twierdzeniu Shannona.

Edycja: ponowne przeczytanie pytania: „W drugim przypadku szybkość transmisji będzie wynosić maksymalnie 660 b / s”. W rzeczywistości nie do końca rozumiem, w jaki sposób osiągasz 660 bps, ponieważ częstotliwość zmienia się tylko 30 razy na sekundę i kodujesz na dwóch częstotliwościach, które są 1-bitowe. Stąd moje 30 bps powyżej. To kodowanie pozwala na jeden pełny okres przy 30 Hz i 22 pełne okresy przy 660 Hz dla każdego symbolu. Ale 22 okresy nie zmieniają faktu, że istnieje tylko jeden symbol. Wygląda na to, że czegoś brakuje lub że rozumowanie jest nieprawidłowe.

Edit2: Rozumiem - porównujesz z limitem nyquist. Ten limit nyquist określa górną granicę szybkości transmisji danych, biorąc pod uwagę szerokość pasma i liczbę stanów na symbol. Tutaj wybrane kodowanie FSK nie jest optymalne. Używasz 30 Hz i 660 Hz. Limit Nyquista mówi, że 30 bps = 2 * B * log2 (2), dlatego pasmo musi wynosić co najmniej B = 15 Hz. Bez szczegółowego sprawdzania, mówi mniej więcej, że ustawienie częstotliwości FSK na 645 Hz i 660 Hz byłoby dobrą optymalizacją szerokości pasma (jeśli FSK jest inaczej optymalnym kodowaniem i bez sprawdzania dokładnej szerokości pasma ze względu na harmoniczne - 15 Hz może być zbyt niski dla FSK).

Edycja 3 - Wyjaśnienie po dalszej analizie w celu dalszego wyjaśnienia źródła pomyłki z innym pytaniem i oryginalnym pytaniem.

  • Formuła Nyquista opiera się na twierdzeniu o próbkowaniu wskazującym, że sygnał o szerokości pasma B jest doskonale odtwarzany z dokładnie 2B próbek na sekundę.
  • Stąd każda próbka 2B może reprezentować symbol (intensywność może określić, który symbol).
  • Sygnał o szerokości 300 Hz można odtworzyć za pomocą 600 symboli - nie więcej.
  • Właśnie dlatego istnieje „aliasing” - ograniczenie przepustowości może sprawić, że dwa różne sygnały wyglądają tak samo po próbkowaniu.
  • Jeśli każdy symbol reprezentuje tylko 2 stany, możliwe jest tylko 600 bps.
  • FSK od 30 Hz do 330 Hz może reprezentować ponad 600 bps, ale wtedy należy wziąć pod uwagę więcej niż 2 stany na symbol. Ale nie jest już demodulacją FSK, ponieważ można nie tylko wziąć pod uwagę częstotliwość.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.