Co oznaczają STX, SOH i GS w danych wyjściowych Notepad ++?


20

Po przejrzeniu źródła MIME wiadomości e-mail (prawdopodobnie zawierającej znaki międzynarodowe) widzę takie rzeczy w Notepad ++

wprowadź opis zdjęcia tutaj

Rozumiem, że CRLFto jest linia powrotu karetki, ale co z pozostałymi? Co robi SOH, GSi STXśrednią?

Odpowiedzi:


19

Notepad ++ używa tych symboli do reprezentowania znaków kontrolnych lub znaków niedrukowalnych.

Postać sterująca - Wikipedia

Znak kontrolny lub znak niedrukowalny to punkt kodowy (liczba) w zestawie znaków, który nie reprezentuje zapisanego symbolu.

Kody kontrolne C0 i C1 - Wikipedia

STX - Początek tekstu - Pierwszy znak tekstu wiadomości i można go użyć do zakończenia nagłówka wiadomości.

SOH - Początek nagłówka - Pierwszy znak nagłówka wiadomości.

GS - Separator grup - Może być używany jako ograniczniki do oznaczania pól struktur danych. Jeśli jest używany dla poziomów hierarchicznych, US jest najniższym poziomem (dzielącym elementy danych w postaci zwykłego tekstu), podczas gdy RS, GS i FS mają coraz wyższy poziom, aby podzielić grupy złożone z elementów poziomu poniżej.


Hmm ... Nie wiem, dlaczego nagłówki wiadomości e-mail mogą zawierać znak, który nie jest drukowany. Czy właściwe byłoby zinterpretowanie tego wcześniejszego opisu w ten sposób, że „znak kontrolny lub znak niedrukowalny to punkt kodowy (liczba) w zestawie znaków, który nie reprezentuje zapisanego symbolu ASCII”.
Mike B,

Nie znam specyfikacji nagłówków poczty ani powodów, dla których mogą one zawierać znaki niedrukowalne. Jednak Notepad ++ używa własnych symboli (jak pokazano) do wyświetlania tych znaków kontrolnych.
Steven

Wszystkie niedrukowalne znaki pojawiają się w nagłówku X-Przykład, w cudzysłowie. Ten nagłówek nie jest częścią żadnego standardu poczty elektronicznej (patrz stackoverflow.com/questions/14469110/… ). Zostanie on ustawiony przez klienta, który utworzył wiadomość e-mail, lub może przez jeden z transportów po drodze. Tak czy inaczej, jeśli chodzi o przetwarzanie wiadomości e-mail, jest to skutecznie komentarz i może być czymkolwiek. To tak, jakby ktoś narysował małe serce na kopercie - nie jest to część standardu pocztowego i w ogóle nie wpływa na doręczenie.
Randy Orrison

... no cóż, oczywiście, o ile tak naprawdę nie psuje rzeczy. Nagłówek X z naprawdę długimi łańcuchami UNICODE może wywołać błąd przepełnienia bufora w programie transportowym, a serce zapisane nad adresem może pomylić listonosza. Ale w granicach rozsądku jest to po prostu ignorowane.
Randy Orrison

6

SOH jest Start Of Header

STX jest Start of teXt

GS jest Group Seperator

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.