Ostatnio widziałem kilka identyfikatorów URI zawierających parametr zapytania „utf8 = ✓”. Moje pierwsze wrażenie (po pomyśle „mmm, wygląda świetnie”) było takie, że można go użyć do wykrycia zepsutego kodowania znaków. Czy jest to lepszy sposób na rozwiązanie potencjalnych problemów z kodowaniem znaków, czy może programista dobrze się bawi?
W moim systemie plików (Windows 7) mam kilka plików tekstowych (jeśli są to pliki skryptowe SQL). Po otwarciu za pomocą Notepad ++ , w menu „Kodowanie” niektóre z nich mają kodowanie „UCS-2 Little Endian”, a niektóre „UTF-8 bez BOM”. Jaka jest tutaj różnica? Wszystkie wydają się być całkowicie poprawnymi skryptami. …
Wszystkie znaki w ASCII mogą być kodowane za pomocą UTF-8 bez zwiększania pamięci (oba wymagają bajtu pamięci). UTF-8 ma dodatkową zaletę obsługi postaci poza „znakami ASCII”. Jeśli tak, to dlaczego kiedykolwiek wybieramy kodowanie ASCII zamiast UTF-8? Czy istnieje przypadek użycia, w którym wybieramy ASCII zamiast UTF-8?
W przypadku inwazji obcych i zmuszeni jesteśmy wspierać ich języki we wszystkich naszych istniejących systemach komputerowych, czy UTF-8 został zaprojektowany w taki sposób, aby uwzględnić ich możliwie dużą liczbę postaci? (Oczywiście nie wiemy, czy kosmici rzeczywiście mają języki, czy i jak się komunikują, ale ze względu na kłótnię, wyobraź sobie, …
Używamy MySQL w firmie, w której pracuję, i budujemy zarówno aplikacje klienckie, jak i wewnętrzne przy użyciu Ruby on Rails. Kiedy zacząłem tu pracować, napotkałem problem, z którym nigdy wcześniej się nie spotkałem; baza danych na serwerze produkcyjnym jest ustawiona na Latin-1, co oznacza, że klejnot MySQL zgłasza wyjątek za …
Mój wkurzony zwierzak patrzy na tak wiele projektów oprogramowania, które mają góry kodu do obsługi zestawu znaków. Nie zrozum mnie źle, jestem za zgodą i cieszę się, że edytory tekstu pozwalają otwierać i zapisywać pliki w wielu zestawach znaków. Denerwuje mnie to, jak rozprzestrzenianie się nie uniwersalnych kodowań znaków jest …
Zgodnie z artykułem Wikipedii UTF-8 ma ten format: Pierwszy kod Ostatni kod Bajty Bajt 1 Bajt 2 Bajt 3 Bajt 4 punkt punkt Używany U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx …
Czy UTF-16 ma stałą szerokość czy zmienną szerokość? Otrzymałem różne wyniki z różnych źródeł: From http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF : UTF-16 przechowuje znaki Unicode w szesnastobitowych porcjach. From http://en.wikipedia.org/wiki/UTF-16/UCS-2 : UTF-16 (16-bitowy format transformacji Unicode) to kodowanie znaków dla Unicode, zdolne do kodowania 1 112 064 [1] liczb (zwanych punktami kodowymi) w przestrzeni …
Wydaje mi się, że często tak naprawdę nie wybierasz formatu, w jakim znajduje się kod. Mam na myśli, że większość moich narzędzi w przeszłości zdecydowała się na mnie. Albo nawet tak naprawdę o tym nie myślałem. Kiedyś korzystałem z TextPada na Windowsie, a kiedy zapisywałem plik, pojawił się monit o …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.