Innym powodem wyboru krótkiego jest dopasowanie go do innych przypadków, w których można określić zestaw znaków w znacznikach. Na przykład:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
Spójność pomaga zmniejszyć liczbę błędów i zwiększyć czytelność kodu.
Pamiętaj, że w atrybucie charset nie jest rozróżniana wielkość liter. Możesz użyć UTF-8 lub utf-8, jednak UTF-8 jest bardziej przejrzysty, czytelny i dokładny.
Ponadto absolutnie nie ma żadnego powodu, aby używać wartości innej niż UTF-8 w atrybucie meta charset lub nagłówku strony. UTF-8 to domyślne kodowanie dokumentów internetowych od HTML4 w 1999 roku i jedyny praktyczny sposób na tworzenie nowoczesnych stron internetowych.
Nie należy także używać encji HTML w UTF-8. Znaki takie jak symbol praw autorskich należy pisać bezpośrednio. Jedynymi elementami, których powinieneś użyć, są 5 zarezerwowanych znaków znaczników: mniej niż, większy niż, znak ampersand, liczba pierwsza, liczba podwójna pierwsza. Jednostki potrzebują parsera HTML, z którego nie zawsze będziesz chciał korzystać w przyszłości, wprowadzają błędy, zmniejszają czytelność kodu, zwiększają rozmiary plików, a czasem nieprawidłowo dekodują w różnych przeglądarkach, w zależności od używanych jednostek. Dowiedz się, jak wpisywać / wstawiać prawa autorskie, znaki handlowe, otwartą wycenę, zamknij wycenę, apostrof, em kreskę, kreskę, punktor, euro i wszelkie inne znaki, które napotkasz w swoich treściach, i używaj tych znaków w kodzie. Mac ma przeglądarkę znaków, którą można włączyć w Preferencjach systemowych klawiatury, i możesz znaleźć, a następnie przeciągnąć i upuścić potrzebne znaki lub użyć pasującej przeglądarki klawiatury, aby zobaczyć, które klawisze wpisać. Na przykład znakiem towarowym jest Option + 2. UTF-8 zawiera wszystkie znaki i symbole z każdego pisanego języka ludzkiego. Nie ma więc usprawiedliwienia dla użycia - zamiast kreski em. Poznanie zasad interpunkcji i typografii również nie jest złym pomysłem ... na przykład wiedząc, że kropka zawiera się w ścisłym cytacie, a nie na zewnątrz.
Użycie znacznika do czegoś takiego jak typ zawartości i kodowanie jest wysoce ironiczne, ponieważ bez znajomości tych rzeczy nie można przeanalizować pliku w celu uzyskania wartości metatagu.
Nie, to nie jest prawda. Przeglądarka zaczyna analizować plik jako domyślne kodowanie przeglądarki, UTF-8 lub ISO-8859-1. Ponieważ US-ASCII jest podzbiorem zarówno ISO-8859-1, jak i UTF-8, przeglądarka może dobrze odczytać tak czy inaczej ... tak samo. Gdy przeglądarka napotka metatag, jeśli kodowanie jest inne niż to, z którego już korzysta przeglądarka, przeglądarka ponownie ładuje stronę w określonym kodowaniu. Właśnie dlatego umieściliśmy meta charset tag u góry, tuż za tagiem head, zanim cokolwiek innego, nawet tytuł. W ten sposób możesz używać znaków UTF-8 w swoim tytule.
Musisz zapisać swoje pliki w kodowaniu UTF-8 bez BOM
To nie jest do końca prawda. Jeśli masz w dokumencie tylko znaki US-ASCII, możesz zapisać go jako US-ASCII i służyć jako UTF-8, ponieważ jest to podzbiór. Ale jeśli są znaki Unicode, masz rację, musisz zapisać jako UTF-8 bez BOM.
Jeśli chcesz mieć dobry edytor tekstu, który zapisze twoje pliki w UTF-8, polecam Notepad ++.
Na komputerze Mac użyj Bare Bones TextWrangler (bezpłatny) z Mac App Store lub Bare Bones BBEdit, który jest w Mac App Store za 39,99 USD ... bardzo tanie za tak świetne narzędzie. W obu aplikacjach na dole okna dokumentu znajduje się menu, w którym określasz kodowanie dokumentu i możesz łatwo wybrać „UTF-8 bez BOM”. I oczywiście możesz ustawić to jako domyślne dla nowych dokumentów w Preferencjach.
Ale jeśli Twój serwer obsługuje kodowanie w nagłówku HTTP, co jest zalecane, oba [metatagi] są niepotrzebne.
To jest niepoprawne Należy oczywiście ustawić kodowanie w nagłówku HTTP, ale należy również ustawić go w atrybucie meta charset, aby użytkownik mógł zapisać stronę poza przeglądarką w pamięci lokalnej, a następnie otworzyć ponownie później, w takim przypadku jedynym wskazaniem kodowania, które będzie obecne, jest atrybut meta charset. Powinieneś również ustawić znacznik podstawowy z tego samego powodu ... na serwerze znacznik podstawowy jest niepotrzebny, ale po otwarciu z pamięci lokalnej znacznik podstawowy umożliwia działanie strony tak, jakby znajdowała się na serwerze, ze wszystkimi zasoby w miejscu i tak dalej, brak zepsutych linków.
AddDefaultCharset UTF-8
Lub możesz po prostu zmienić kodowanie określonych typów plików, tak jak to:
AddType text/html;charset=utf-8 html
Wskazówka dotycząca obsługi plików UTF-8 i Latin-1 (ISO-8859-1) polega na nadaniu plikom UTF-8 rozszerzenia „tekstowego”, a plików Latin-1 „txt”.
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
Na koniec rozważ zapisanie dokumentów z zakończeniami linii uniksowej, a nie ze starszymi wersjami DOS lub (klasycznymi) zakończeniami linii Mac, które nie pomagają i mogą boleć, szczególnie w miarę, jak coraz bardziej oddalamy się od tych starszych systemów. Dokument HTML z prawidłowym kodowaniem HTML5, UTF-8 i zakończeniami linii uniksowych to dobrze wykonane zadanie. Możesz udostępniać i edytować oraz przechowywać i czytać oraz odzyskiwać i polegać na tym dokumencie w wielu kontekstach. To lingua franca. To jest cyfrowy papier.