Jak poprzednia odpowiedź, zestaw znaków jest zestawem znaków (liter, cyfr, ideogramów itp.) Przypisanych do liczby; aby je zobaczyć, musisz mieć czcionkę (czytamy małe „zdjęcia”). Były ważne przy użyciu LatinX, ponieważ dla każdego X ta sama liczba (bajt) może odnosić się do innego znaku.
W dzisiejszych czasach ważniejsze jest wybranie kodowania: standardem jest UTF-8, najskuteczniejsza reprezentacja Unicode (kompatybilna z ASCII, ale tak elastyczna, aby obejmować wszystkie języki, nawet chińskie i japońskie) oraz standard W3C. Innymi słowy, obejmuje wszystkie zestawy znaków.
Zestawienie: jest to staromodne słowo pochodzące z łaciny. Oznacza to: porównaj kopię (rękopis) z oryginałem, aby znaleźć różnice (błędy lub zmiany). W przeszłości było to bardzo przydatne, ale teraz jest to prawie archaizm, ponieważ nasze dokumenty i książki są pisane za pomocą komputerów, a kopia jest zawsze identyczna z oryginałem. Przykład: w języku włoskim (pochodzi z łaciny) istnieje czasownik „collazionare”, ale znajduje się w słownikach i nikt go nie używa.
Tak więc zestawienie określa zachowanie operatorów porównania: =,>, <, <=,> = ...
Oczywiście operatory te są używane do decydowania, czy dwa ciągi są takie same, czy też słowo jest „większe” niż inne, co jest bardzo ważne, jeśli chcemy sortować. Litery nie są w tej samej kolejności dla każdego języka, więc słowo może być większe niż inne, używając sortowania, ale nie innego. Zobacz [1] praktyczny przykład.
zestawienia „bin” są najbardziej ścisłe: SELECT „b” = „B” => FALSE
w sortowaniu „ci” nie jest rozróżniana wielkość liter: SELECT „b” = „B” => PRAWDA
„ogólne” zwykle ignorują pewne różnice: WYBIERZ „a” = „à” => PRAWDA
inne są specyficzne dla jednego lub więcej języków. Przykład „szwedzki” (nie wiem, dlaczego szwedzki jest często domyślny)
Wciąż szukam strony internetowej, w której szczegółowo opisano zachowanie każdego zestawienia ... przykłady te wynikają z mojego doświadczenia.
[1] http://www.olcot.co.uk/sql-blogs/revised-difference-between-collation-sql_latin1_general_cp1_ci_as-and-latin1_general_ci_as