Witamy w Unicode
Wszystkie te rozwiązania są zasadniczo niewłaściwe dla nowoczesnego tekstu. Musisz użyć czegoś, co rozumie wielkość liter. Ponieważ Bob poprosił o inne języki, dam Perlowi parę.
Dostarczam cztery rozwiązania, od najgorszego do najlepszego. Tylko najlepszy jest zawsze odpowiedni. Inni mają problemy. Oto test, aby pokazać, co działa, a co nie i gdzie. Użyłem znaków podkreślenia, aby zobaczyć, gdzie zostały wstawione spacje, i oznaczyłem jako niewłaściwe wszystko, co jest, no cóż, złe.
Testing TheLoneRanger
Worst: The_Lone_Ranger
Ok: The_Lone_Ranger
Better: The_Lone_Ranger
Best: The_Lone_Ranger
Testing MountMᶜKinleyNationalPark
[WRONG] Worst: Mount_MᶜKinley_National_Park
[WRONG] Ok: Mount_MᶜKinley_National_Park
[WRONG] Better: Mount_MᶜKinley_National_Park
Best: Mount_Mᶜ_Kinley_National_Park
Testing ElÁlamoTejano
[WRONG] Worst: ElÁlamo_Tejano
Ok: El_Álamo_Tejano
Better: El_Álamo_Tejano
Best: El_Álamo_Tejano
Testing TheÆvarArnfjörðBjarmason
[WRONG] Worst: TheÆvar_ArnfjörðBjarmason
Ok: The_Ævar_Arnfjörð_Bjarmason
Better: The_Ævar_Arnfjörð_Bjarmason
Best: The_Ævar_Arnfjörð_Bjarmason
Testing IlCaffèMacchiato
[WRONG] Worst: Il_CaffèMacchiato
Ok: Il_Caffè_Macchiato
Better: Il_Caffè_Macchiato
Best: Il_Caffè_Macchiato
Testing MisterDženanLjubović
[WRONG] Worst: MisterDženanLjubović
[WRONG] Ok: MisterDženanLjubović
Better: Mister_Dženan_Ljubović
Best: Mister_Dženan_Ljubović
Testing OleKingHenryⅧ
[WRONG] Worst: Ole_King_HenryⅧ
[WRONG] Ok: Ole_King_HenryⅧ
[WRONG] Better: Ole_King_HenryⅧ
Best: Ole_King_Henry_Ⅷ
Testing CarlosⅤºElEmperador
[WRONG] Worst: CarlosⅤºEl_Emperador
[WRONG] Ok: CarlosⅤº_El_Emperador
[WRONG] Better: CarlosⅤº_El_Emperador
Best: Carlos_Ⅴº_El_Emperador
BTW, prawie wszyscy tutaj wybrali pierwszy sposób, ten oznaczony jako „Najgorszy”. Kilku wybrało drugi sposób, oznaczony „OK”. Ale nikt przede mną nie pokazał ci, jak zastosować podejście „lepsze” lub „najlepsze”.
Oto program testowy z czterema metodami:
#!/usr/bin/env perl
use utf8;
use strict;
use warnings;
# First I'll prove these are fine variable names:
my (
$TheLoneRanger ,
$MountMᶜKinleyNationalPark ,
$ElÁlamoTejano ,
$TheÆvarArnfjörðBjarmason ,
$IlCaffèMacchiato ,
$MisterDženanLjubović ,
$OleKingHenryⅧ ,
$CarlosⅤºElEmperador ,
);
# Now I'll load up some string with those values in them:
my @strings = qw{
TheLoneRanger
MountMᶜKinleyNationalPark
ElÁlamoTejano
TheÆvarArnfjörðBjarmason
IlCaffèMacchiato
MisterDženanLjubović
OleKingHenryⅧ
CarlosⅤºElEmperador
};
my($new, $best, $ok);
my $mask = " %10s %-8s %s\n";
for my $old (@strings) {
print "Testing $old\n";
($best = $old) =~ s/(?<=\p{Lowercase})(?=[\p{Uppercase}\p{Lt}])/_/g;
($new = $old) =~ s/(?<=[a-z])(?=[A-Z])/_/g;
$ok = ($new ne $best) && "[WRONG]";
printf $mask, $ok, "Worst:", $new;
($new = $old) =~ s/(?<=\p{Ll})(?=\p{Lu})/_/g;
$ok = ($new ne $best) && "[WRONG]";
printf $mask, $ok, "Ok:", $new;
($new = $old) =~ s/(?<=\p{Ll})(?=[\p{Lu}\p{Lt}])/_/g;
$ok = ($new ne $best) && "[WRONG]";
printf $mask, $ok, "Better:", $new;
($new = $old) =~ s/(?<=\p{Lowercase})(?=[\p{Uppercase}\p{Lt}])/_/g;
$ok = ($new ne $best) && "[WRONG]";
printf $mask, $ok, "Best:", $new;
}
Jeśli uzyskasz wynik taki sam, jak „Najlepszy” w tym zestawie danych, będziesz wiedział, że zrobiłeś to poprawnie. Do tego czasu nie. Nikt tutaj nie zrobił nic lepszego niż „Ok”, a większość zrobiła to „Najgorszy”. Nie mogę się doczekać, aż ktoś opublikuje poprawny kod ℂ♯.
Zauważyłem, że kod wyróżniający StackOverflow jest znowu żałośnie głupi. Robią to samo stare kulawizny, jak (większość, ale nie wszystkie) spośród pozostałych podejść, o których tu mowa. Czy nie minęło już dużo czasu, aby położyć ASCII na odpoczynek? To już nie ma sensu, a udawanie, że wszystko, co masz, jest po prostu złe. To powoduje zły kod.