Problem opisany w pytaniu występuje, gdy pusty / nowy dokument jest ustawiony na „ANSI” i wkleja się w nim znaki Unicode .
Nie ma żadnego automatycznego wykrywania, gdy jest używany z pustym / nowym dokumentem, przynajmniej nie w wersji Notepad ++, na której testowałem (v5.4.5). „ANSI” jest domyślnym ustawieniem w Notepad ++ dla nowego dokumentu, chyba że ustawiono go w menu Ustawienia → Preferencje → zakładka Nowy dokument / Otwórz Zapisz katalog .
Rozwiązanie
Rozwiązaniem jest ustawienie kodowania na UTF-8 przed wklejeniem, menu Format → Koduj w UTF-8 :
Przykład
Skopiowałem trochę tekstu do nowego dokumentu Notepad ++, rosyjskiego (русский язык, russkiy yazyk) , z Firefoksa pokazującego rosyjską stronę Wikipedii .
Jeśli kodowanie nie zostanie zmienione z „ANSI”, wynik jest następujący:
Jeśli kodowanie zostanie zmienione, jest to wynik:
Jak widać na poniższym rysunku ( część cyrylicy jest podświetlona), Notepad ++ faktycznie konwertuje znaki Unicode na ASCII 63 (szesnastkowy 3F), znaki zapytania. Dlatego znaki Unicode są tracone (w „ANSI” mode) przy kopiowaniu tekstu zewnątrz przez schowku (to nie to kwestia czcionki - informacje zostaną utracone).
Testowano na: Notepad ++ v5.4.5 (UNICODE).