Java - конвертировать китайские иероглифы в Unicode с native2ascii

Java - конвертировать китайский иероглиф в Unicode с native2ascii

Native2ascii - это удобный инструмент, встроенный в JDK, который используется для преобразования файла с символами «не латинского 1» или «не Юникода» в символы «кодировки Юникода».

Пример Native2ascii

1. Создать файл (source.txt)

Создайте файл с именем «source.txt», введите несколько китайских иероглифов иsave it as “UTF-8” format.

image

2. native2ascii

Используйте команду native2ascii, чтобы преобразовать ее в формат Unicode.

C:\>native2ascii -encoding utf8 c:\source.txt c:\output.txt

Native2ascii будет читать все символы из «c: \ source.txt» и кодировать их в формате «utf8», а также выводить все закодированные символы в «c: \ output.txt»

3. Читать вывод

Open the “c:\output.txt”, you will see the all encoded characters, e.g 杨木金

image