2024-02-10

文本字符编码转换命令

有时候我们使用编辑器打开某个文件格式的文件,若该文件包含了除了英文外的其它文字,会出现乱码。这是因为该文件的编码格式没有被当前的编辑器正确实别而导致的。使用 iconvuchardet 两个命令可以很好的检测文本文件真正的编码格式,以及将其转换成为 UTF-8 格式的文件,以避免出现乱码的情况。

步骤

  1. 通过使用 iconv -f [source encode] -t [dest encode] [txt file] 来转换编码;

  2. 需要知道某个文件的编码,可以使用 uchardet [txt file] 来猜测文本文件的编码。

1
2
# 将 [txt file] 改成实际的文本文件名称
iconv -f `uchardet [txt file]` -t UTF-8 [txt file] > [output txt file]
MATTHEW
桂ICP备17005075号