在Linux上转换UTF-8和ISO-8859之间的文件

每当我遇到Unicode时,都没有用.我在Linux上,我从Windows获得这些文件:

$file *
file1: UTF-8 Unicode text
file2: ISO-8859 text
file3: ISO-8859 text

在我发现文件有不同的编码之前,没有任何工作.我希望让我的生活变得轻松,并将它们全部放在相同的格式中:

iconv -f UTF-8 -t ISO-8859 file1 > test
iconv: conversion to `ISO-8859' is not supported
Try `iconv --help' or `iconv --usage' for more information.

我尝试转换为ISO,因为当我在gedit中打开那些ISO文件时只有1次转换,德语字母“ü”显示得很好.好的,接下来尝试:

iconv -f ISO-8859 -t UTF-8 file2 > test
iconv: conversion from `ISO-8859' is not supported
Try `iconv --help' or `iconv --usage' for more information.

但显然这不起作用.

解决方法:

ISO-8859-x(Latin-1)编码仅包含非常有限的字符,您应该始终尝试编码为UTF-8以使生活更轻松.

并且utf-8(Unicode)是ISO 8859的超集,所以如果你不能将UTF-8转换为ISO 8859就不会感到惊讶

看起来命令文件只是提供了非常有限的文件编码信息

您可以尝试猜测来自ISO-8859-1或ISO-8859-15的编码,或者@hobbs评论中建议的2~14编码

你可以通过iconv -l获得iconv支持的编码

如果生活在猜测真正的文件编码时不容易,this silly script might help you out

上一篇:Linux下转换编码


下一篇:在CentOS 5.5上将PHP ICONV glibc转换为libiconv