LinuxSir.cn,穿越时空的Linuxsir!

 找回密码
 注册
搜索
热搜: shell linux mysql
查看: 839|回复: 8

请教关于繁体中文转换到UTF8的问题

[复制链接]
发表于 2004-7-8 16:57:49 | 显示全部楼层 |阅读模式
我有一些繁体字符串是在windows下输入的。我把文件放到linux下,想用iconv转换成UTF8。

我用以下命令均提示“illegal input sequence...”
iconv --from-code=GB2312 --to-code=UTF-8 。。。
iconv --from-code=GB2312 --to-code=UTF-8 。。。

我用以下命令
iconv --from-code=UNICODE --to-code=UTF-8 。。。
转换以后,发现是乱码。

有没有兄弟知道应该怎么做?
发表于 2004-7-8 17:05:33 | 显示全部楼层
繁体中文应该是big5吧,不是gb2312。
发表于 2004-7-8 17:25:34 | 显示全部楼层
或者是gbk or gb18030?
关键问题是在windows下面的哪个程序里面输入的
要是ue或者notepad,说不定保存的时候自己就已经选择了保存为utf8了
 楼主| 发表于 2004-7-8 17:45:33 | 显示全部楼层
我已经试过了
iconv --from-code=BIG5 --to-code=UTF-8 。。。
iconv --from-code=CN-BIG5 --to-code=UTF-8 。。。
还是不行,我是在windows用从excel里copy到text文件里。excel是用微软输入法输入的繁体中文。
发表于 2004-7-8 21:50:55 | 显示全部楼层
execl是用什么编码保存输入的文本的?
无论它自己用什么格式,肯定不是纯文本格式。iconv只能对文本起作用。先把它保存为纯文本,再转换吧。
 楼主| 发表于 2004-7-8 22:04:08 | 显示全部楼层
其实是别人给我excel文件,我再把里面的文本copy到plain text file.
我觉得编码方式和excel应该没关系吧,应该是输入法或者windows的设置。
发表于 2004-7-9 08:36:08 | 显示全部楼层
openoffice里面 也有个电子表格,你用它直接把execl文件打开来看看。
ps:和输入法没有关系,输入法只是输入时起作用,文件中保存的是对应字符集的内码。
 楼主| 发表于 2004-7-10 19:30:30 | 显示全部楼层
現在知道了,繁體中文應該用GBK
发表于 2004-7-19 10:14:13 | 显示全部楼层
windows下编写好的源代码文件,在linux下要用dos2unix转换一下,然后用
iconv -f GBK -t UTF-8 -o xxx.new xxxx.old
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表