请问如何才能判断一个字符串是否是UTF-8编码的呢？

cyberpsyche · 发表于 2005-3-9 14:32:32

工作中遇到可能是GB码，也可能是UTF-8编码的串，均包含汉字，格式间的相互转化容易实现，但如何判断原始串的编码格式呢？ libiconv中好像也没有这样的函数啊。

谢谢啦！！！

doubleelec · 发表于 2005-3-9 15:13:01

如果要从分析原始串的内容来判断，这个好像比较难，尤其是文字比较少的时候。

你的具体应用中能不能通过原始串的来源来判断，而不是从分析原始串内容来判断？

cyberpsyche · 发表于 2005-3-9 16:09:46

通过分析来源我也想过，但不可行。要是各种编码都有一个标识的头和尾就好了。

dragon9876 · 发表于 2005-3-9 17:14:22

他们是不是都有个自的编码范围？

herberteuler · 发表于 2005-3-9 18:32:39

能不能像现在的浏览器一样，将选择的权利留给用户？

pupilzeng · 发表于 2005-3-9 21:51:43

是不是可以参照glib的g_utf8_unicode的实现？
我没看过，只是猜测

lucifer · 发表于 2005-3-10 09:56:06

http://www.linuxforum.net/forum/ ... mp;o=all&fpart=

这个可以参考一下。
如果保证只可能有utf8或者gb两种编码，那用这个方法基本就解决了

		自动登录	找回密码
密码			注册