回复:【活动】寻找搭讪帝——七夕搭讪行动 鍒板簳浠拷涔堟椂鍊椤紑 锟斤拷锟斤拷 锟斤拷直锟斤拷锟 看到这些字句,您肯定会问,这是什么?这些字句是毫无实际意义的,但它们却形象地表达出了一些莫名其妙的问题。这是一个很经典的乱码。相当经典 最容易出现的地方就是搜索引擎
[编辑本段]出现的原因
Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER 那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。 如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话 一个汉字2个字节,最终的结果就是:锟斤拷 我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比IE多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。网友est专门写了一篇文章来考证问题来源: Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)”。
贴吧:
魔兽世界作者:
菊花已被爆 2010-08-14 12:29 百度被黑的真相,百度百科,标题长长长~~~~~~~~~~~~~ 鍒板簳浠拷涔堟椂鍊椤紑 锟斤拷锟斤拷 锟斤拷直锟斤拷锟 看到这
贴吧:
魔兽世界作者:
铁甲依然在♂ 2010-08-14 12:44 回复:大事件~~~~~~~~~~百度被黑啦~~~~~~~~~~~~河南人民发来贺电 鍒板簳浠拷涔堟椂鍊椤紑
锟斤拷锟斤拷 锟斤拷直锟斤拷锟
贴吧:
李毅作者:
Mr·大地帝 2010-08-14 12:37 回复:麡襹裤咳懯酨棴骏谵译扑鍦瞫嚰熩韧 回复:13楼
鍒板簳浠拷涔堟椂鍊椤紑 锟斤拷锟斤拷 锟斤拷直锟斤拷锟
贴吧:
红警3作者:
527453660 2010-08-16 13:14 回复:“准备完毕”“那么 开始吧……” 鍒板簳浠
拷涔堟椂鍊椤紑
锟斤拷锟斤拷
锟斤拷直锟斤拷锟
贴吧:
不核苏作者:
Pro_ATEX2 2010-08-17 01:18 回复:http://tieba.baidu.com/f?kz=5970327 鍒板簳浠拷涔堟椂鍊椤紑锟斤拷锟斤拷锟斤拷直锟斤拷锟
贴吧:
红警3作者:
60.165.187.* 2010-08-14 14:04