一、如何处理无法输入计算机的汉字
一些汉字无法输入计算机,一般不外乎以下二种情况:一是计算机操作系统所支持的字符集及其相应支持字体的问题,一是输入法的问题。
(一) 编码字符集、字体、输入法
① GB2313字符集,收入汉字6763箇,符号715箇,总计7478箇字符,这是大陆普遍使用的简体字符集。楷体-GB2313、仿宋-GB2313、华文行楷等市面上绝大多数字体支持显示这箇字符集,亦是大多数输入法所采用的字符集。市面上绝大多数所谓的繁体字体,其实采用的是GB2313字符集简体字的编码,用字体显示为繁体字,而不是直接用
GBK字符集中繁体字的编码,错误百出。
② BIG-5字符集,收入13060箇繁体汉字,808箇符号,总计13868箇字符,目前普遍使用於
台湾、香港等地区。台湾
教育部标准
宋体楷体等港台大多数字体支持这箇字符集的显示。
③
GBK字符集,又称大字符集(GB=GuóBiāo国标,K=扩展),包含以上两种字符集汉字,收入21003箇汉字,882箇符号,共计21885箇字符,包括了中日韩(CJK)统一汉字20902箇、扩展A集(CJK Ext-A) 中的汉字52箇。Windows 95\98简体中文版就带有这箇GBK.txt文件。
宋体、
隶书、
黑体、幼圆、
华文中宋、
华文细黑、
华文楷体、标楷体(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字体支持显示这箇字符集。
微软拼音输入法2003、全拼、紫光拼音等输入法,能够录入如镕鎔炁夬喆嚞姤赟贇?龑昳堃慜靕臹等GBK简繁体汉字。
BIG-5字符集(繁体中文)与GB字符集(简体中文),编码不相兼容,产生乱码。若有乱码字符出现,可以先把这些乱码字符复制到
Word中,另存为网页文件,再打开这箇网页文件,点右键选择相应的字符编码,卽能正常显示,然後再复制到Word中就全正常了。当然,用TextPro、Convertz之类的转码软件就更方便了。
④
GB18030字符集,包含
GBK字符集、CJK Ext-A 全部6582箇汉字,共计27533箇汉字。
宋体-18030、方正楷体(FZKai-Z03)、书同文楷体(MS Song)、香港华康标准宋体(DFSongStd)、华康香港标准楷体、华康楷书体、New Gulim、CERG Chinese Font,以及
微软Windows Vista操作系统提供的宋黑楷仿宋等字体亦支持这箇字符集的显示。Windows 98支持这箇字符集,以下的字符集则不支持。可以用王码五笔18030录入。
⑤ 方正超大字符集,包含
GB18030字符集、CJK Ext-B中的36862箇汉字,共计64395箇汉字。
宋体-方正超大字符集支持这箇字符集的显示。Microsoft Office XP或2003就自带有这箇字体。若要单独安装字体,选择:自定义安装→选择应用程序的高级自定义→Microsoft Office→Office共用功能→中文字体→中文超大字符集字体,点左键选择“从本机运行全部程序”,其馀内容用左键点击选择不安装。
⑥ ISO/IEC 10646 / Unicode字符集,这是全球可以共用的编码字符集,两者相互兼融,涵盖了世界上主要语文的字符,其中包括简繁体汉字,计有:CJK统一汉字20902箇,CJK Ext-A 6582箇,Ext-B 42711箇,共计70195箇汉字。SimSun-ExtB(
宋体)、MingLiU-ExtB(细明体)能显示全部Ext-B汉字。至今尚无单独一款字体能够显示全部70195箇汉字,但可用海峰五笔、新概念五笔、仓颉输入法世纪版、新版的
微软新注音、仓颉输入法 6.0 版(单码功能)等输入法录入。Ext-C还有2万多箇汉字。详情请参阅香港中文大学网站、马来西亚仓颉之友网站、福建陈清钰箇人网站。
⑦ 汉字构形资料库2.3版,内含楷书字形60082箇、小篆11100箇、楚系简帛文字2627箇、金文3459箇、甲骨文177箇、异体字12768组。可以安装该程序,亦可以解压後使用其中的字体文件,对於整理某些古代文献十分有用。
如果超出了输入法所支持的字符集,就不能录入计算机。如果没有相应字体的支持,则显示为黑框、方框或空白。如果操作系统或应用软件不支持该字符集,则显示为问号(一箇或两箇)。在网页上亦存在同样的情况。