网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
05月11日漏签0天
双拼吧 关注:4,510贴子:53,695
  • 看贴

  • 图片

  • 吧主推荐

  • 游戏

  • 1 2 下一页 尾页
  • 70回复贴,共2页
  • ,跳到 页  
<<返回双拼吧
>0< 加载中...

玩转双拼、辅助码和顶功

  • 只看楼主
  • 收藏

  • 回复
  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
以下玩法纯属个人爱好,只是和吧友们分享一下思路,没有任何推广生财之意。
先上个图。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
玩法一:双拼
上面的双拼键盘是自定义的并且在舒适度上优化过的。在 Linux 下和小企鹅(Fcitx)或 中州韵(Rime)挂接,在手机上和同文(Trime)挂接,经过几年的使用验证,效果还不错。双拼的一大好处就是人人都可以有自己的个性化方案,适合自己的就是最好的。现在的输入法框架都很智能,平时聊天或写帖子,通常以双拼输入一大串的整句都不用修改,效率很高。


2025-05-11 14:40:44
广告
  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
玩法二:双拼 + 拓扑双形
作为一个输入法爱好者,如果不玩玩其它的输入方式似乎就不过瘾,于是在双拼的基础上又捣鼓起了辅助码。
已知的双拼辅助码可以分为四种类型:
音托:编码是部件的发音(通常是声母)。如自然码和小鹤双形。
形托:编码是和部件形状相似的英文字母。如基于表形码的小牛字根。
行列:编码是部件的行列坐标,和英文字母无关。如基于二笔的星笔辅码。
顺序:部件类按顺序排好然后和英文字母顺序对应。如基于仓颉的辅助码。
不同类型的辅助码各有千秋,这里不作评论。拓扑形可以归于行列类,编码和英文字母并无直接关系。
拓扑形字根以笔画之间的关系分为连接(绿色)、交叉(黄色)、封闭(蓝色)、离散(红色)和包围(紫色)五种结构。 除了包围结构以外的每种结构再以原形、横形、竖形、斜形和折形细分,其中 交叉结构因为字根数量大而再分出“横土”、“竖木”、“斜大”和“折中”四个子类。 在键位安排上,原形和横形归食指,竖形归中指,斜形归无名指,折形归小指, 容易形成肌肉记忆。
当然这种分类也不是毫无破绽。包围结构要做特殊处理,只有大盖头、小盖头 和其它半包围三个小类。把“右折”作为连接结构的原形比较牵强。封闭结构的 “框悬”需要一定的联想才能和折形对上。为了减少重码,若干个本可以拆分的复合部件也被当作字根。比如“钅”明显由自然间隙分为两部分,但它是“十字交叉”类的一个字根。这些需要注意的字根并不多,在键盘图中已用红色标明。
目前字根总共有350多个,图中列出的是具有代表性的140多个高频字根,没有列出的在看过一遍后可以很容易地归类,不需要强记。比如:“正”在连接结构 的“横托”,“身”在封闭结构的“框悬”,“父”在交叉结构的“斜交”,“川”在离散 结构的“散竖”,“气”在包围结构的“半包”。
编码就是双拼加拓扑形首尾两码,全码重码有342组706字,简码重码有133组279字。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
玩法三:双拼 + 拓扑形顶功
在辅助码的基础上接着捣鼓,就进入了较为神秘的顶功输入法。
简单的顶功需要一大一小互不重叠的两个键盘。上面的键盘用到27键,可以分21键给声母作为顶功大键盘。“bpmfdtnlgkhjqxzcsryw” 共20个声母,zh、ch、sh以模糊音分别和z、c、s合并,另外o代表零声母,刚好21键。余下的6键是 “aeiuv;”形成顶功小键盘,分别代表交叉(上行)、连接、封闭、包围、交叉(下行)和离散的拓扑形结构。有趣的是,在键盘图中“aeiv;”键都分布在不同的颜色区,正好各代表一个结构,而“u”键可以通过形似联想和包围结构对应。
每个字的编码是:声母(21键)+ 韵母 (26键)+ 字根结构(6键)+ … + 字根结构(6键)。双拼之后的任何一个声母键都顶字上屏,也就是常说的二码顶。
其实字根在顶功玩法里基本不用记,只要依据拓扑形结构归类即可。比如:“哲学”的全码是“ZEaeiXT;ua”,为了容易区分,双拼码以大写表示,结构码以小写表示。“哲”拆作“扌斤口”三个字根分别属于交叉(上行)、连接、封闭三种结构,所以是“aei”。“学”拆作“⺍冖子”三个字根分别属于离散、包围、交叉(上行)三种结构,所以是“;ua”。
在二码顶最长六码时,全码重码高达1616字,而简码重码只有217组480字,基本可用。
以上的二码顶可以很容易地改成三码顶,只要把第三码的6键结构码替换成27键拓扑形码即可。例如“哲学”全码成为“ZEdeiXThua”,其中“d”是“扌”的拓扑形码,“h”是“⺍”的拓扑形码。这样一来全码重码就降低到177组361字,而简码重码更只有28组56字。代价是记忆量增加了不少,而且从第三码的拓扑形码转到第四码的结构码可能会造成一些混淆,感觉不如二码顶顺溜。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
结论
辅助码和顶功确实很好玩,也有很大的优化空间。因为辅助码和顶功需要拆字,个人的感觉是比较费脑,特别在工作一天后,还是双拼整句输入最为轻松。


  • 行云流水
  • 大尉
    9
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
我顶你个肺,支持折腾,支持新点子。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
一个简单而有效的优化是把零声母设置在J键上,然后把封闭(框空)也就是“口”字类移到O键上,小键盘就有七个键了,二码顶的重码字也就从480个降低到427个。
继续优化字根类在小键盘上的分布可以逼近300个重码字,不过每次优化都是以增加记忆量为代价的,不一定值得。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
接着折腾,终于用 Rime 折腾了一个自己比较满意输入法,同时支持(1)以顶功方式连续输入单字;(2)以智能方式连续输入双拼。在这里和大家分享一下。
顶功输入:25键输入10个字。

智能输入:20键输入10个字,看似比较快。不过呢,第一次输入这段话时,“懂我心意”这四个字没有搞对,还是不够智能哦。:)

两种方式之间是自动切换的,就看你输入什么了。比如以顶功方式输入,空格上屏后,就可以直接敲双拼智能输入。反之亦然,仅以空格上屏为界。
仔细看上面智能输入的截屏,第二个选项从何而来呢?其实它是顶功输入的候选,因为得分不高排在了第二位。这就牵涉到双发引擎的配置问题了,这两个引擎是互相竞争的关系,谁输出的选项得分高,就排在前面。
更多的内容发表在 Rime 吧里了,标题是“给 Rime 配置双发引擎”。


2025-05-11 14:34:44
广告
  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
顶功编码减少重码的一个技巧是拉长全码码长,然后根据字的使用频率以简码优化。
前面提到的二码顶以“声韵形形形形”为最长码,却有427个重码字,原因是许多字取不到四个形。一个简单而有效的处理方法是以‘o’填充至六码,以简码优化后就只有55个重码字了,而且动态码长也缩短了一些。
举个例子。“奇”的全码是qiveo,“杞”和“圻”的全码都是qive。三个字扩展之后都成为qiveoo,依据字频优化后的简码分别是qive,qiveo和qiveoo。不仅较常使用的“奇”得到了三者之间最短的简码,还减少了一对重码。实际输入“杞”或“圻”时会发现打完qive还没看到,这时候就连续打‘o’直到该字出现。


  • oraus
  • 新兵
    1
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
从双拼拓扑形结构还可以继续演化出一码顶功。第一码就是20个声母,没什么特别的。后续编码是10个拓扑形结构:1. 连接类的横托和竖架,2. 其它连接类,3. 封闭类的框横和框竖,4. 其它封闭类,5.离散类的散横和散竖,6. 其它离散类,7. 上行交叉类的横交和竖交,8. 其它上行交叉类, 9. 下行交叉类,10. 包围类。下图给出了代表字根。

举个例子。“案”字拆作“宀女木”后得到全码“RUOV;;”,其中“R”代表零声母,两个分号补足六码用于选重,然后全码又经过简码优化之后得到“RUO”作为最终编码。
下面是一些统计数据。“最大码长:6 一码:20字 二码:200字 三码:1737字 四码:3670字 五码:1243字 六码:167字 重码:18组39字 2重15组 3重3组”。不计标点的动态平均码长是 2.4 。三码以内的字还不到2000个,是有点少。所有的简码都是全码的前缀,没有无理码。
一码顶的好处是输入高频常用字时是一键一字,比如“我们出发了”就是“WMCFL” 。这是以拉长了非高频字的码长为代价的,比如“码”字在二码顶时是“MAE”,现在变成了“MEOE”。非高频字可能还是需要动态调频。
这个键盘布局实际使用的手感不是很好,因为下排的击键量较大。解决的方案是把F和V、K和逗号、L和句号、P和斜杠两两交换,这样中排的击键量就接近了45%。F、K、L、P加起来的击键量才4.5%,所以这个交换是可行的,但也要一定的时间来适应。
另外一个问题是双拼用惯了,按了声母之后,韵母不由自主地就会冲出去。就个人而言这也意味着多按一下韵母键也没什么附加成本,有可能还是要回到二码顶。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
不带韵母的二码顶功也可以做。第一码还是20个声母,第二码是27键的拓扑形,第三码到第五码是10键的拓扑结构(从27键压缩而来)。不足五码的还是以分号补足作为全码。
统计数据如下:“最大码长:5 一码:20字 二码:534字 三码:3100字 四码:2963字 五码:420字 重码:44组95字 2重37组 3重7组”。如果码长是六码的话可以零重码。
20个一码字需要按空格输入,所以在计算击键数时当作二码。以前五千字频率计算的理论平均码长是2.47。实测的码长和瘦码差不多,有时甚至更低。(楼上提到的一码顶的动态平均码长是 2.4 没有普遍性,因为测试的是口水文。以前五千字频率计算的理论平均码长是 2.58,可以更准确地反映一码顶的效率。)
这个方案只是一个理论上的尝试,看看顶功的极限在哪里。第二码没有用到30个键,所以还有一点提升的空间。从实用角度上看,第二码的拓扑形转换到第三码的拓扑结构可能会造成认知上的混淆,不一定好用。如果第二码是韵母的话就不会混淆,但是编码空间得不到充分的利用,理论平均码长就会增加到 2.66。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
双拼的一个缺点是离散率较差,只有400多个声母和韵母的组合,加入声调后,则可以增加到1400个组合,但是声调只有五种,单独给一码并不划算。声母(包括零声母∅)共有24个,假定韵母可以占用30个键,则两码的编码空间大小是720。那么如何才能合理利用剩余的300多个编码呢?

拼音里 g,k,h,zh,ch,sh,r,z,c,s,y,w,∅ 和 i 打头的复韵母不可拼;j,q,x 则和任何以 a,e,o 开始的韵母不可拼。在以上规整的30键双拼方案中,g,k,h,j,q,x,zh,ch,sh,r,z,c,s,y,w,∅ 只能和下两排中的一排相拼,可以规定其中一排为另一排以声调分流,其中第二排管一二声和轻声,第三排管三四声。比如:公=gong,共=giong,间=jan,见=jian。
类似地 b,p,m,f 以上两排分流,其中第一排管三四声,第二排管一二声和轻声。比如:抛=pao,跑=pe。唯一的例外是和 eng 拼时分流到不可拼的 ong 上。比如:风=feng,奉=fong。
声母 d,t,n,l 因为和三排里的多数韵母可以相拼,所以无法有效分流。
韵母 i 最常用而韵母 ü 最不常用,可以把三四声的 i 放在 V 键上。比如:机=ji,几=jv。
韵母 u 是次常用的,把三四声的 u 放在 R 键上分流。比如:如=ru,入=ruai。只有在声母是 g,k,h 时才以 I 键分流。比如:估=gu,故=gi。
韵母 ong 和 iong 总是可以相互分流。 比如:东=dong,动=diong。
这几个分流规则可以在两码空间里增加180多个编码,总数达到580多个。加上24个一简字,两码以内有600多个字。


  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
在600多双拼一、二码字的基础上可以添加拓扑形结构做成二码顶,每个字的编码是:声母(24键)+ 分流韵母 (30键)+ 字根结构(6键)+ … + 字根结构(6键)。24个一简码以空格上屏,双拼之后的任何一个声母键都顶字上屏。表示字根结构的6键是 “avo;,.”,分别代表交叉(上行)、交叉(下行)、封闭、离散、包围和连接的拓扑形结构。
以前五千字频率计算的理论平均码长是 2.50,在没有任何的无理码情况下,比小兮码的理论码长 2.34 多了 0.16。下面是统计数据。
最大码长:6 一码:24字 二码:586字 三码:2369字 四码:2964字 五码:1103字 六码:173字 重码:18组38字 2重16组 3重2组


2025-05-11 14:28:44
广告
  • 麦可数
  • 少尉
    6
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
前面说过:
“双拼的一个缺点是离散率较差,只有400多个声母和韵母的组合,加入声调后,则可以增加到1400个组合,但是声调只有五种,单独给一码并不划算。声母(包括零声母∅)共有24个,假定韵母可以占用30个键,则两码的编码空间大小是720。那么如何才能合理利用剩余的300多个编码呢?”
之前以声调分流的方式在两码里编入了580多个字,但是所采用的规则比较复杂,难以记忆。下面要介绍的是在此基础上的改进,不但规则简单,而且效率更高,在两码里编入了670个字。这张图就是所有需要硬记的。

韵母的编码遵循两条规则:
一、以本韵母定按键所在列。
二、以声调定按键所在排。上排:一轻声,中排:二三声,下排:四声。
以“键”字为例,其带调拼音是 jian4,声母是 J,本韵母是 an 在第二列,声调是四声在下排,第二列的下排是 X 键,所以其编码是 JX。
又如“回”字,其带调拼音是hui2,声母是 H,本韵母是 ei 在第三列,声调是二声在中排,第三列的中排是 D 键,所以其编码是 HD。需要注意的是,汉语拼音方案中 ui 是 uei 的简写,所以其本韵母是 ei 而不是 i。


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 1 2 下一页 尾页
  • 70回复贴,共2页
  • ,跳到 页  
<<返回双拼吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示