PHP使用自定义码表查询汉字拼音
通过汉字GBK码计算出汉字的区位码,目前仅使用了GB2312的6763个汉字。实现了多音的查询。 如“啊”,其GBK码:45217,区位码:1601,因此可以通过第16区,第01位快速定位其位置。 每个正常读音(第一次出现的读音)占4个字节,前两个表示其读音的个数及在多音块中的偏移,后两位表示其读音的位置。 拼音部分为不定长,从其读音的位置先读1个字节,表示其拼音长度,再读出相应的拼音后还原。
文件列表
Qw2Py.rar
(预估有个4文件)
根据码表查拼音.php
3KB
pymb.txt
16KB
码表.php
6KB
mb.bin
29KB
用户评论