10.3969/j.issn.1000-386X.2011.04.050
多文种多向电子词典软件系统关键技术研究
以汉、维、哈、柯等具有多种书写方向的多文种电子词典软件系统开发为背景,首先指出了其中与语种相关的技术难点,提出相应的解决方案,即通过XML的标注属性和字母的UNICODE区域从属关系来判断词语的书写方向;其次计算组成词语的各个字母来自不同语言的概率来判断词语的文种;最后对开源索引工具Lucene进行修改将其成功应用到了电子词典中词库的索引中.应用结果表明该技术方案的可行性和有效性.
电子词典、多语种、自动判别、Lucene、XML
28
TP3;TP1
新疆维吾尔自治区高校科研计划重点资助XJEDU2006113;新疆维吾尔自治区高校青年教师科研启动基金XJEDU2008S14;新疆大学青年教师科学研究基金QN070123
2011-08-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
170-173