一、词根数据(词,英文和简称)大约5000个基本词和字
操作符 Operator Oprt
操作员 Operator Opr
差异化 Differentiation Dfft
经纪人 Broker Brkr
经济学 Economics Ecnmc
…..
二、字段命名数据(词,英文,简称)大约9万条
法定代表人姓名 Legal Representative Name Lgl_Rprs_Nm
经营场地面积 Operate Area Area Oprt_Area_Area
金融机构标识码 Finance Institution Identifier Code Fnc_Inst_ID_CD
……
三、工具开发
1单词分析翻译
2现有词检索和模糊匹配
暂时使用的技术就是HashMap加载数据,分词使用Jcseg进行分词,模糊检索工具采用FuzzySearch。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 610798281@qq.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.jiangsasa.com/110.html
如若转载,请注明出处:https://www.jiangsasa.com/110.html