错别字监测

1000亿海量词库,以新版《现代汉语词典》等权威为标准;采用优秀的中文智能分词技术、上下文校对与自适应技术;监测网站是否存在错别字(如将党和国家领导人姓名拼写错误等)。

功能特色

强大错误校对功能

1.政治性错误校对

精确校对领导人姓名、职务和领导人排序错误;

精确校对涉及台湾和其他敏感的政治性错误;

即时更新的、可自定义的领导人职务库;

2.定制重点词校对

能够根据需求定制重点词监控词库,能够准确快速地校对出所有与重点词相似的错别字,支持大容量的重点词监控库。

3.同音字校对

具备同音字校对模块,能够自动对同音但是字不同的文本进行识别,并提供改进意见。如李祖善的同音字为:理祖善、李祖善、里祖善、鲤祖善、礼祖善、哩祖善、俚祖善、悝祖善、澧祖善、逦祖善、娌祖善、锂祖善、蠡祖善等。

丰富资源支撑

1.首屈一指的海量词汇库

覆盖1000亿字高质量语料。内嵌79个专业词库、4800万条专业词汇、450万条错别字核心库。

海量专业词库词汇量超过4800万条,包括物理、数学、机械、纺织、气象、历史、考古、文物、交通、邮电、环境、农林牧渔、化学、石化、冶金、煤炭、建筑、水利、图书、印刷、医学、生物、心理、经济、证券、会计、财政、审计、电脑、电子、电力、新闻、政治、哲学、教育、少儿、文学、戏曲、电影、广电、法律、宗教、民族、军事、航空、地理、地质等79个专业词库。

2.依据新版《现代汉语词典》等权威标准

依据《现代汉语词典》第5版,参考《辞海》、《现代汉语规范词典》、《中国成语大辞典》等权威词典。

依据国家语委《第一批异形词整理表》、参考《264组异形词整理表》等。

前沿技术支撑

1.支持上下文校对与自适应技术

基于汉语切分技术、汉语语法分析技术、汉语依存关系分析技术等。并且具有自适应功能,能够随着使用率的增加而不断增加校对准确性,如下图:

错别字监测流程图

2.可视化定位

错别字监测功能可在网页和源代码中标注错误源,让用户轻松找到全站错别字,高效纠错。详情如下图。

监控通错别字监测报告

监控通错别字监测定位