当前位置: 首页-> 科技

力维智联荣获“中文文本纠错比赛”第三名

发布时间:2021年10月27日 22:39   来源:C114通信网   发布者:张璠   阅读量:17066   
导读:近日,由中国智能科技领域权威机构中国人工智能学会主办的第三中国现状;人工智能。创新和创业竞赛;完美的结局。在自然语言处理技术创新大赛;mdash中文文本纠错大赛。在赛道上,利威智联的圣淘沙队从众多企业和高校队伍中脱颖而出,获得比赛第三名。前...

近日,由中国智能科技领域权威机构中国人工智能学会主办的第三中国现状;人工智能。创新和创业竞赛;完美的结局。在自然语言处理技术创新大赛;mdash中文文本纠错大赛。在赛道上,利威智联的圣淘沙队从众多企业和高校队伍中脱颖而出,获得比赛第三名。前两支队伍是苏州大学的amp。。阿里巴巴达摩院联合团队和清华大学团队。

力维智联荣获“中文文本纠错比赛”第三名

在新闻出版行业,由于出版物种类和数量的大幅增加,传播渠道的多样化,知识更新换代的加速,以及中文语言文字的灵活性,修订工作难度越来越大。内容质量是出版物的灵魂。如果编校质量完全由人力控制,必然会影响工作效率。

文本校对的任务主要是检测和纠正文本中的错误,属于综合自然语言处理研究的子方向,能够充分体现自然语言处理的技术水平。在泛在连接平台:的数字化转型中,数据是基础,数据的连接成为一大挑战。尤其是面对各种品牌,各种型号的质量传感器件和各种异构数据系统,连接需要无处不在,需要充分量化。大赛选取中国母语者在互联网上撰写的在线文本作为校对和评测数据,从拼写错误、语法错误和语言错误三个方面考察机器的认知智能能力。

根据比赛任务,利威智联依托圣淘沙数据科学和机器学习平台,基于预训练模型BERT和ELECTRA,通过任务分解和模型串联,对拼写、语法和标点错误进行训练和预测。在此过程中,圣淘沙团队针对语法和标点错误提出了两种不同的数据扩充方法,提高了数据质量和模型的泛化能力。

~全文结束~

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

分享到微信