全球AI竞技场,现在全方位成为中国公司实力展示台。
这不,2018年迭代上线的CoQA机器阅读理解大赛,一番你争我赶之后,最终还是形成了中国AI力量争霸之势。
而且更可喜的是,就在最近,搜狗AI团队脱颖而出,不仅高分夺冠,而且全面刷新CoQA所有评价指标。
不得不说:威武~
搜狗夺冠CoQA
此次夺冠的搜狗团队来自搜狗搜索AI研究团队,模型则是BERT + Answer Verification(单一模型)。
从9月份发布到现在,CoQA大赛已经吸引了国内外众多知名研究机构和高校,包括微软、讯飞、清华、复旦,斯坦福等等,竞争异常激烈。
在不到一个月时间内,CoQA挑战赛榜首已经3次易主。
1月3日,搜狗以82.8%的成绩稳稳占据榜首位置,全面刷新CoQA所有评价指标。
并且,搜狗的算法是CoQA的领域外(out-of-domain)数据集上表现首个超过80%的模型。
CoQA之难
CoQA大赛究竟有何特别之处?
如果非NLP从业者,对于CoQA可能会有些许陌生。你可能会好奇,不到半年的时间里,为何各大公司、高校都在努力攻克CoQA?
这就要从去年自然语言处理(NLP)领域的快速发展谈起。
2018年是NLP取得重大进展的一年,BERT出现,横扫各大NLP测试,刷新了SQuAD成绩。
除了算法以外,NLP领域的一项重要应用问答系统(QA)也在这一年悄然改变。
SQuAD测试已经逐渐跟不上智能问答系统的发展,行业急需一个更具有挑战性、更智能的QA挑战。取而代之的是今年8月上线的CoQA。
如果说SQuAD像是做英文阅读理解,那CoQA更像是模拟真实的人类对话。








