搜狗夺冠CoQA

此次夺冠的搜狗团队来自搜狗搜索AI研究团队，模型则是BERT + Answer Verification(单一模型)。

从9月份发布到现在，CoQA大赛已经吸引了国内外众多知名研究机构和高校，包括微软、讯飞、清华、复旦，斯坦福等等，竞争异常激烈。

在不到一个月时间内，CoQA挑战赛榜首已经3次易主。

1月3日，搜狗以82.8%的成绩稳稳占据榜首位置，全面刷新CoQA所有评价指标。

并且，搜狗的算法是CoQA的领域外（out-of-domain）数据集上表现首个超过80％的模型。

CoQA之难

CoQA大赛究竟有何特别之处？

如果非NLP从业者，对于CoQA可能会有些许陌生。你可能会好奇，不到半年的时间里，为何各大公司、高校都在努力攻克CoQA？

这就要从去年自然语言处理（NLP）领域的快速发展谈起。

2018年是NLP取得重大进展的一年，BERT出现，横扫各大NLP测试，刷新了SQuAD成绩。

除了算法以外，NLP领域的一项重要应用问答系统（QA）也在这一年悄然改变。

SQuAD测试已经逐渐跟不上智能问答系统的发展，行业急需一个更具有挑战性、更智能的QA挑战。取而代之的是今年8月上线的CoQA。

如果说SQuAD像是做英文阅读理解，那CoQA更像是模拟真实的人类对话。

查看原文