​万字长文详解文本抽取:从算法理论到实践(附“达观杯”官方baseline实现解析及答疑)

  • 时间:
  • 浏览:0

文章来源:微信公众号 数据派THU

[ 导读 ]“达观杯”文本智能信息抽取挑战赛已吸引来自中、美、英、法、德等26个国家和地区的250余名选手参赛,目前仍在火热进行中(点击“阅读原文”进入比赛页面,QQ群见下图或文末二维码)。达观数据目前可能性举行过两次围绕比赛的技术直播分享,并开源了baseline模型。本文是这两次技术直播的内容总结,包括信息抽取传统算法和前沿算法详解、比赛介绍,以及比赛baseline模型代码分析和改进建议。

高翔是达观数据联合创始人,达观数据前端产品组、文本挖掘

在前半偏离 ,达观数据的联合创始人高翔删剪讲解了自然语言补救中信息抽取算法技术。在后半偏离 ,达观数据的工程师们分享并介绍了“达观杯”文本信息抽取挑战赛的baseline代码以及改进建议。最后,针对参赛选手和一点观众的什么的问题,三位专家也一一做了解答。