11月6日,由北京市科学技能委员会人才交流中心和北京百分点信息科技有限公司联合举行的2019数据智能立异使用大赛正式发动。10月6日敞开参赛报名。大赛以立异使用数据赋能为主题,致力于为全国高校、企业、团队和个人建立一个公正敞开的数据智能立异使用竞技渠道。
据介绍,本次大赛赛题定为根据AdversarialAttack的问题等价性判别,要求参赛集体和个人经过研讨智能对话的鲁棒性问题进行算法立异,创造出更多新的智能处理方案,处理法令知识问答傍边存在的体系不稳健问题,进步对话体系的考虑才能和处理问题的才能,实现从听见到听懂,终究进步AI律师帮手的使用者实在的体会度。
众所周知,现在问题等价性模型的作用评测都是在洁净的数据集上测验的,以最为闻名的Quora问题等价性为例,该数据会集的问题均为契合语法规矩且毫无拼写过错的语句构成的。但是,在实践的问答使用场景中,用户输入的问句常常是高度口语化的,这样的一种状况下,输入的问题会有显着的噪音,这些噪音会严重影响深度学习模型的作用。比方,如用户拼写或许语音转文字的过错,例如用户将寻衅滋事一般会怎样处理输入为寻衅兹事一般会怎样处理,这种状况在语音转文字的过程中较为遍及;针对语音转文字的状况,用户可能会刺进许多口语词,例如嗯,我问一下啊,便是,法院,啊,管不论扰民啊;用户输入高度口语化的语句,这些语句不契合语法规矩,例如法院该不该管统辖泊车的工作啊。
结构针对这些噪音安稳的模型,非常有助于进步智能问答体系的使用者实在的体会。因而,本使命在测验会集参加很多的对立样例(AdversarialExample)来模仿以上场景,需求参赛选手在使命中进步问题语义等价模型的鲁棒性(留意,在发布的练习集和验证会集均没有参加对立样例)。一起,本赛事面向参赛选手揭露业界第一批法令问答类数据集。
据介绍,大赛将约请高校学科带头人、业界专家、企业技能负责人担任大赛评委,经过赛事评选、人才培育、科研立异、工业转化立异形式,方针是探究用数据智能来处理实际国际问题的可行性,为企业和社会发掘并培育把握新一代信息技能的数字人才。
大赛将于12月16日开端测验验证,12月17日使命提交,并在12月底进行颁奖典礼。大赛评选一等级1名,奖金3万元;二等奖2名,奖金1万元;三等奖3名,奖金5000元。