随着“互联网+医疗”的迅速发展,在线问诊平台逐渐兴起,在线问诊是指医生通过对话和患者进行病情的交流、
疾病的诊断并且提供相关的医疗建议。在政策和疫情的影响之下,在线问诊需求增长迅速。然而医生资源是稀缺的,
由此促使了自动化医疗问诊的发展,以人机对话来辅助问诊过程。
本次智能对话诊疗评测设置3个赛道。第一赛段,发布超过2000组医患对话案例样本,覆盖4种儿科疾病。第二赛段,新增2种疾病共超过800组对话。各赛道数据的具体格式请参考数据样例。
医患对话理解旨在对问诊文本信息进行信息抽取,主要包括两个任务,分别是命名实体识别和症状检查识别。
-
任务1:命名实体识别。从医患对话文本中识别出五类重要的医疗相关实体。
-
任务2:症状识别。根据医患对话文本,识别出病人具有的症状信息。
医疗报告自动生成旨在对问诊过程中进行信息的总结,任务要求参赛团队能依据病人自述和医患对话,
输出具有规定格式的医疗报告。报告需要包含6个部分:主诉、现病史、辅助检查、既往史、诊断和建议。
-
任务1:医疗报告生成。依据病人自述和医患对话,输出具有规定格式的医疗报告。
就诊过程是一个带有目的的序列化医生-患者交互的过程。智能化医疗诊断是任务型对话系统的重点研究方向。
-
任务1:面向自动诊疗的对话系统。要求参赛系统根据给出的显性信息
(病人自诉中提及的症状),与病人模拟器进行互动以获取更多病人的症状,依据交互内容判断疾病。
本赛道的数据集超过2000个样本,每个样本包含疾病类别、病人自诉文本、直接信息
(病人自诉中明确提及的实体信息、症状)、隐藏信息(结合整段医患对话得到的实体及标签,表示患者是否已经有该症状)。
重要日期
2021年4月10日 | 开放报名,报名入口 4月10日正式开放 |
2021年5月1日 | 竞赛启动 |
2021年5月31日 | 第一赛段结束,报名结束 |
2021年6月1日 | 第二赛段开始 |
2021年7月5日 | 报名结束 |
2021年7月20日 | 停止模型提交和排行榜排名更新 |
2021年7月21日-7月31日 | 竞赛评审(排行榜最终排名靠前且无任何违规行为的队伍将进入决赛人工评审 |
2021年8月15日-17日 | 竞赛颁奖(第二十届中国计算语言学大会期间邀请优胜队伍分享比赛经验和模型、进行大赛颁奖) |
致谢
感谢默克公司对本次比赛的赞助,感谢并行科技为本次比赛提供计算资源赞助。
感谢中山医院姚璐老师对于数据标注框架设计提供的专业指导建议。感谢陈伟,钟宗烨,王静致远,
葛羽,王亚丽,温惠梅,司若琰等同学参与数据标注过程。
参考文献
-
Qianlong Liu, Zhongyu Wei, Baolin Peng, Xiangying Dai, Huaixiao Tou, Ting Chen, Xuanjing Huang, Kam-fai Wong. Task-oriented dialogue system for automatic diagnosis[C]. ACL 2018.
-
Xinzhu Lin, Xiahui He, Qin Chen, Huaixiao Tou, Ting Chen, Zhongyu Wei. Enhancing dialogue symptom diagnosis with global attention and symptom graph[C]. EMNLP 2019.
-
Kangenbei Liao, Qianlong Liu, Zhongyu Wei, Baolin Peng, Qin Chen, Weijian Sun, Xuanjing Huang. Task-oriented Dialogue System for Automatic Disease Diagnosis via Hierarchical Reinforcement Learning[J]. arXiv preprint arXiv:2004.14254, 2020.
-
Yu-Shao Peng, Kai-Fu Tang, Hsuan-Tien Lin, Edward Chang. REFUEL: Exploring Sparse Features in Deep Reinforcement Learning for Fast Disease Diagnosis[C]. NIPS 2018.