由于识别化学物和疾病之间的关系(CDR)对于生物医学研究和医疗保健很重要,因此BioCreative V提出的挑战要求自动挖掘化学物和疾病之间的因果关系,这种关系可能跨越句子边界。 尽管大多数系统都在探索特征工程和知识库来识别文档级CDR关系,但是自动学习仅在句子中受到限制...在这项工作中,我们提出了一种有效的模型,该模型可以自动学习文档级语义表示以提取化学诱导的疾病通过结合卷积神经网络和递归神经网络的优势来实现文章之间的(CID)关系。 首先,为了有目的地收集上下文,对存在于文章多个句子中的候选实体进行了屏蔽,以使模型具有辨别候选实体和通用术语的能力。 接下来,考虑到关联句子之间的连续性和时间性以及文章的主题,在文档级别设计了分层的网络体系结构,以捕获文章中不同类型的文本段的语义信息。 最后,一个softmax分类器执行了CID识别。CDR语料库的实验结果表明,与其他最新方法相比,该模型具有良好的整体性能。 尽管仅使用两种类型的嵌入矢量,但我们的方法不仅可以很好地识别句子内的,而且还可以识别句子间的CID关系。