由于完整的DNA链包含大量数据(通常为数十亿个核苷酸),因此弄清每个序列段的功能具有挑战性。已经提出了几种强大的DNA序列功能预测模型,包括CNN(卷积神经网络),RNN(递归神经网络)和LSTM[1](长期短期记忆)。但是,它们都有一些缺陷。例如,RNN几乎没有长期记忆。在这里,我们基于这些模型之一DanQ,该模型一起使用CNN和LSTM。我们通过开发改进的DanQ模型并将其应用于更有效地预测DNA序列的功能来扩展DanQ。在最原始的DanQ模型中,通过卷积层捕获的调控基元和循环层捕获的基元之间的长期依赖性来学习调控语法,从而提高了预测准确性。通过对某些模型的测试,DanQ在