颜色分类leetcode免责声明:这项工作得到了实验室的支持,所有的实验都是在他们的平台上训练的。

个性化医疗:用深度学习重新定义癌症治疗

介绍

在中,我们想向您展示如何将深度学习应用于我们不是专家的领域。通常在任何问题中应用领域信息,我们都可以以我们的算法更好地工作的方式来转换问题,但事实并非如此。

我们将为Kaggle比赛创建一个深度学习模型:比赛的目标是将一份文件,一篇论文,归类为有助于肿瘤生长的突变类型。我们还有用于分类的基因和变体。目前,基因突变的解释是手动完成的,这是一项非常耗时的任务。

我们可以将此问题视为应用于医学文章领域的文本分类问题。在这里突出特定领域很重要,因为由于使用的词汇表,我们可能无法将其他文本分类模型应用于我们的特定领域。

我们面临的另一个重要挑战是数据集仅包含3322个用于训练的样本。通常深度学习算法有数十万个样本进行训练。我们将不得不保持我们的模型简单或进行某种类型的数据增强以增加训练样本。

在接下来的部分中,我们将看到文本分类方面的相关工作,包括非深度学习算法。接下来,我们将描述训练前的数据集和修改。