阿塞拜疆假新闻发生器 语言模型可以根据序列中已观察到的单词来预测序列中下一个单词的概率。 神经网络模型是开发统计语言模型的首选方法,因为它们可以使用分布式表示形式,其中具有相似含义的不同单词具有类似表示形式,并且因为它们在进行预测时可以使用最近观察到的单词的较大上下文。 该项目的目的是使用LSTM递归神经网络以阿塞拜疆语言生成假新闻。 LSTM递归神经网络是功能强大的深度学习模型,用于学习序列数据。 在该项目中,使用LSTM模型并对其进行了65 000个样本的训练,并且该模型应该能够生成文本。 培训的数据已从阿塞拜疆最受欢迎的新闻网站上获取。 在50个时期内,模型的准确度约为70%。 我已使用所有可能的方法来避免过度拟合。 注意! 我只分享了一小部分示例数据。 定义的基于单词的语言模型的图。 学会的嵌入需要知道词汇量和输入序列的长度,如前所述。 它还具有一个参数,用于指定将使用多