1.准备数据 1.1数据下载 数据集1:https://github.com/todototry/AncientChinesePoemsDB this repo is a DB for Ancient Chinese Poems and Ancient Chinese Pronunciation. 数据集2:https://github.com/jackeyGao/chinese-poetry 最全的中华古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。数据来源于互联网。 数据集1是每首诗