classycn:文言文

audio70940 6 0 zip 2024-07-16 19:07:59

classycn是一款古典汉语分句器，专门用于处理和分析古典汉语文本。该工具的数据部分包括大量的历史文献，数据文件夹大小超过1G。主要的数据集包括：

data/sjw：来自Seungjeongwon Ilgi的清理数据，源自古代韩国皇家秘书处的备忘录，包含超过2亿个字符和16,000多个唯一字符。
data/24s：中国“二十四史”的半清洗数据（不包括韩书和三国志），数据来自维基文库，可能包含嘈杂的标记，共计2000万个令牌，12k个唯一身份。
data/向量：使用GloVe和Word2Vec生成的词向量。

脚本部分包括多种标记器的训练和测试方法：

runhmm：训练和测试来自NLTK的HMM标记器。
runcrf：从CRF Suite训练和测试CRF标记器。
runlstm：训练和测试双向LSTM标记器，用Theano实现。

联系人：胡一舟，联系邮箱huyz725+github at gmail.com。

为帮助读者更好地理解和应用这些工具和数据，以下是一些与主题相关的资源和下载链接：

汉语单词向量：提供上百种预训练中文词向量的源码。
词向量资料：关于词向量的详细资料。
词向量.zip：包含大量词向量文件的压缩包。
词向量glove论文：介绍GloVe词向量的研究论文。
fasttext词向量中文：提供FastText中文词向量的资源。

文件列表

classycn:文言文 (预估有个344文件)

runcrf-hu.py 2KB

runhmm.py 2KB

crf.py 1KB

runlstmsparse-1000000-x.py 5KB

runlstmdense500-1000000-cbow.py 5KB

runlstmdense50-10000-cbow.py 5KB

cpr.py 2KB

util.py 5KB

crfvec.sh 411B

runlstmdense50-10000-sg.py 5KB

thesis-draft.pdf 354KB

runlstmdense50-10000-glove.py 5KB

runcrf.py 3KB

runlstmdense500-1000000-cbow-x.py 6KB

.gitignore 11B

runhmm-hu.py 2KB

README.md 758B

crf.sh 882B

toglove.py 250B

lstm.py 11KB

用户评论

暂无评论

文言文特殊句式

nullnull文言文特殊句式复习 null文言文中有哪些常见的特殊句式?一.倒装句 {宾语前置句介宾短语后置句(状语后置句)定语后置主谓倒装二.判断句三.省略句null

27 2021-01-31
文言文转换器

正式版本（已注册版本）用户将得到以下服务：1.免费得到最新的引擎升级版本2.最广泛的技术支持3.插件的实时更新4.优惠的新版本《文言之星》程序部份升级5.优惠价定制引擎

34 2019-05-13
如何学好文言文

如何学好文言文一,学习文言实词应注意的几个问题。文言实词包括名词、动词、形容词、数词、量词。在文言文中,实词的数量比虚词多得多,学习文言文,最应该下功夫的是多掌握文言实词的词义,只有掌握了一定数量

5 2021-02-19
文言文翻译器1.0.0.0

文言文是古代文人所写的文章，用词用句与现代汉语很多不一样，主要包括以先秦时期的口语为基础而形成的书面语。俗称“之乎者也”。文言文翻译器可以给你翻译每字，或词的意思，如果没翻译用现代汉语来读都很难读得通

31 2020-06-17
wenyan文言文编程语言源码

文言wenyan-lang | | 英文|| 文言文编程语言。一种用于古代汉语的编程语言。序夫,之世,,屈指而足算是时岂料百代之后,计算机械之巧,精于。之,善于之;程式语言之多,繁若之星宿,奇胜之

10 2021-04-21
文言文基础知识入门.ppt

初中文言文入门教学PPT

9 2021-03-05
初中文言文阅读技巧.pptx

初中文言文阅读技巧(非常全面)

7 2021-04-18
香港dse文言文語譯.docx

香港dse文言文語譯.docx

17 2021-04-24
现代文到文言文翻译器

可以将将白话文翻译成文言文的小工具不是代码

79 2019-02-14
在线文言文常见汉字查询源码.rar

本查询收集了几乎所有古文（文言文、八股文、诗歌、词典）中存在的古文汉字的解释，共记3890字。

25 2019-07-12

classycn:文言文

文件列表

用户评论

推荐下载