TinySegmenter.jl:TinySegmenter的Julia版本紧凑的日语令牌生成器 源码
TinySegmenter TinySegmenter.jl是TinySegmenter的Julia版本, 是一种非常紧凑的日语令牌生成器,最初由Taku Kudo先生用JavaScript编写。 用法 using TinySegmenter join ( tokenize ( "私の名前は中野です" ), " | " ) # "私 | の | 名前 | は | 中野 | です" tokenize的返回值是字符串输入的子字符串数组,给出了令牌在文本中的位置。 (子字符串由SubString Julia类型表示。) 基准测试 以下是使用不同语言对大(243kB)日语文本进行标记的TinySe
文件列表
TinySegmenter_jl-master.zip
(预估有个22文件)
TinySegmenter.jl-master
.travis.yml
402B
benchmark
tiny_segmenter-0.2.js
20KB
benchmark.jl
177B
test_tinysegmenter.py
1KB
benchmark.py
546B
Gemfile
63B
Gemfile.lock
156B
requirements.txt
55B
暂无评论