语言:for适用于Java和JVM的最准确的自然语言检测库适用于长文本和短文本 源码
快速资讯 该库试图解决非常短的单词和短语甚至比tweet短的语言检测 利用统计和基于规则的方法 超过70种语言的性能优于Apache Tika , Apache OpenNLP和Optimaize Language Detector 可在每个Java 6+应用程序中以及在Android上使用 无需额外的语言模型培训 用于添加您自己的语言模型的api 离线使用而无需连接到外部服务或API 可以在REPL中使用,以快速试用 目录 7.1 7.2 9.19.2 1。 这个图书馆做什么? 它的任务很简单:它告诉您一些提供的文本数据是用哪种语言编写的。对于自然语言处理应用程序中的语言数据(
文件列表
语言:for适用于Java和JVM的最准确的自然语言检测库,适用于长文本和短文本
(预估有个1243文件)
gradlew.bat
3KB
gradlew
6KB
gradle-wrapper.jar
54KB
LanguageDetectorBuilderJavaTest.java
1KB
langdetect-183.bin
10.08MB
bigrams.json
12.32MB
fivegrams.json
4.86MB
fivegrams.json
18.27MB
trigrams.json
12.29MB
quadrigrams.json
19.7MB
用户评论