随机文字 库,用于生成随机文本。 快速资讯 该库提供了简单的接口和类,用于标记现有文本块并根据提取的标记生成新的文本块。 该库的编写符合 ,而无需任何其他。 从文本块中提取的标记通常是单词+标点符号+空格或单个字符。 混合苹果和橙子不应该被认为是一种好习惯,即以完整单词的形式包含一些标记,而另一些则以单个字符显示。 提到的两种令牌化策略都是在库中执行的,而其他策略则可以通过以下方式获得: 传递所需ShatteringOptions到断词的方法, 使用自定义正则表达式中断模式和转换方法构造RegexTokeniser , 实现LineByLineTokeniser抽象类的自定义扩展或实现