测试StandardTokenizer的分词情况如下测试CJKTokenizer的分词情况如下测试ChinessTokenizer的分词情况如下测试LowerCaseTokenizer的分词情况如下测试WhitespaceTokenizer的分词情况如下