基于N-Gram的语言识别技术,非常有启发性,网上还有很多open-source的代码可以学习。