将文档归入大规模的网络分类法中是一项具有挑战性的研究问题,因为在分类法中存在大量的类别和相关文档。最先进的解决方案被称为narrow-down方法,它利用搜索引擎将整个类别层次结构减小到最相关的类别,并使用分类法选择其中最好的。在最近的语言建模方法中,顶级类别信息(或全球信息)被用于判断本地类别的恰当性,这使得性能得到了提升。然而,我们观察到,在一定条件下,使用全局信息在最终的类别选择上会产生限制性的影响。首先,尽管全局信息是由一个完整的层次结构的顶级类别分类产生的,但可能也是不准确的。第二,当两个相互排斥的类别共享相同的顶级类别,或当本地的类别信息在最终的类别选择上有较大的影响时,全局信息的