把8页的pdf并排成一张长的image 然后就在上面抽feature 好了 抽的feature是HOG Histogram of Gradients 这是一种纯粹用于描述视觉观感的feature 文本 曲线图 图像 表格以及数学公式的feature不同 然后用AdaBoost做feature selection训练得到一个分类器:纯粹根据paper的视觉观感来评价paper ">把8页的pdf并排成一张长的image 然后就在上面抽feature 好了 抽的feature是HOG Histogram of Gradients 这是一种纯粹用于描述视觉观感的feature 文本 曲线图 图像 表格以及数学公式的feature不同 然后用AdaBoost做feature selection训练 [更多]