提取出html文件中的word和对应的bbox(即对应的位置坐标),以列表形式输出