通过区分粗略模式进行文本行分割的无监督学习 我们提出了一种无监督的深度学习方法,该方法将文档图像补丁嵌入到紧凑的欧几里得空间中,其中距离对应于粗略的文本线图案相似度。 一旦产生了该空间,就可以使用带有嵌入特征向量的标准技术轻松实现文本行分割。 为了训练,我们提取随机的成对文档图像补丁,假设相邻补丁包含相似的文本行粗趋势,而如果其中一个旋转,则它们包含不同的文本行粗趋势。 出色地完成此任务需要模型学习识别文本行及其突出部分。 我们的方法的好处是手动贴标签工作为零。