经测试,总体感觉意义不大,原本以为图片式的PDF也能提取,结果只能提取纯文字的PDF
本来文字型PDF本身就可以复制,且文件体积也不大
提取到txt纯属多此一举,不知道有什么意义,一是排版跟原来一样,断句也没有自动合并,二是提取出来,排版感觉乱乱的,还不如直接看原PDF,有什么内容直接复制就好了
正文完
经测试,总体感觉意义不大,原本以为图片式的PDF也能提取,结果只能提取纯文字的PDF
本来文字型PDF本身就可以复制,且文件体积也不大
提取到txt纯属多此一举,不知道有什么意义,一是排版跟原来一样,断句也没有自动合并,二是提取出来,排版感觉乱乱的,还不如直接看原PDF,有什么内容直接复制就好了