PDF Craft - 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换

你用的是在线吧?
我吭哧吭哧好不容易5步装完,发现使用居然要用命令行,那还不如用在线的。
在线的速度这么慢吗?那还是MinerU吧,只是排版是个问题。

oomol啥时候开始有邀请码了。。本来想说为什么不用glm4.6v,结果去看了个视频,gemini 3.0 flash结束游戏了 :laughing:

019b36bf-bc7a-7000-bd01-6ea4edb12f5a

019b36bf-e529-7000-9c07-ba623a72bc59

019b36bf-f934-7000-8bb7-a9fb82df2dc8

019b36c0-0555-7000-bb3f-103949a806d0

019b36c0-19f5-7000-b625-a8bd2cccb53e

019b38da-29a4-7000-a4fd-4136aec81ec2

019b38da-4846-7000-a41e-874eb83152d9

019b38da-53de-7000-9b05-c5bb7e03b160

019b38da-5a73-7000-913a-605ac34dd748

019b38da-617f-7000-b363-64b042a0d437

严格安装了配置环境,一切正常了,但是下面如何用源代码搭建就没有找到教程了

019b5415-262d-7000-a1df-5b209c8e29ab

019b5415-5224-7000-9624-1d3d6dbaa17b

019b5415-577b-7000-9a97-3de171578bc5

019b5415-5c1d-7000-befe-c5caa6fa8e33

019b5415-6259-7000-a864-4b4f9fb852d1

019b54a7-40bb-7000-8a16-e00d586e814d

019b54a7-440e-7000-8a99-f95e9e8812b5

019b54a7-4748-7000-bbde-68eb675d40db

019b54a7-4a3a-7000-bea5-6816d968fcf7

019b54a7-4d6d-7000-95ff-feb4addf0c39

019b5834-13a4-7000-a882-653dd2ea203f

同样,我试了3次,失败也扣token,不得以使用临时邮箱新弄了号
好消息是这次成功了,坏消息是下载不了。
算了,本来能弄epub我还蛮喜欢的。

019c02a3-616f-7000-8a88-944513ea935d
019c02a3-7bd0-7000-a0c2-a484d81783ee
019c02a3-80ef-7000-9fdb-59c3d22add8b
019c02a3-80ef-7000-9fdb-59c3d22add8b
019c02a3-884e-7000-938c-bb16fc2dc825

019c4263-abcb-7000-ab58-83018b582c77

019c4263-c3f3-7000-a7dd-a2d8d2acc2c3

019c4263-ccdd-7000-934c-cd82452e355a

019c4263-dd44-7000-864e-d853781cb9ba

019c4263-e946-7000-a71b-1fbc539e8b43

对比paddleOCR如何呢?最近出了1.5,之后我都是本地跑这个