【自荐】PDFMathTranslate - 完整保留排版的 PDF 全文翻译器

刚刚用docker搭建了一个,能跑起来了,你们镜像好像是没有传到docker的官方仓库?我是docker build自己构建的镜像,问题有这几个:1、没有compose,compose我补充在下面了,文档中没有映射输出目录; 2、ollama等没有预留需要填写的接口地址以及检验的按钮;3、gradio有点重,其实不是很轻,感觉响应速度啥的有问题,demo没问题

version: ‘3.8’ # 使用一个支持的 Docker Compose 版本

services:
pdf2zh:
image: pdf2zh:latest # 替换为你的镜像名称
container_name: pdf2zh-container
ports:
- “7860:7860” # 将容器端口 7860 映射到宿主机端口 7860
restart: always # 设置容器崩溃后自动重启
volumes:
- ./output:/app/gradio_files/outputs

之前镜像忘记打latest标签,现在应该可以直接pull了

okok

好东西,感谢分享。话说这名字的意思难道是"不要百度"? :laughing:

哈哈哈角度清奇

1 个赞

加上 openai 了,可以选模型,之后会加参数设置

1 个赞

好的 :grinning:

作者好,图形化界面我遇到不能完成的bug:

文件的同级文件夹的内容如下:

正常来说,是生成和原文件前缀一样的2个文件,一个双语一个汉语。使用命令行是没有问题

UI界面 更换浏览器,也会出现错误
Running on local URL: http://127.0.0.1:7860

To create a public link, set `share=True` in `launch()`.
IMPORTANT: You are using gradio version 4.26.0, however version 4.44.1 is available, please upgrade.
--------
ERROR:    Exception in ASGI application
Traceback (most recent call last):
  File "C:\Users\user\AppData\Local\Programs\Python\Python39\lib\site-packages\pydantic\type_adapter.py", line 270, in _init_core_attrs
    self._core_schema = _getattr_no_parents(self._type, '__pydantic_core_schema__')
  File "C:\Users\user\AppData\Local\Programs\Python\Python39\lib\site-packages\pydantic\type_adapter.py", line 112, in _getattr_no_parents
    raise AttributeError(attribute)
AttributeError: __pydantic_core_schema__

error

环境问题建议用docker

我也没遇到过,更新下试试呢

1 个赞

支持把繁体字翻译成简体字吗

纯Python的小白,下载了也不会启动 :joy:
我应该从哪开始学

可以的

可以在线体验 https://pdf2zh.com/

1 个赞

我用在线体验版,上传阿里的港股财报的部分页面,Translate to选择的Chinese,生成的两个版本,下载下来怎么还是繁体中文呢?

在线版只能翻译英文文档,需要翻译繁体中文需要使用命令行版本

有个疑问,可以输出为pdf文件能不能输出为latex呢(理论上)?latex也算是可以保存原始排版的

还原latex有难度,你可以试试mineru/marker/mathpix

1 个赞

好的,谢谢