OCR 准确性和后台性能开销是个很大的问题啊,随时后台处理的话,设备不是太好,怕是要卡顿的,这是不可接受的。
OCR的准确性也是个大问题,单纯打印 扫描件也还好,错不到哪去。问题在于一些风景类的存档,也给你识别了些有的没的,是污染数据库的
OCR 准确性和后台性能开销是个很大的问题啊,随时后台处理的话,设备不是太好,怕是要卡顿的,这是不可接受的。
OCR的准确性也是个大问题,单纯打印 扫描件也还好,错不到哪去。问题在于一些风景类的存档,也给你识别了些有的没的,是污染数据库的
我的方案要试试吗,通过Excel来管理附件,文件上传到自己电脑做的网站上。本地和网站各有一份,要实现报表非常轻松,筛选一下就行了,还可以把相关的附件插进去。
1,支持管理大量文件。
2,支持【拖动多个文件、文件夹】以添加。
3,支持添加【备注】以注释、检索。
4,支持【检索】,可按文件名、添加日期、文件体积、备注等进行检索;以及组合检索。
5,可以使用LESLIE NOTE自带的【容灾】功能实现整体的版本管理。
1,LESLIE NOTE
LESLIE NOTE 本地笔记软件(2023-12-18:更新 v5.31) - 发现频道 - 小众软件官方论坛 (appinn.net)
2,编辑器《LN超级列表》
(注:可下载懒人包,直接使用)
LESLIE NOTE 编辑器之《LN超级列表》 - Leslie Xin
1,功能入口
2,主界面
3,检索
如果仅需要对单个文件进行自动备份、版本管理,可以使用另一款编辑器《LN版本管理》。
相关介绍:
对任意文件进行版本管理【LESLIE NOTE 系列教程】 - 知乎 (zhihu.com)
我猜测: 楼主想要的版本控制,跟你们想的不一样.
楼主的不同版本的文档很可能都不是自己生成的.
但也不是协作生成的.
有可能是文件互传修改的各种版本.
所以常规的git 工具很难管理.
尽管onedrive也有版本管理,但是楼主需要保密,不能用云文档.
尽管word文档本身就有属性管理, 可以录入想要的信息. 但是这个不利于查看, 也不利马上汇总打包上传或者下达.
所以实际上, 楼主要的自动化命名工具. 而不是什么文档管理系统或者git版本管理工具.
自动化命名的目标是:
前缀以当前年月日命名.
中段以部门文件名命名.
后缀以版本号命名.
所以一个完整的文件名是:
20230203_转发某某部关于×××的通知_v2.docx
这个可以用菲菲更名宝贝来实现.
或者自己手搓工具.
比如 ahk 脚本实现一键自动给当前文件名加日期前缀.
;=======================================================
;** 快捷键 Alt+F2 给选中文件加前缀日期yyyyMMdd_
;=======================================================
!F2::
IfWinActive ahk_class dopus.lister
{
reName()
}
IfWinActive ahk_class CabinetWClass
{
reName()
}
return
reName()
{
clipboard = ; 清空剪贴板
Send, ^c
ClipWait, 2
if ErrorLevel
{
MsgBox, 获取文件名失败.
return 1
}
Clipboard=%clipboard%
filePath= %clipboard%
IfExist %filePath%
{
FullFileName = %filePath%
SplitPath, FullFileName, name, dir
ToDay=%A_Year%%A_MM%%A_DD%
newName=%dir%\%ToDay%_%name%
FileMove,%FullFilename%,%newName%
if ErrorLevel
{
MsgBox, 文件改名失败.
return 1
}
;TrayTip 文件名加日期,%name% 已改名为 %ToDay%_%name%,30,1
}
return 0
}
本地搭建git服务啊,全世界又不是只有GitHub才有git
楼主的需求我目前也没有好办法,感觉挺难的,至少要付出很多努力,这么多文件换我也会睡不着
文件名管理的话,可以参考一下这个文章的思路
元数据文件命名法
软件的话,可以试试 Zotero、Eagle、Billfish 这种文件管理软件能不能符合要求
Zotero
Eagle 的操作和预览更丝滑一些,可以打标签、写备注、打分
Zotero 和 Eagle 都有插件功能,也能实现一些高级的个性化需求
话说,这些问题在 AI 时代为啥还是个问题。
人因
AI预测不了一个文档要改多少版
一个文档,可能从v1、v2、v3一直迭代到v9
但下一刻可能就要回滚到v5,并在此基础修改出一个新版本
假如这个新版本是最终版,它叫v10好,还是v5.1
你以为是最终版了,领导又双叒叕要改……
以上这种情况一个人独立修改还好,要是文档流经多部门
xx(1)(1)(1)(1).docx
每次微信上见到这种文件都想杀张某某祭天
小恐龙的回复是最接近我工作的那种了
但还要加上文件夹区分
xx期\0. 汇总\编号\*.*
xx期\1. 进行中\编号\日期\*.*
xx期\2. 已完成\编号\日期\*.*
xx期\0. 工作进度.xlsx
0. 工作进度.xlsx
里罗列所有待办条目和所有环节,随工作推进打勾涂色加备注进行中
和已完成
下面还加个日期子文件夹是因为同事&领导不会去记忆你编排的版本号,能说出是昨天或者前天那版已经是万幸了汇总
里汇总
汇入更高一级的xx年汇总
你这得上excel交互了吧,并且格式一开始就得确定啊,不然后面无论用python还是cpp还是其他的啥都没法子改模板格式了,只能从源码改