安卓有没有离线可用的文本合并去重的软件

比如窝把两个相似文本合并,只是有轻微的不同,目前貌似只有AI工具能做得但都需要联网,而那些所谓的离线AI,目前窝用过的模型都会对内容要不添油加醋要不精简过分,而且还有文本长度限制,比如AI问答pocketpal(GitHub - a-ghorbani/pocketpal-ai: An app that brings language models directly to your phone.)用的模型:
1,Qwen2.5-1.5b-instruct-q8_0.gguf; Filena - filename=qwen2.5-1.5b-instruct-q8_0.gguf

2,DeepSeek-R1-Distill-Qwen-1.5B-Q2_KL.gguf; filename=DeepSeek-R1-Distill-Q wen-1.5B-Q2_K_L.gguf,

列子:如果是重复或意思相近的语句是否可以删除并合并?

1,
鲨鱼8.6.1,有广告弹窗,会员限制,功能比较实用,是via和alook的阉割组合版,文件工具插件(要下载,标签页有bug新建页点击没反应,支持添加脚本(不能导入链接/和alook一样)和插件(视频解码,大爆炸,视频剪切,WIFI传输,文件加密,广告过滤规则不支持网络导入,视频要手动才能弹窗播放,后台打开没用,

2,下划线的表示重复/意思相近
鲨鱼8.6.0大小19m安装后123m,最新861就坑了,
优点:功能比较实用,支持添加脚本(不能导入链接/和alook一样)和插件(视频解码,大爆炸,视频剪切(没用导入就是复制视频:red_exclamation_mark:WIFI传输,文件加密,图片拼接只能纵向导入就是复制:red_exclamation_mark:
缺点:有广告弹窗,会员限制,看着似via和alook的阉割组合版,文件工具插件(要下载,标签页有bug新建页点击没反应,告过滤规则不支持网络导入,视频要手动才能弹窗播放,后台打开没用,861切换标签白屏要滑动屏幕才正常显示(bug​:red_exclamation_mark:,健康码图标删除后重开又出现删不掉:red_exclamation_mark:网站视频只能手动,不太实用,

话说还有个问题,能否把2个文本按数值大小合并重新排序,比如:
1.
H5,V0.4.2.66大小0.04MB
X,大小一直保持在2MB左右
via,大小一直保持在2MB左右
米侠,5.4.0/5.5.4.2大小2MB
荟萃,3.0.1(pro大小2.5MB
小海,2.1.22大小3.5MB
MDM,2.1.5大小3.7MB
2.
Plato浏览器v1.0.1大小:1.8M,
lit浏览器3.1.6.2大小:3.2M,
自动化浏览器v2.98大小:3.6M
轩哥浏览器1.0(com.android.xgllq)大小3.97m

直接regex匹配每行最后那个数字,然后排列即可。

应用直接写好了:

Screenshot_20250725-014522.png

通过网盘分享的文件:应用大小整理.apk 提取码: 6666
链接: https://pan.baidu.com/s/15zFgca2koIJm_I7UHcsIJw?pwd=6666

首先非常感谢:+1:帮大忙了:sob:窝以为没人回复了……

按照软件逻辑,如果是重复或意思相近的语句是否可以删除并合并?

1,
鲨鱼8.6.1,有广告弹窗,会员限制,功能比较实用,是via和alook的阉割组合版,文件工具插件(要下载,标签页有bug新建页点击没反应,支持添加脚本(不能导入链接/和alook一样)和插件(视频解码,大爆炸,视频剪切,WIFI传输,文件加密,广告过滤规则不支持网络导入,视频要手动才能弹窗播放,后台打开没用,

2,下划线的表示重复/意思相近
鲨鱼8.6.0大小19m安装后123m,最新861就坑了,
优点:功能比较实用,支持添加脚本(不能导入链接/和alook一样)和插件(视频解码,大爆炸,视频剪切(没用导入就是复制视频:red_exclamation_mark:WIFI传输,文件加密,图片拼接只能纵向导入就是复制:red_exclamation_mark:
缺点:有广告弹窗,会员限制,看着似via和alook的阉割组合版,文件工具插件(要下载,标签页有bug新建页点击没反应,告过滤规则不支持网络导入,视频要手动才能弹窗播放,后台打开没用,861切换标签白屏要滑动屏幕才正常显示(bug​:red_exclamation_mark:,健康码图标删除后重开又出现删不掉:red_exclamation_mark:网站视频只能手动,不太实用,

传统方法不好做你这种近似判断,要是直接用句首第一个词(第一个空格前的部分),也就是应用名称来判断就好做。

能不能扫描检查文本相同字段,比如相同的字词大/等于第三个是就判断为重复

文本相似度判断这块,我也不熟

给了最小可行性验证的demo,该报价了 :grin:

我是直接让联网 AI 帮我做排序的,但是合并去重我没有试过。

@tiger,不是有AI自动编译工具可以?比如TRAE,还有一些可以辅助的大模型,就是如果是小白的话到最后要打包apk就很麻烦……