【开发者自荐】Shmily-聊天记录归档 支持 QQ、Wechat、SMS、Email等

Clip_20231119_004337
刚好第500Star,这500Star就是楼主给500人的痕迹! :grin:

1 Like

看了一下文档,似乎是要先部署 docker,nodejs,python,php,java runtime,
让后再本地运行nodejs刷一遍依赖做后端?

@lqzh 我看了一遍的感想是,这文档应该调整一下顺序,把部署依赖放到 Get 一节之前~否则我看完开始吧,让后就get中间的部署需要什么依赖怎么回事我懵逼的。。。

步骤就是从 Get 开始的.

只是 Get 的种类有很多, 如 QQ 微信 什么的,

Get-QQ 可能需要 java
Get-微信 可能需要 python

所以我把 nodejs java python 的安装环境过程整理为单独的文档了.

Get-QQ 的文档中如果用到了 java ,会有链接指向 java环境文档
Get-微信 的文档中如果用到了 python ,会有链接指向 python环境文档

#############

按流程顺序精简了一下文档, 去掉了开头的 安装环境

将 安装环境 移动到到的了对应的步骤中

以前找过没找到,还是要支持一下。以后能用得上。

就没有非程序员友好的方案吗、、。。、

那你这是主动筛选用户了。

你看看下边反馈里大量 非程序员用户 就知道许多爱好者压根是不清楚需要哪些依赖的,你这步骤下载之后直接就Get 没有开发经验的用户一看必然懵圈

我的建议还是,开始吧 在下载之后,你得说明 解压某文件夹,
让后写一下 get某种客户端的数据的用户,分别需要安装那些依赖
再之后把依赖环境配置好,设置好参数和应用,再 跳转链接到具体某一类的CLI使用。

否则开始吧这一页,真的懵·~~

另外 docker是哪个Get需要用到,么发现~~·

文档真的对小白不太友好,根据顺序去点击参考链接之后,进入到相应的github,然后github上有写先参考前面官网首页的文档。剩余的都是不友好小白的教程说明

太酷了, 作者的思路真的很不错

所以,这个东西需要下载的是那个 Shmily-Show-Demo ?我以为只是个演示呢 :sweat_smile:

嗯, 这个文档确实很难写好~ 因为作为开发者(程序员)很难预料到非程序的想法~

后面我还是通过录视频 + docker 简化过程 的方式补全文档吧.

文字还是没有视频或图片直观

谢谢你的建议

// docker 是 wechat 解密的时候会用到, 因为依赖项太难搞了, 所以通过 docker 简化了流程

Github 第一行参考官网文档这句话是写给 直接来到这个 Github 项目的人~

你不说我还没意识到这是个死循环~

如果从官网文档跳过来看到这句话又让跳回去看文档

Demo 确实是个演示~

整个过程需要参考 (文档](开始吧 | Shmily) , 让若干个程序串联运行

有空了我录视频吧, 不过确实没法做到 “一键”

例如微信, 还是需要手动从手机拷贝很多东西以及解密出来的

我感觉这个文档最大的问题是不全面,虽然说了依赖,但是在依赖运行中会出现各种问题,比如node里面报错git未匹配?什么的,这个查就是一个不小的问题。另一方面就是需要的东西和使用时间不清晰,你需要什么资料,需要什么文件在哪里用往往写的不够详细,比如我昨晚尝试搞微信,后来就卡在了找不到要解密的文件这一步。。。

过程好像过于复杂,文档过于跳跃,虽然很感兴趣无奈止步于技术不够阅读理解能力不足.
或者后续可以将所有依赖打包在docker实现一键部署?
最后微信导出还要root,好像更难了,希望能支持pc微信消息导出,因为手机消息备份到电脑会比较容易.

简单用了一下发现只能导出某个好友的聊天记录,不支持导出群聊记录吗

这个能部署到NAS上嘛,能的话要怎么部署呀,小白不太看得懂怎么安装 :joy:

楼主你好,刚需项目,很实用,但有个问题。
数据量大的时候处理很慢,是cpu内存占用低而慢,想问下是否能够调整并行线程数,或者全速模式?cpu内存吃满没关系,我数据太多,大概30w条消息,处理起来实在太慢。

谢谢~

我也发现文档很难写全了, 后面还是把文档按 开发者 和 普通用户 分割开

通过 docker 去覆盖掉依赖的问题及简化流程~
// 之前想的是 docker 包一层可能会让用户更难发现及提交问题

面对 普通用户 通过图文或视频来描述过程

暂不知道你说的慢是哪个具体流程

但是整个项目总体来说, 运算量的特点是 小而多. 类似于 30w 个小文件的处理.

Cpu 跑不满的原因

Cpu 处于

  • a 我要准备开始了
  • b 解密消息与资源
  • c 找到下一个开始处理
  • a 我要准备开始了
  • b 解密消息与资源
  • c 找到下一个开始处理
    … 30w

cpu 在 a 和 c 的过程几乎闲置, 只有 b 需要密集计算(解密)
因为每条消息不大, 所以 b 是很快的~

总体来说导致 cpu 很难跑满, 类似于 小文件复制很难跑到 硬盘满速.

能让 Cpu 跑满吗?

将消息多线程同时处理可以改进性能问题, 但编程会变得复杂, 而且会成倍增加内存占用 (Wechat 项目已经有很多人提出爆内存问题了)

考虑到导出也只会运行一次, 时间长也能接受吧~ 所以暂不修改.