简单优雅的开源截图软件 Snow Shot(社区驱动)

软件是社区驱动的,非常看重用户的反馈和意见。发帖到现在也收到了很多用户的反馈,感受到了大家的热情和期待,我也快马加鞭猛猛更新~

2025-05-20 更新

长截图支持

2025-05-16 更新汇总

  1. 自定义 AI 模型功能(考虑到很多模型软件无法提供和隐私问题,现在可以在“功能设置”里配置,适配了翻译、AI 对话功能)
  2. 截图的性能优化(解决了 GPU 负载过高的问题,作为长期任务持续跟进)
  3. 颜色拾取器的显示逻辑优化(支持配置保持显示和只在截图选取内显示)
  4. 支持配置超出选区的绘画内容透明度(部分用户习惯超出截图选区的绘画内容不做显示,加了个透明度,可自由配置)
  5. 提升 OCR 效果( OCR 有概率出现文字丢失)

还有很多小的修复和优化就不多说了,感谢大家支持~

产品介绍

分享下自己开发了快 3 个月的截图软件–Snow Shot。

在开发这款软件前,我是另一款截图软件 Snipaste 的忠实用户。但随着我使用的深入,也渐渐对截图软件有了更多的功能要求。而 Snipaste 不支持文字识别的功能就让我使用起来非常难受,我需要截图后导入到微信才能做划选使用。

而且 Snipaste 是不开源的,我无法对它做出任何改进,让他更适配多种场景的使用需求。在加上现在 AI 工具的兴起,像豆包之类的工具使用起来并不清爽。截图软件显然也适合与 AI 擦出一些不一样的火花。所以,Snot Shot 应运而生。

Snow Shot 在提供完善的截图功能之上,还附带一键 OCR、翻译和 AI 对话的功能。软件以简洁优雅的理念设计,用户能高效地串联使用软件的不同功能,像游戏里的截图翻译、编写文档翻译选定文本后返回编辑、快速对所需内容进行设定好的工作流处理……

总之,Snow Shot 试图构建一个围绕截图功能的完善工具应用,通过出色的产品体验和丰富的软件功能助力用户高效的完成工作目标。

功能演示:

优秀的绘图效果

free_draw.png

OCR 演示

ocr.gif

快速翻译

translate_chat.gif

项目链接

snow-shot: GitHub - mg-chao/snow-shot: 以简洁优雅作为理念设计的工具软件

大家可以通过 Github 的 Releases 链接下载体验,最新的 AI 对话工作流在 Dev 版本上,感谢支持!

所以……
这东西是叫 Snot Shot 还是叫 Snow Shot

脑子秀逗了 :joy:,不好意思……是 Snow Shot,不知道为什么打成了 Snot……

1 个赞

居然不能改了……SnowShot_2025-05-14_14-43-03.png

这个 默认的OCR是 传统ocr api 吗 还是 调用的AI进行OCR

这介绍说真写的不清不楚

抱歉哈,第一次做推广没什么经验。
OCR 调用的是离线 AI 模型,用的 paddle ocr。翻译和 AI 用的是第三方接口

对比pixpin呢?

OCR 对比:SnowShot_2025-05-14_18-48-11.png

Snow Shot 的 OCR 还是不错的,还有提升空间,后续有时间再调优下。

而且 Snow Shot 是开源的,所有代码均上传到了 github ,截图部分是永远免费的。之所以还没对商用的场景开源是因为软件还在起步,担心被提前剽窃了,完善后会全面开源的。

为什么单说截图部分永远免费是因为翻译和 AI 部分有个硬性的调用费用,免费很困难(现在还是,也将视情况保持,如果每天的费用过高可能就会转变策略)。

并且我保证后续也不会推出会员制,采用最实惠的按量收费。有本地部署需求的(比如调用 Claude 之类的模型),可以直接 clone SnowShotApi,稍加配置就可以全部本地部署,这样也不用担心费用、隐私问题了。

OCR 是 MIT 协议开源的,欢迎大家 start,采用 rust 编写:GitHub - mg-chao/paddle-ocr-rs: A test program attempting to extract text from images by calling PaddleOCR through Rust.

收费的那些翻译和AI调用如果提供自定义接口的话,对用户来说其实也能做到免费使用的,自行寻找免费渠道即可,运营的这部分成本也可以减免了,就是作为持续开发来说可能会减少部分收入?

对于有技术实力的用户 Snow Shot 也很欢迎,不然也不会把 API 服务给开源了。后面可能会考虑在客户端加一个 API 配置的功能,这样就不用再跑一个 API 服务了。

现在之所以用 API 提供服务的方案是因为软件还需要面向普通用户推广,开箱即用的方案还是挺爽的。当用户量多了,倒是也会推出多种方案满足各类用户需求。这也弥补了软件的一些劣势。因为我本来想集成 Claude 的,结果用一个封一个,搞不定 :joy:

挺有意思的小工具,用了一下,冒昧提几点建议:

  1. 您可能需要考虑换一个许可证。您的 GitHub 项目主页上写本项目的许可证是 Apache 2.0,但该许可证原则上是不限制商业使用的,和您 3. “但禁止对程序进行修改和商业化的二次分发” 的附加条款冲突。建议改成自己的 EULA(最终用户许可协议),但这样做可能就不是开源软件了。
  2. 软件中 Chat 功能 相关的用语可以调整一下。个人认为直接写成 “AI 问答功能” 会更方便用户理解。
  3. Ai 问答和翻译功能可以考虑做成插件,用户如果有需要再手动下载,否则一个截图软件集成两个与核心功能不相关的功能,可能会造成软件过于臃肿。
    • 而且,截图翻译类已经有非常成熟的软件了,个人认为不是很必要继续在这条赛道上竞争。您可以参考一下这个软件:Pot 翻译器
  4. 性能上或许可以再优化一下。目前版本的软件在低配置计算机上(系统是 WIn 10 LTSC,CPU 是 AMD Ryzen 5,双核,内存是 4 GB,硬件环境是 KVM 虚拟机)非常卡。
3 个赞

感谢评测!软件刚刚起步,确实有很多问题。

  1. 开源许可证和发行版许可冲突的问题源于我想限制软件的商用使用。最近也思考了下开源协议的问题,这样看来我会把软件改为双协议,非商用会沿用 Apache 2.0, 商用部分会改成 GPL 协议,修改后发行版的协议就无所谓了。当初起草时是担心某些商家会拿软件倒卖……

  2. OK, Chat 功能是想向 ChatGPT 靠齐,理解起来是挺硬的了。

  3. Snow Shot 的并不是主做截图功能,单截图功能我也不想去卷,单有 Snipaste 这款软件就不足以支持再造个轮子(这点在开干前还只是小有认识,后面越了解越感觉截图功能挺难取得优势了)。但好在最初的策略就不是靠截图功能。

截图功能是用来引流,让软件能留在用户电脑上,然后通过集成其他功能满足用户多样的需求。总体来说 Snow Shot 更是一款瑞士军刀类的工具软件,但绝对追求样样精通。

翻译软件感谢推荐,正在找对标的软件,后续会有更多的功能加入。

  1. 虚拟机上会很卡之前测试也测出来了,应该是没有显卡的缘故,渲染调用了 GPU :rofl:

之所以用 GPU 渲染是有个历史缘由,在软件开发初期我就实现了一版截图的绘图功能,但是因为性能原因(主要是模糊效果的渲染直接会很卡)一口气直接用 GPU 来渲染实现了。这也影响了很多进度,但精益求精,至少自己用着满意还是很重要的。

几经周折选用了混合渲染的方案。现在调用截图 GPU 占用会飙升,力大砖飞了。现有方案来看,是可以做出性能上的改进的。

相关的优化会立即着手推进,全职开发中,试图成为一个合格的开源作者 :joy:

说实话不建议这样搞,个人的精力毕竟是有限的。与其样样都做,最后身心俱疲、样样稀松,不如专攻一点,登峰造极。

如果要搞,最好也是做成模块化,先提供一个框架,其他功能按需下载,否则很容易步 PowerToys 的后尘。用户都不希望为了吃水缸下的一粒糖而喝完一缸水。

1 个赞

现在的截图、翻译我觉得是相关性很强的。至于 AI 对话则是考虑到 AI 工具的一个兴起,我日常使用也有需求。再加上 GPT 的会员相比按量的 API 实在是太贵了,方便的 Chatbot 功能的需求应该也是存在的。

后续其他功能确实得慎重考虑了(目前的目标是完善现有功能),之前也有想法把 wps 的恶意收费的会员功能给干了,毕竟软件也挺办公向的了。

现在还刚刚推广,我再看看更多的用户反馈,如果很多人反馈太重了,可以拆分下功能,减少下心智负担。

这个确实,但截图翻译功能,无论是前面提到的 Pot,还是微信、QQ 都已经做得非常完善了。您可以考虑做点和它们不一样的,比如截图后原位翻译,或翻译功能加点花样(比如术语表,或者自动跳过人名、地名、专有名词等)。

这个……怎么说呢,个人不是很清楚日常工作中有多少要问 AI 的问题是需要从图片中提取的。

至于 API 费用,个人认为可以这样规避一下:截图并提取文字后,在浏览器中打开 GPT 网页,并将文字自动输入进去,这样用户也能方便地看到结果,还免去了 API 付费的问题。

怎么说呢,有需求也有蹭 AI 的热度吧,优势在于低价或者支持自己配置的 Chatbot,之前好多 Chatbot 获得了很多的 star,眼红。实际来说倒真没什么从图片提取的需求 :joy: 现在除了 OCR 划词后快速唤起的功能,没什么和截图交互的部分。

我个人感觉未来 AI 还能有更多的花样,只是现在没想到(没作品好参照),哈哈哈

用网页加载现有的 ai 应用会有个使用上不流畅的问题,而且很容易出现各类问题,因为没法控制对方的更新。

在乎 API 费用的话确实没什么办法,翻译服务貌似可以白嫖,但得企业用户,我还是个人,软件做起来了注册个公司,翻译费用倒不是问题。

而 AI 的费用免费额度+用量付费已经是我想到的最好的方案了,用量付费目前想也就多 10% ~ 30%,还没调研,保证最低。后面也支持自定义配置,一毛不赚。

各方面都考虑好了,实实在在的赚个吆喝了……

打开浏览器访问GPT网页涉及:1.界面跳转的不连续/卡顿;2.小白用户不会用代理

Pixpin会有点不稳定,不贴着文字边缘截的话成功率高点:

图片.png

但也不是完全识别不了,即使是从这三手截图中也是能识别正确的
——
PixPin的bug是,在这种干扰因素大的文字上,直接截图时识别的成功率比贴图后识别的要高,让人费解。