【我的 AI 观察报告】2026-05-06 正经说说 Trae Solo

首先觉得抖音系疯狂的占据了几乎所有的 AI 生态位,现在国内几乎无人能与争锋。这和能力强不强没关系,反正以前常听人说“百度一下”,现在总听人说“豆包一下”

coffee-mini

Trae Solo 在我眼睛里就是一个小龙虾,但是它开箱即用。甚至安装好了很多常用技能。甚至有技能商店,MCP 市场。

  • 自带的模型不强,用它写网页反正……反正是网页。但是多态模型啊,能画图,能识图。
  • 可以操控你的电脑,手机连接电脑非常轻松,基本就是登录同一个账号就行。
  • 有云端环境,可以实现有工作区的文件操作,这意味着可以完成一些复杂的任务,可以运行脚本实现一些功能。
  • 对于本地文件操作需要授权文件夹的操作权限,以此保障安全。
  • 各种功能工作都比较稳定,不会出现小龙虾那种需要自己反复调试的状况。

以下开始案例:

新闻推送

创建定时任务很简单,基本上写清楚要求就可以了,读取某个网址,甚至可以约定读取前几页,然后对内容进行筛选,推送给我。

我让他先搜集了一番科技新闻源,并验证它能够正常访问,然后每天早晨筛选后给我发一份日报。

没用调试,很成功。(我在小龙虾下曾经折腾了很久这个功能,但最终都不稳定)

这是一个云端任务,所以我每天早晨可以在手机上查看。

附提示词(AI 自己写的,我没改):
## AI 科技日报生成任务

### 任务目标
从以下12个RSS源抓取最新内容,筛选AI相关新闻,生成每日精选日报。

### RSS 信息源列表

**英文源(8个):**
1. TechCrunch: https://techcrunch.com/feed
2. The Verge: https://www.theverge.com/rss/index.xml
3. Wired: https://www.wired.com/feed/rss
4. Ars Technica: https://feeds.arstechnica.com/arstechnica/index
5. MIT Technology Review: https://www.technologyreview.com/feed
6. CNET: https://www.cnet.com/rss/news/
7. Engadget: https://www.engadget.com/rss.xml
8. ZDNet: https://www.zdnet.com/news/rss.xml

**中文源(4个):**
1. 雷锋网: http://www.leiphone.com/feed/
2. 极客公园: http://www.geekpark.net/rss
3. 36氪: https://36kr.com/feed
4. 机器之心: https://www.jiqizhixin.com/rss

### 筛选条件(必须全部满足)

**时间条件:**
- 必须是最近24小时内发布的文章

**内容相关性:**
- 必须与AI(人工智能/机器学习/大模型/生成式AI)相关
- 关键词包括但不限于:AI、人工智能、GPT、Claude、Gemini、LLM、大模型、机器学习、深度学习、神经网络、ChatGPT、OpenAI、Anthropic、DeepSeek、豆包、通义千问、文心一言、AI Agent、具身智能、自动驾驶、AI芯片等

**内容类型(优先级从高到低):**

1. **AI行业重大新闻**(优先收录)
   - 大模型发布/重大更新
   - AI公司融资/并购/IPO
   - 重要政策法规
   - 行业标杆产品发布
   - 知名公司AI战略调整

2. **AI趣闻与应用**(适度收录)
   - 用户创意使用方法
   - 有趣的AI应用案例
   - 实用经验分享
   - 新颖的思路和脑洞
   - 贴近生活的AI应用

3. **排除内容**(不要收录)
   - 不知名工具的小版本更新
   - 过于晦涩的技术论文解读
   - 纯代码/算法细节分享
   - 与AI无关的科技新闻

### 输出要求

1. **数量**:最多10条,如果高质量内容不足可以少于10条
2. **格式**:生成一份清晰易读的日报,保存到 /workspace/ai_daily_report_YYYYMMDD.md
3. **结构**:
   - 标题:AI 科技日报 - YYYY年MM月DD日
   - 每条内容包含:来源、标题、一句话摘要(20-50字)、原文链接
   - 按重要性排序,重大新闻在前

4. **语言**:中文日报,英文内容需翻译摘要

### 执行完成后
- 保存日报文件到 /workspace/
- 通过应用内通知提醒用户查看

小说解析

最近被人按头安利了一本小说,据说读到四百章以后才能渐入佳境,我才读到二百章,已经累的不行了。epub 格式,26.1MB,直接丢给它,反正你能解压,逐章提取地理位置的描述,以及它们的相对关系,汇总,写成提示词,我要画地图。

断断续续搞了两个半小时(这中间有电脑休眠导致的中断,开始我没注意到),它说文本有 18MB+,终究是一口气搞出来了,拿着这个提示词丢到 image2 里面做地图,效果不错。

也算是典型的做脏活累活的场景了。我觉得办公场景下很少有单次这个体量的文本处理吧

设计师们,我们的素材库有救了

我最近玩 AI 生成图片,很好玩,但是下载之后就是个很规律的时间或者编号标记的文件名,图片多了开始感到混乱。

我就让他整理这些图片,要求是

  • 根据图片内容进行命名
  • 如果图片比例接近 880:1200 则视为 Kindle 壁纸,加以标记

然后二三十张图片,似乎两三分钟就给搞定了。命名没毛病,标记没毛病(除了把 A4 纸尺寸的图片也当做了 Kindle 壁纸……这不很合理嘛)

设计师的素材库真的可以告别手动整理了啊


思考

它强吗?不算,但真的大众友好。

今天在群里我举了一个例子:可选计算器和那种大按键的台式计算器,哪个强?那肯定是科学计算器强。但是日常的使用场景下,比如摊贩,收银,出纳,财务……这些应该算是强计算需求的场景,会选择哪一款呢?所以适应需求的工具就是好工具。

目前看 Trae Solo 用来做简单的脏活累活算是够用了,而且目前还没给我添过乱,而且目前还免费,并且可以使用自定义模型。我能说什么呢,反正我现在打开电脑就把它打开。腰突星人表示能躺在床上用手机操纵电脑实现一些想法已经很满足了。

另外,内个,商量一下,这个……那个……明天就是星期四了,是吧,你懂得

coffee-mini

关于小说这个,我也试过,3m的txt,但是ai总是试图偷懒。它总是写一些脚本,试图用脚本提取,提取结果很多遗漏和错误

这肯定是的,所以得强调,得约束。

另外在某些特定情况下,写脚本是合理的,这里也要区别对待。所以需要监督,及时修正

但运气好的时候他也会一口气搞定。

目前默认的应该是一个复合模型,所以每次任务随机到哪个模型处理并不确定,就会存在效果差异

能分享一下吗?我测试的不行

例如:`本任务目标是人工阅读式分析,不需要代码方案、自动化方案、NLP流程建议。除非我主动要求,否则不要提供脚本或程序思路`

或者设置抽查:`最后随机挑选3条人物关系,回溯说明它们分别来自哪些情节`

我昨天用的提示词:

这个文件夹下有一本电子书。Epub 格式你应该可以解压然后读取内部文件。逐章读取,提取内容中关于地点的描写,着重于地点的名称、特征,大小,地点间的相对关系。将提取到的信息写入一个单独的文档中,每读取一章,便立刻将提取的信息记录入文档,如此循环,直至处理完整部书。最后根据提取到的这些位置信息进行整理,生成用来绘制本书地图的提示词。

但问题在于现在模型随机,我今天尝试用他处理一个 92 页的 PDF 效果就不好,我提示词写的已经很严谨了。虽然这其中有一些其他问题,但是模型肯定比昨天的差了。

所以根本问题还是:想要好的效果得用好的模型

这么宽松也可以吗?很奇怪啊

模型随机确实没办法,所以我最近都切到dsv4 flash了,本地用`Qwopus3.5-9B-v3-GGUF`,trae这个就偶尔嫖一下

免费的,就不抱怨什么了。收费的现在真用不起。就算 DeepSeek 这样算是超低价的用来这么解析小说也实在是太不值得了。

确实,连codex的订阅都在砍额度了

这么长的长文本也ok?感觉Kimi的付费模式越来越尴尬了

是的。

Kimi 的 agent 好像有一定的算力限制,稍微复杂一些的内容交给他做不好。

Trae Solo 比我预期的玩具级别要强多了,确确实实能用来做一些脏活累活的。

是的。

Kimi 的 agent 好像有一定的算力限制,稍微复杂一些的内容交给他做不好。

Trae Solo 比我预期的玩具级别要强多了,确确实实能用来做一些脏活累活的。