追踪github star来源的一次经历

前几天忽然发现有个github的仓库暴涨了星星——其实也就涨了不到100,但是相对之前几年也就几十个而言,确实是在暴涨了。

预设就很好奇为什么暴涨——最后确实也知道原因了,所以现在聊一聊如何追踪star来源。

搜索

最简单的办法就是在搜索引擎各个熟知的平台上自搜。
但是结果并没有找到相关内容

AI

也有两个小的方向:

  1. 豆包直接问。虽说AI经常一本正经的骗人,但是豆包的信息来源颇有玄学,有时候确实是能给到正常不好搜的信息的。然而这次确实是每一条真的。

  2. 使用自行规划并调用工具完成复杂任务的Agent。这次使用了trae solo, 确实是有理有据,但是我不认为这种规模的小玩意真的能上trending

调查

显然直接和加star的人直接问,通过大调查来获得信息。于是打开加star的人的主页,找到邮箱发送邮件。
非常幸运的是第一份邮件发送不到一小时就收到了回复,对方说是自己关注的大佬加了star,他看了有意思所以也star了。
但是从时间线来看,他关注的大佬点star已经是后边一点时间加star了,那前边又是什么原因呢?也是这样的原因嘛?我需要实质性的证据。

验证

我再次使用AI,vibe了一个工具的方式来获取对仓库加star的每个用户的star时间、关注列表。
直接确认这个用户star之前,是否有关注列表中的其他用户加star。
从图像看,关注了关注的人所关注的项目的因素确实是存在的,但是并不是主要因素。

这个工具也有一些其他的功能,我在线部署了一个实例,感兴趣可以玩玩 https://github-star-way.vercel.app/

这里的token是github的授权,可以做在这里生成 https://github.com/settings/tokens/new

代码在这里: v5.0/star-way · Cloud Native Build

真相

实际上在github页面上有一个traffic信息,可以根据访客浏览器的信息判断用户是从哪跳转到这个网页的。
实际案例中排第1是t.co, 直接访问发现原来是x,在x上搜索发现了一个互动量非常大的帖子提供了这个仓库的链接,真相大白。

4 个赞

我本来看到开头就想说了,结果最后提到了

trafic这玩意也不太灵的,只能追踪到浏览器的跳转信息,如果程序没有提供这信息就没有了。
如果trafic主要来自Google这种搜索引擎其实也就没法下结论了

我经常看 Traffic,我发现小众的 长尾效应 长得可怕, 3 年前在小众宣传,现在还有人访问。

@qingwa 点赞 :+1:

1 个赞

现在这个traffic已经改版之后的了,上个版本能显示的访问来源很细的。现在大部分只显示一个主域名

感谢分享。
我说有个项目最近怎么突然冒出来一些star,原来是吾爱那边有人发了推广帖子。
关键是有用户反馈,但我之前一直不知道,就挺难崩的。

这个项目我在抖音刷到过,记得是能用拼音输入日语汉字,而且还是中日混输,当时就感觉惊为天人。

所以豆包的联网数据来源有一个渠道应该是抖音内部洗过一遍的数据。

猜测应该是:视频在抖音上达到一定量级的话就会被归纳总结入库作为数据源。