iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用

原始链接在: iPhone、安卓现在就能跑 Gemma 4 了:Google 开源 AI Edge Gallery 应用 - 小众软件

现在,通过 Google 的开源应用 Google AI Edge Gallery,已经可以直接在 iPhone 和安卓手机上运行 Gemma 4 E2B、E4B 两个模型了,不消耗任何 Token,能离线使用。
而且不只是对话,还支持图片、语音,甚至加入了 Skills。

不用等啦,现在就能用。

Google AI Edge Gallery

Google 开源了 AI Edge Gallery,并且发布了 iOS 与 Android 版本:

目前支持直接下载这几个模型:

  • Gemma-4-E2B-it(2.54GB)
  • Gemma-4-E4B-it(3.61GB)

直接下载

Google 推荐使用 E2B,可以更流畅一些。

当然了,运行大模型会让手机卡顿,青小蛙也是运行了一会,换回 E2B 了。

这款开源应用更多的还是用来展示 Gemma 4 能力。

另外 AI Edge Gallery 里还带了两个极限小模型:

  • Tiny Garden(270MB)
  • Mobile Actions(270MB)

Tiny Garden 是经过微调的模型,可为语音控制的互动游戏提供支持。

Mobile Actions:它能翻译用户输入(如 “创建午餐日历事件”、”打开手电筒”)转化为触发 Android 操作系统工具的函数调用。


原文:https://www.appinn.com/google-ai-edge-gallery/

2 个赞

太离谱了:astonished_face:

还行,触发NPU/GPU加速时,不会卡。

然后比我电脑跑得快……就比较离谱

你电脑不可能吧,2B 啊

E4B在电脑上跑得挺舒服的。显存占用不到4G。而且就这个参数规模的模型来说,感觉性能已经超过某些老的参数规模十几二十倍的模型了。性价比特别高。

不是都出来一年了么?

LiteRT-LM确实可以,llama的E2B的Q4模型都得4.4GB,LiteRT-LM得E4B模型都不到4GB

AI Edge Gallery 安卓版,需要谷歌框架,仅有microG下无法运行 :face_with_bags_under_eyes:

Gemma 4 E2B 还有没有什么支持音频的离线客户端程序?(Window或者安卓都行)

完全有可能,电脑端可能用的是vulkan之类的gpgpu。

但它的releases里面有对应的高通芯片,比如我用的8elite和更新的8elite gen5都在里边。qnn npu的效率可能要高多了

搞错了,gemma4还没有专门的npu模型,目前还是泡跑在GPU上面的