完全没想到现在运行本地大模型只需要两行命令[ollama]

Qingwa · 2026 年3 月 2 日 06:48

今天要测试一个AI工具，它可以调用本地模型，并且给了命令。

我一看，就两个…

ollama pull qwen3-vl:8b
ollama serve

这就好了，模型就下载、运行、启动成功了。可以提问了

不光大模型发展快，现在本地模型也很快呀

Niceb · 2026 年3 月 2 日 08:07

啊这，不是现在吧，有可能去年就是这样了。

Qingwa · 2026 年3 月 2 日 08:07

我没用过本地啊，今天第一次上次的时候超级麻烦

Hoothin · 2026 年3 月 2 日 08:19

现在所有h2.appinn的图片全部会自动改成h2cdn.appinn了

Niceb · 2026 年3 月 2 日 08:58

好像还可以通过参数搞成api调用的。类似的工具还挺多的。

我用过ollama，比较出名的还有LM studio 之类的。但是太久了加上最近没有用，我就不太清楚了。

Colin5887 · 2026 年3 月 2 日 10:06

如果是普通人的话，Ollama和LM Studio这俩差不多。另外，LM Studio所提供的模型数量远远超过Ollama……但是如果你只向尝试一些特别著名的模型的话，Ollama大概率也是提供的

不过如果是开发的话，LM Studio提供的功能比Ollama全很多

Aquamarine · 2026 年3 月 2 日 11:41

@Qingwa Ollama部署本地模型确实还是挺方便的，问题在于硬件……

@Niceb @Colin5887 如果想要部署RAG，也就是小团队知识库，模型用Ollama或LM Studio，哪个更合适？

onelasteva · 2026 年3 月 2 日 12:35

现在本地部署的大模型算力还行吗，去年部署的又慢回答也差

Messi · 2026 年3 月 2 日 12:36

lmstudio直接点点点

Colin5887 · 2026 年3 月 2 日 22:10

部署取决于你的RAG系统支持什么API，如果这个没搞清楚，那么，哪个都不合适

而且，你把三个东西混在一起了

所以，我会说，“Ollama模型”或“LM Studio模型”不适合跑RAG……..

tiger · 2026 年3 月 3 日 08:33

这个在去年 Deepseek 开源流行期就很火啦！

xieyilin.main · 2026 年3 月 3 日 08:50

A卡的话估计是用llama.cpp vulkan版好点，lm studio的原理就是llama.cpp vulkan，也是一个指令就行了

Aquamarine · 2026 年3 月 3 日 08:50

感谢提醒。
Ollama或者LM Studio我是用来跑本地模型的，也就是RAG的后端。
暂时RAG用的是AnythingLLM。

deanme · 2026 年3 月 3 日 09:31

不是古早一直都是要用命令行的吗……

jark006 · 2026 年3 月 3 日 11:51

我常用LM Studio，有gui好过ollama这种终端交互，既可本地开放API服务，也能在线下载模型，调节各种模型参数也方便。最重要是底层推理支持vulkan，我是较老的AMD显卡，只能用vulkan加速，而ollama只支持N卡cuda和较新AMD卡rocm加速。

Aquamarine · 2026 年3 月 4 日 12:13

我试了一下LM Studio，确实界面比ollama要好很多，但是它界面没做完善，至少简体中文翻译只做了一半，当然它也说了是Beta。
话说回来，这两个对我来说只是后台承载本地大模型的。我主要还是看它对前端RAG的支撑效果。

Colin5887 · 2026 年3 月 4 日 21:58

你不做开发，这两个对你差别不大

但是如果做开发的话

但是，如果只是为了RAG，所有这些都没区别

dangerace · 2026 年3 月 5 日 01:14

嵌入模型用的什么？

dangerace · 2026 年3 月 5 日 01:15

ollama也有GUI的，虽然比较简陋，但毕竟也是官方出品。

dangerace · 2026 年3 月 5 日 01:26

昨晚刚下载了qwen3.5，在3060显卡上，如果是0.8b，推理速度飞快，瞬间就能完成。当然0.8b参数量太小，智商堪忧，我最高试了试9b（下一个就是27b了，3060跑不动），关掉了推理过程后，响应速度还行。

话题		回复	浏览量
llmfit - 1秒测出：你的电脑能跑哪些 AI 大模型青蛙的应用	3	308	2026 年3 月 9 日
AnythingLLM - 真·一键运行本地 LLM 大语言模型｜全离线操作：与文档聊天、与 AI 聊天青蛙的应用	7	1692	2024 年9 月 20 日
压箱底的 Gen8 能不能拿来跑 AI 助手 OpenClaw？青蛙的分享 gen8	13	618	2026 年2 月 28 日
求推荐同时与多个大模型聊天的Windows客户端（对接API而不是网页）问题求助 windows	29	650	2026 年1 月 27 日
七牛云赠送 1000 万 Token，可使用 DeepSeek、GLM、Minimax、Qwen 等主流模型青蛙的应用	10	394	2026 年2 月 6 日