Google 发布了「他们规模最大、能力最强的 AI 模型」 Gemini

Qingwa · 2023 年12 月 7 日 07:02

Gemini 是 Google 今天发布的一个多模态的 AI 模型，它能够归纳并流畅地理解、操作处理包括文本、代码、音频、图像和视频在内的信息。另外，Gemini 的最小版本。Nano 可以直接部署在手机上。@Appinn

先不要去研究它是怎么实现的，也不需要去搞清楚如何训练的，看了下面这段视频之后，我有一种预感，著名电影《钢铁侠》里的贾维斯，真的可以在没多久后的未来，进入千家万户。

先来看视频吧：

视频来自 @宝玉

我不知道该怎么样描述这样一个我们正在经历的时代，从 ChatGPT 出现到现在，也才过了仅仅 1 年的时间。我们与机器的交流已经可以流畅到如此地步了么？这台机器，可能还掌握了人类有史以来的全部知识。

目前的英文版 Bard 已经可以使用 Gemini Pro 了，而未来几个月 Gemini Nano 就将直接内置在手机（Pixel 8 Pro）中，就有一种未来已经来到的感觉。最强的 Gemini Ultra 将在明年部署到 Bard 中。

在向公众推出之前，我们对 Gemini Pro 进行了多项行业标准基准测试。在八项基准测试中的六项中，Gemini Pro 的表现优于 GPT-3.5，包括在 MMLU（大规模多任务语言理解）（衡量大型 AI 模型的主要领先标准之一）和 GSM8K（衡量小学数学推理）方面。

Gemini 也在官网放出了和 GPT-4 的性能对比，从数据上对比，Gemini 要比 GPT-4 厉害。这可能会让2024年更有趣，比如 OpenAI 是不是真的要推出 GPT-5。

不知道在2025年，AI 能否拥有属于自己的记忆，会不会产生情感？我不知道，魔幻的世界已经不再魔幻了。

参考链接：

skystar · 2023 年12 月 8 日 01:25

现在聪明了很多，但依旧是一个自媒体编辑器，瞎编大胡话，下面还给你个按钮，点一下，谷歌搜索会审查结果，为什么不一开始就让bard自己审查一下自己说的话

Evelynall · 2023 年12 月 11 日 07:25

小小的翻了一波车了，视频是剪辑的，既不是实时输出也不是视频识别，依旧是单张图片上传->加提示词->输出结果。性能对比用的是GPT4 四月的数据，并且额外增加了自己的评分标准才赢的。不过未来可期，期待真·贾维斯出现的那一天

biubiu · 2023 年12 月 12 日 03:49

gemini是否就是deepmind搞的？也就是之前做alpha go的那家？

Qingwa · 2023 年12 月 12 日 03:51

是啊，就是他们

话题		回复	浏览量
Gemini Pro 多语言版已上线 Bard，支持中文（简体/繁体）青蛙的应用	4	802	2024 年2 月 28 日
Chatgpt怎么变成傻瓜了闲聊灌水	3	262	2025 年12 月 8 日
隆重推荐Google AI Studio，免费不限量的最强对话式AI 讨论分享 google , ai , llm	64	3893	2025 年11 月 18 日
我把这张图交给了 ChatGPT、元宝、豆包、Kimi、千问和 Gemini，结果有点...震惊。青蛙的分享	19	1405	2026 年1 月 3 日
GPT-5 说它不再奉承、过度讨好用户，并且减少了不必要的表情符号讨论分享	10	763	2025 年11 月 9 日