Google 发布了「他们规模最大、能力最强的 AI 模型」 Gemini

原始链接在: Google 发布了「他们规模最大、能力最强的 AI 模型」 Gemini - 小众软件

Gemini 是 Google 今天发布的一个多模态的 AI 模型,它能够归纳并流畅地理解、操作处理包括文本、代码、音频、图像和视频在内的信息。另外,Gemini 的最小版本。Nano 可以直接部署在手机上。@Appinn


先不要去研究它是怎么实现的,也不需要去搞清楚如何训练的,看了下面这段视频之后,我有一种预感,著名电影《钢铁侠》里的贾维斯,真的可以在没多久后的未来,进入千家万户。

先来看视频吧:

视频来自 @宝玉

我不知道该怎么样描述这样一个我们正在经历的时代,从 ChatGPT 出现到现在,也才过了仅仅 1 年的时间。我们与机器的交流已经可以流畅到如此地步了么?这台机器,可能还掌握了人类有史以来的全部知识。

目前的英文版 Bard 已经可以使用 Gemini Pro 了,而未来几个月 Gemini Nano 就将直接内置在手机(Pixel 8 Pro)中,就有一种未来已经来到的感觉。最强的 Gemini Ultra 将在明年部署到 Bard 中。

在向公众推出之前,我们对 Gemini Pro 进行了多项行业标准基准测试。在八项基准测试中的六项中,Gemini Pro 的表现优于 GPT-3.5,包括在 MMLU(大规模多任务语言理解)(衡量大型 AI 模型的主要领先标准之一)和 GSM8K(衡量小学数学推理)方面。

Gemini 也在官网放出了和 GPT-4 的性能对比,从数据上对比,Gemini 要比 GPT-4 厉害。这可能会让2024年更有趣,比如 OpenAI 是不是真的要推出 GPT-5。

不知道在2025年,AI 能否拥有属于自己的记忆,会不会产生情感?我不知道,魔幻的世界已经不再魔幻了。

参考链接:

2 个赞

现在聪明了很多,但依旧是一个自媒体编辑器,瞎编大胡话,下面还给你个按钮,点一下,谷歌搜索会审查结果,为什么不一开始就让bard自己审查一下自己说的话

小小的翻了一波车了,视频是剪辑的,既不是实时输出也不是视频识别,依旧是单张图片上传->加提示词->输出结果。性能对比用的是GPT4 四月的数据,并且额外增加了自己的评分标准才赢的。不过未来可期,期待真·贾维斯出现的那一天 :grinning:

gemini是否就是deepmind搞的?也就是之前做alpha go的那家?

是啊,就是他们