GPT-4o mini 发布：OpenAI 最便宜的小型模型，比 GPT-3.5 便宜，比 GPT-4 优秀

Qingwa · 2024 年7 月 19 日 04:03

原始链接在： GPT-4o mini 发布：OpenAI 最便宜的小型模型，比 GPT-3.5 便宜，比 GPT-4 优秀 - 小众软件

OpenAI 昨天发布了最新的「最具成本效益的小型型号」GPT-4o mini，它在 MMLU 上得分 82%，目前优于 GPT-4，比 GPT-3.5 Turbo 便宜 60% 以上。@Appinn

以上两组数据来自 OpenAI 昨天的博客文章《GPT-4o mini: advancing cost-efficient intelligence》。

性能

其他一些数据还有：

GPT-4o mini 在 MMLU 上得分 82%，目前优于 GPT-4
比 GPT-3.5 Turbo 便宜 60% 以上
在 API 中支持文本和视觉（接受文本或图像输入并输出文本）
128K 上下文，最多16K输出
与 GPT-4o 共享改进标记器，处理非英语文本更经济
截至 2023 年 10 月的知识

未来还将支持文本、图像、视频和音频输入和输出。

API 价格

开发者为每 100 万个输入代币支付 15 美分，为每 100 万个输出代币支付 60 美分（大约相当于一本标准书的 2500 页）。

喜闻乐见的对比环境

GPT-4o mini 在文本智能和多模态推理方面的学术基准上超越了 GPT-3.5 Turbo 和其他小型模型，并支持与 GPT-4o 相同范围的语言。它还在函数调用方面表现出强大的性能，使开发人员能够构建获取数据或与外部系统执行操作的应用程序，并且与 GPT-3.5 Turbo 相比，提高了长上下文性能。

推理任务：

GPT-4o mini 在涉及文本和视觉的推理任务上优于其他小型模型，在文本智能和推理基准 MMLU 上得分为 82.0%，而 Gemini Flash 为 77.9%，Claude Haiku 为 73.8%。

数学和编码能力：

GPT-4o mini 在数学推理和编码任务方面表现出色，优于市场上以前的小型模型。在 MGSM 上，测量数学推理，GPT-4o mini 得分为 87.0%，而 Gemini Flash 为 75.5%，Claude Haiku 为 71.7%。

GPT-4o mini 在衡量编码性能的 HumanEval 上得分为 87.2%，而 Gemini Flash 的得分为 71.5%，Claude Haiku 的得分为 75.9%。

多模态推理：

GPT-4o mini 在多模态推理评估 MMMU 上也表现出强劲的性能，得分为 59.4%，而 Gemini Flash 为 56.1%，Claude Haiku 为 50.2%。

目前已可以使用

目前已经可以在 API 中使用 gpt-4o-mini 模型名称， GPT-4o mini 比 GPT-3.5 Turbo 更便宜、功能更强大。

原文：https://www.appinn.com/gpt-4o-mini/

Aquamarine · 2024 年7 月 19 日 04:41

付款问题还没解决，请青蛙给个方案

Qingwa · 2024 年7 月 19 日 04:42

这…要不拉个群？

bugeshan · 2024 年7 月 19 日 04:42

蹲一个小众 TG 群

Aquamarine · 2024 年7 月 19 日 04:44

可以啊，或者旧车新开也行

Qingwa · 2024 年7 月 19 日 04:45

Qingwa · 2024 年7 月 19 日 04:45

skystar · 2024 年7 月 22 日 08:40

我现在都不用官方原版了，用了转接API，不过目前几家API供应商还没支持这个mini

yizhouuu · 2024 年7 月 27 日 06:28

最近才发现出了这个新模型，便宜了好多，我用的第三方转发 API 的价格已经快赶上 deepseek 的价格了，输入价格基本持平，就输出价格还是有两倍以上的差距，这下国内模型的价格优势都快没了

最近 deepseek 也出了 Function Calling, JSON output 这些功能，消费者用起来越来越舒服了想想才一两年前，用 GPT 还是个很奢侈的事情，大模型也远没有现在这么智能

skystar · 2024 年7 月 27 日 12:03

价格确实很香

话题		回复	浏览量
OpenAI 发布新旗舰模型 GPT-4o，实时处理音频、视觉和文本青蛙的应用	22	1425	2024 年5 月 22 日
OpenAI 发布新版 GPT-4、GPT-3.5，部分降价 25%，以及支持长达 20 页上下文的 GPT-3.5-16K ，旧版本今年 9 月份将被弃用青蛙的应用	0	988	2023 年6 月 14 日
GPT-4 面向所有 OpenAI API 付费用户开放使用青蛙的应用	10	1516	2023 年7 月 7 日
最强开源模型 DeepSeek V4 发布，1M上下文，运行成本大降青蛙的应用	7	190	2026 年4 月 24 日
深夜 API 调用成本直降75%，DeepSeek 官方开放平台恢复充值，并推出波谷优惠价格青蛙的应用	10	714	2025 年3 月 4 日