比较
和
概览
GPT-4 | GPT-3.5 Turbo | |
---|---|---|
提供者 提供此模型的实体。 | OpenAI | OpenAI |
输入上下文窗口 输入上下文窗口支持的标记数量。 | 8192 标记 | 4096 标记 |
最大输出标记数 模型在单个请求中可以生成的标记数。 | 8192 标记 | 4096 标记 |
发布日期 模型首次发布的日期。 | 三月 第 11, 2023 大約 2 年前 | 十一月 第 48, 2022 超過 2 年前 |
知识截止日期 此表中信息可能不准确或过时的日期。 | 九月 2021 | 九月 2021 |
定价
GPT-4 | GPT-3.5 Turbo | |
---|---|---|
输入 提供给模型的输入数据的成本。 | US$0.03 每百万个标记 | US$0.00 每百万个标记 |
输出 模型生成的输出标记的成本。 | US$0.06 每百万个标记 | US$0.00 每百万个标记 |
基准测试
GPT-4 | GPT-3.5 Turbo | |
---|---|---|
MMLU 在零弹和少弹设置下评估LLM知识获取。 | 86.4 | 70 |
MMMU 广泛的多学科和多模式基准测试。 | 34.9 | 未指定。 |
HellaSwag 具有挑战性的句子完成基准测试。 | 95.3 | 85.5 |
竞技场Elo LMSYS聊天机器人竞技场排行榜Elo。 | 未指定。 | 未指定。 |
构建 AI 聊天机器人?
开源 GenAI 监控、提示管理和魔法。
Open Source
Self Hostable
1-line Integration
Prompt Templates
Chat Replays
Analytics
Topic Classification
Agent Tracing
Custom Dashboards
Score LLM responses
PII Masking
Feedback Tracking
Open Source
Self Hostable
1-line Integration
Prompt Templates
Chat Replays
Analytics
Topic Classification
Agent Tracing
Custom Dashboards
Score LLM responses
PII Masking
Feedback Tracking