GPT-4是OpenAI开发的一个大规模多模态模型,可以接受图像和文本输入并产生文本输出。尽管在某些场景中不如人类,但在各种专业和学术基准上表现出人类水平的表现,包括以大约前10%的分数通过模拟律师考试。GPT-4是一个基于Transformermodel的模型,经过预训练,可以预测文档中的下一个令牌。培训后的调整过程提高了真实性和对期望行为的遵守程度。这个项目的一个核心组成部分是开发基础设施和优化方法,这些方法在广泛的规模范围内表现得可预测。这使我们能够预测GPT-4的预期性能,并在最后一次跑步中进行测试,以增加我们训练的信心。尽管GPT-4有其功能,但它与早期的GPT模型有类似的局限性,包括不完全可靠、具有有限的上下文窗口,并且不学习。使用GPT-4的输出时应小心,尤其是在可靠性很重要的情况下。GPT-4的能力和局限性带来了重大和新颖的安全挑战,鉴于潜在的社会影响,我们相信仔细研究这些挑战是一个重要的研究领域。