美国东北大学联合MIT发表最新论文,提出一种名为Reflexion的方法,可以让GPT-4学会自我反思,并给出改进策略,使其性能直接提升30%。该论文已经在预印平台arxiv上发表。这个方法不仅适用于GPT-4,也适用于其他大型语言模型。反思过程分为评估、自我反省、修正三个步骤,一种二元奖励机制实现反思。此举被网友看作是AI进化超过人类适应能力的标志。
美国东北大学联合MIT发表最新论文,提出一种名为Reflexion的方法,可以让GPT-4学会自我反思,并给出改进策略,使其性能直接提升30%。该论文已经在预印平台arxiv上发表。这个方法不仅适用于GPT-4,也适用于其他大型语言模型。反思过程分为评估、自我反省、修正三个步骤,一种二元奖励机制实现反思。此举被网友看作是AI进化超过人类适应能力的标志。
暂无评论