国家天元数学中部中心学术报告 | 刘勇 副教授 (中国人民大学)

发布时间: 2024-05-06 09:52

报告题目:In-context Learning 隐式更新机理研究

报告时间:2024-05-09  14:30-15:30

报 告 人:刘勇 副教授 (中国人民大学

报告地点:武汉大学数学院二楼报告厅

Abstract预训练大语言模型表现出惊人的上下文学习能力(In-context Learning,ICL)。给定少数几个示例,模型在没有参数更新的情况下实现在新任务上表现出极好的学习性能,然而关于ICL的内在学习机理仍不清楚。将ICL的推理过程解释为一种对比学习模式下的隐式梯度更新过程,从对比学习的视角给出了ICL一种全新解释。此外,从对比学习的角度提出了几种改进原有ICL方法的思路。