国家天元数学中部中心学术报告 | 许志钦 副教授 (上海交通大学)

发布时间: 2024-05-10 09:10

报告题目:现象驱动的科学研究推动深度学习发展

报告时间:2024-05-21  10:30-11:30

报 告 人:许志钦 副教授 (上海交通大学)

报告地点:理学院东北楼二楼报告厅(209)

报告摘要本报告关注现象驱动的深度学习的基础研究,将汇报频率原则、凝聚现象等常见现象,理解为什么神经网络会在过参数化下呈现好的泛化能力。进一步,在凝聚现象的基础上,我们讨论模型初始化对Transformer 网络的推理能力的影响。