微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
报告题目:现象驱动的科学研究推动深度学习发展
报告时间:2024-05-21 10:30-11:30
报 告 人:许志钦 副教授 (上海交通大学)
报告地点:理学院东北楼二楼报告厅(209)
报告摘要:本报告关注现象驱动的深度学习的基础研究,将汇报频率原则、凝聚现象等常见现象,理解为什么神经网络会在过参数化下呈现好的泛化能力。进一步,在凝聚现象的基础上,我们讨论模型初始化对Transformer 网络的推理能力的影响。