本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。
深度神经网络往往存在过拟合的问题,需要Dropout、权重衰减这样的正则化方法的加持。
而最近的研究表明,如果对Dropout“剪掉”的神经元的结构进行利用,就能实现比随机替换更好的效果。
问题是,实际应用中,针对不同的问题,利用结构的方法需要人工设计,对Dropout的模式进行调整,泛化能力不足。
那么,是否能设计一种针对CNN、Transformer这样的深度神经网络,自动学习Dropout模式的方法?
现在,谷歌大神Quoc V. Le的团队,就提出了一种名为AutoDropout的方法。
https://arxiv.org/abs/2101.01761