专利名称:一种模型训练方法、装置、设备、系统及存储介质专利类型:发明专利
发明人:欧阳显斌,周飞虎,魏杰乾申请号:CN201911048084.5申请日:20191030公开号:CN110766090A公开日:20200207
摘要:本申请提供的一种模型训练方法,在该方法中将模型训练阶段先划分成多个连续的训练阶段,在每个训练阶段中既着重于模型网络参数的迭代更新同时又着重于针对特定超参数的优化搜索,如此就能够使得每个训练阶段训练结束后的模型能够具备特定超参数的最优能力,每个训练阶段训练结束后会自动将当前训练阶段训练所得的最优模型作为下一训练阶段的初始模型,采用这种阶层递进地方式进行训练,使得最后一个训练阶段训练所得最优模型就整合了所有特定超参数的最优能力,而且超参数的优化过程是在模型正常训练流程中进行,并不需额外花费过多时间,如此就能够很好地评估训练时间和训练效果,能够在指定时间内训练得到综合性能最优的模型。
申请人:腾讯科技(深圳)有限公司
地址:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层
国籍:CN
代理机构:深圳市深佳知识产权代理事务所(普通合伙)
代理人:王兆林
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容