分享好友 最新资讯首页 最新资讯分类 切换频道
获全球顶会NeurIPS、COLT双认可 百度研究院优质论文解读AI技术趋势
2024-11-07 21:37

近日,NeurIPS 2020(Neural Information Processing Systems Annual Meeting,神经信息处理系统年会)落下帷幕,作为人工智能和机器学习领域的国际顶级会议,NeurIPS旨在促进有关神经信息处理系统的研究交流,在同行会议上介绍和讨论新颖的研究。此次大会中,百度研究院参会并发表了多篇高质量论文,论文聚焦大规模稀疏学习的加速求解、新发现物种数量预测、随机非凸优化、高维数据判别分析等问题,分别提出了创新算法及理论,突破原有算法在实际应用中泛化效果差、优化效率低等限制,有效提升AI技术在自然生态学、统计学习理论等领域中的应用价值,同时也彰显出百度在人工智能与机器学习领域的持续技术创新力。

获全球顶会NeurIPS、COLT双认可 百度研究院优质论文解读AI技术趋势

(百度研究院多篇论文入选NeurIPS 2020)

首先,论文《Thunder: a Fast Coordinate Selection Solver for Sparse Learning》就大规模稀疏学习提出新方法。大规模稀疏学习是机器学习中的重要方法之一,但大规模稀疏学习的高效训练却是极具挑战性的问题。虽然人们借助凸目标函数和模型的稀疏性,已经提出很多优化方法来加速求解大规模稀疏学习问题,但当模型的稀疏度比较低或求解精度需求很高时,大多数优化提速方法便会失效,对此,本文提出了一种新颖的方法(Thunder)。

该方法尽可能地避免了在冗余特征上的计算,并可以保证算法选取特征的安全性。目前,已在一系列大数据集上的实验结果证明了方法的有效性。如下图所示,在Finance数据集上,百度提出的新方法比现有最佳方法在效率优化上有巨大的提升。

其次,论文《Optimal Prediction of the Number of Unseen Species with Multiplicity》对自然生态学中新发现物种数量预测做出梳理。论文首先提出了更一般化的版本,即对新样本中出现的未知元素依据数量划分,从而实现更精确细致的稳定预测。再通过信息论下界的构造,证明所提出的算法同时实现了最优时间和样本复杂度。这一新的理论完整复现了此前七十年间的诸多研究成果,并在未知参数领域实现了非平凡的拓展,对自然生态学领域具有重要的现实意义。该工作已被机器学习旗舰会议NeurIPS 2020所接受并遴选为Spotlight报告文章。

论文《Towards Better Generalization of Adaptive Gradient Methods》则对统计学习理论中的重要问题“随机非凸优化”给出新方案。为优化当前流行的动态梯度下降算法的泛化效果,百度提出稳定动态梯度下降算法,将差分隐私与梯度下降相结合,并巧妙利用差分隐私防止过拟合的这个优势来提高算法的泛化性能。该算法已被证明可以减小泛化误差,且具备一定优越性,为随机非凸化问题带去创新性解决方案。

最后,《Ratio Trace Formulation of Wasserstein Discriminant Analysis》一文,则针对高维数据的判别分析给出新算法。百度研究了维数约简(DR)技术Wasserstein判别分析,提出用较少计算成本获得可比或更好的结果的公式。同时从电子结构计算角度分析,将该判别分析技术转化为一个比值迹问题,提出基于特征解算器的判别分析技术判别子空间计算算法,依托于比值迹公式封闭形式的解,一旦正则化的最优输运问题得到解决,就可以通过广义特征值分解得到。百度这一算法平均收敛时间更短,对初始化合参数的敏感性也更低。通过在实际数据集上的数值实验表明,该算法在分类和聚类任务中都有很好的应用前景。

据悉,此次入选NeurIPS 2020的多篇优质论文来自百度研究院西雅图研究院和百度认知计算实验室,上述实验室研究员一直是NIPS/NeurIPS会议的常客,2019年共有6篇论文入选NeurIPS,也曾经获得过NIPS 2014的最佳论文奖;2020年,其在更具难度与深度的顶级机器学习算法和理论会议COLT(Conference on Learning Theory)中发表两篇百度统一单位的论文,论文针对求解稀疏约束优化问题,提出了可以显著降低计算复杂度的算法,为高维数据稀疏学习带来算法与理论的新突破,这也是中国互联网公司罕见的一次在COLT发表论文;另外,值得一提的是在2019年深度学习顶会ICLR上,实验室研究员的理论论文解决了深度神经网络的一个基础问题,也是那年ICLR 2019的最高评分论文之一。

上述研究成果与百度研究院的发展布局紧密相连。今年八月,百度研究院宣布架构新升级,新增生物计算实验室和安全实验室。至此,百度研究院已囊括了从底层基础技术到感知、认知技术的 AI 全领域研究,汇聚数十位 AI 领域的世界级专家,共同推动百度研究院的 AI 基础性研究和前瞻性洞察,助力 AI 技术加速落地。

如今,百度研究院结合自身AI优势,升级新架构,深入展开跨领域合作,取得的基础性研究创新有目共睹;未来,百度研究院还将不断推动百度AI技术的创新发展,夯实其在国际人工智能领域的影响力,促使AI深入行业落地应用,为全球科技发展出一份力。

最新文章
删了微信好友怎么加回来
在使用微信的过程中,我们可能会因为各种原因不小心删除了某些好友。当意识到这一操作时,很多人会感到懊恼,尤其是对于那些重要
50个小学生百科知识来挑战快问快答!__2
网上科普有关“50个小学生百科知识来挑战快问快答!_”话题很是火热,小编也是针对50个小学生百科知识来挑战快问快答!_寻找了一
中国十大镜片品牌排行榜,mikibobo镜片属于什么档次,极致性价比
选一个好镜片,就像选一个好手机,不但用着好,而且是身份地位的象征。市场有不同规格和价位段的产品。有进口的高端的镜片,有国
五河网站排名优化费用是如何计算的?
五河SEO网站优化提升自然流量的方式有哪些?五河优化长尾关键词,虽然这些关键词无法在短期内给网站带来更多流量,但对网站的长
外贸网站全球推广与SEO国际化策略指南
外贸网站国际化推广与SEO优化全攻略,涵盖多语言、文化适应性、关键词研究、本地化内容策略、链接建设、移动优化等关键步骤。通
seo 关键词排名报价方案分析:费用与网站项目维度规模等有关
SEO关键词排名报价可谓五花八门,很多SEO外包公司都喜欢提供,这也导致了很多甲方客户对SEO行业的普遍印象偏低,那么SEO外包的报
【A3360快速问医生下载】HTC A3360快速问医生12.3.0免费下载
身体不舒服?找快速问医生,随时随地免费问医生~~网上问诊,首选快速问医生APP,累计已服务数千万患者。在线医务工作者实名认证
360网站收录有什么用 360网站收录:提升曝光,助力SEO优化
在当今这个信息爆炸的时代,互联网已成为企业展示自身形象、推广产品与服务、吸引潜在客户的关键舞台而在这一浩瀚的网络海洋中,
小米新专利聚焦数据推荐技术,提升检索模型预测能力
2024年12月12日,金融界报道,北京小米移动软件有限公司申请了一项名为“数据推荐方法、装置、电子设备及存储介质”的专利,公开
2025年度食堂食材【非八大类食材(蔬菜、水产、干货类)】配送服务项目中标结果公示
序号投标供应商名称资格响应文件1深圳市新源农产品供应链有限公司按要求提供《投标人基本情况表》;按要求提供营业执照;按要求