AI疯狂进阶——凸优化_ _ 頭條網

本文作者专注于AI进阶算法，正在推出AI疯狂进阶之基础理论进阶篇，如有兴趣可持续关注我。

核心导读：

1.什么是凸优化？

2.如何证明函数是凸函数？

3.神经网络是凸函数吗？

凸优化算法是机器学习里面比较重要的一个概念，理解凸优化需要掌握多个高等数学的概念，本文在讲解过程中逐步解析这些数学概念，深入浅出的解析整个凸优化相关的问题。

1.什么是凸优化？

神经网络通过线性和非线性单元的组合来拟合输入到输出的映射，其中有大量的参数需要求解，这是一个高维数据优化问题。高维数据优化求解是一个比较难的问题，比如说优化函数有多个局部极值，需要把所有局部极值找出来再对比得到全局极值(如下图左图)，这个消耗是非常大的，另外可能还存在鞍点(导数为0的地方不是极值点)问题(如下图右图)。

那么，有什么办法或者在什么样的情况下能简化这个问题容易求解呢？于是就有了凸优化概念。凸优化包括以下部分，下面对其中的概念进行解释下：

（1）凸优化的定义域必须为凸集。凸集的定义如下：

按照上述定义，可以得出：实数空间R是凸集。

（2）凸优化的损失函数/约束函数都必须是凸函数。凸函数的定义为：在函数的定义域内，如果对于任意的x和y,都满足如下条件：

则函数为凸函数，如下图的一元函数就是凸函数。在几何上可以看到，凸函数在任何点的切线都位于函数的下方。

对于一元函数，凸函数的判定规则为其二阶导数大于等于0(如果去掉上面的等号，则函数是严格凸的)，即：

对于多元函数，如果它是凸函数，则其Hessian矩阵为半正定矩阵。如果Hessian矩阵是正定的，则函数是严格凸函数。Hessian矩阵的定义和性质如下：

不论是一元函数的二阶导数，还是多元函数的Hessian矩阵，都是可以来衡量函数的凹凸性质。如果有同学对Hessian矩阵有不理解的地方，可以关注后续进阶系列，会专门讲解Hessian矩阵的应用。

上面讲述凸优化必须包含凸集和凸函数，这也导致凸优化问题有一个重要的特性：所有局部最优解都是全局最优解。这个特性可以保证我们在求解时不会陷入局部最优解，即如果找到了问题的一个局部最优解，则它一定也是全局最优解，这极大的简化了问题的求解，这也回答了上面提到的问题。

2.哪些函数是凸函数？如何证明？

我们在上面讲述了凸优化问题能相对容易的找到全局最优解，那么哪些函数是凸优化函数呢？这里介绍几个，例如线性回归函数，支持向量机，softamx回归等都是凸优化函数。下面以最简单的线性回归函数来证明下为啥是凸函数。

损失函数去掉b的影响，MSE LOSS展开可以简化为：

因此它的Hessian矩阵为：

写成矩阵形式为：

其中X是所有样本的特征向量按照列构成的矩阵。对于任意不为0的向量x，有：

因此Hessian矩阵是半正定矩阵，上面的优化问题是一个不带约束条件的凸优化问题。

3.神经网络是凸函数吗？

先引用大神针对这个问题的回答：

对于单节点感知器的神经网络，其优化问题是凸问题，在上述章节已经简单的证明了部分Loss函数是凸函数了；对于深层神经网络，由于多层线性和非线性单元的复合，大部分神经网络的损失函数变成非凸的。最直接的方法是在其2阶导数上证明其是非正定矩阵，找一些反例即可。因为是非凸的，神经网络损失函数可能存在多个局部最小值，因此，对其的优化是比较困难的，好在实践应用中，通过梯度下降法找到的局部最小值，大部分情况下已经可以满足我们的应用需求，并且有时候为了得到更好的结果，用随机初始化训练多次得到多个局部最小值进行比较得到更优的结果。

4.小结

在实际应用中，很多问题都是非凸的，虽然理论上很残酷，但实际上我们目前的一些优化算法却工作的还是挺好的，这也是神经网络目前如此盛行风靡的一大原因。目前一些理论研究也在持续研究这一块，后续的系列文章中将会持续解析这些成果，如果有兴趣，可以持续关注我。

相關文章:

AI+来了，智能保险还会远吗？

乌镇热议人工智能 借贷宝“互金+AI”模式将发挥规模效应

5G+AI—— 支撑安防产业变革的关键力量

Ai CC 2020 软件安装教程

无美颜不刷脸？AI：放弃挣扎吧，人类

作为市场主流的55英寸电视，“全面屏+AI”配置的好电视有哪些？

百度宣布“2020夏季云智峰会”518举办：AI To B战略打法全新升级

“科天云”想做AI领域的新型集成商 把销售话术封装成 AI 产品

清华大学办 AI：除了洞见，更有沉淀

AI 主播？AI 歧视？AI鲜为人知可怕事件！多的是你不知道的危机！

关于华为 AI 芯片的一切疑问，我们在这里得到了解答

盈链科技：“AI+区块链”助力芜湖裕溪口煤码头智慧化升级

AI+区块链技术是治理“假药、腐败，医保亏空”的良药

Ai CC 2019 软件安装教程

崔启亮：AI 时代的译者技术应用能力研究

衡阳：“AI+医疗”构建未来智慧医疗产业生态圈

吹响号角：世界人工智能创新大赛（AIWIN）携头部企业场景邀战全球 AI 企业

AI+大数据助力国寿联盟2.0全面升级

四大关键助力，AI+IoT重新定义未来的可能性

AI 技术应用愈发成熟，农机领域智能化发展几何？

课程报名丨蚂蚁金服为何押宝 AI「共享智能」

AI 数据分析提供商Stratifyd在全国诚募合作伙伴

我为什么不投“医疗+AI”项目？

AI 最前沿 | 是什么让机器学习易如反掌？听听技术大咖怎么说

《2020科技趋势报告》：AI 和中国，成为未来科技世界关键词

AI | 人工智能如何帮助人类和动物对话？

进博会上 “+AI”的国际范儿

亚马逊增强 AI 全面上市；深圳智能制造中心开工丨AI周报

创业之星｜对话芥菜种科技，AI+教育，让教学变得更智慧

人民日报牵手百度百家号 AI+内容激活传媒生态价值

清华办 AI：除了洞见，更有沉淀

未来已来：AI+大数据布局汽车后市场

X-AI，黑匣子和水晶球，可信的人工智能之路

你相信吗？机器(AI)根本不会替代人类任何工作？

解决教育资源分布不均的"病"，AI+教育是对症的"药"吗？

完成数千万元A2轮融资 工业级无人机独角兽因诺科技如何看“无人机+AI”

Ai CC 2020软件安装教程

大型“种草”现场 TCL以“AI×IoT”赋能全系智能新品

AI、无人机...美国建筑行业疫情防控走向新高度，施工进入常态化

开源深度学习推理引擎Neuropod 统一 AI 框架

AI+大健康， “智慧健康”的正确打开方式？

AI+工业视觉服务商融资千万 为企业省75%检测成本 软件毛利超90%

“5G+AI+类脑超算”创新方案，赋能轨道交通行业信息化发展

全球首个“AI”主播亮相，3.43亿女主播：靠脸吃饭的日子多了……

全脑开发有什么好处？AI“小颖”告诉你！

2019年，AI 人机交互趋势研究

ai 燃起来！ 2020 我们一起拼尽全力 向阳而生

华为Kirin 980处理器将结合7nm工艺+寒武纪 AI

华为云携手盈谷发布联合解决方案，共建“医疗+AI”新生态

李世石宣布退役：无法击败 AI

潜逃压力过大暴瘦40多斤，一涉黑A级通缉犯在河北投案自首

当我们在谈 SaaS 的时候，在谈什么？

合同诈骗的类型有哪些？企业无力偿还借款是否构成合同诈骗罪？

5月西安招聘会时间安排来了！找工作的别错过

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

全球闹「美元荒」带动稳定币需求暴增！以太坊交易量创近两年新高

“帮助当地居民解决用水难题”-今日头条-手机光明网

灌篮高手无水印壁纸，每一张都是回忆

通辽蓝天救援队成功解救辽河公园水上被困群众

5月6日·武汉要闻及抗击肺炎快报

肖副省长等省市领导到孝感市楚澴中学调研九年级复学暨疫情防控常态化工作

相声界的颜值担当张云雷称号大揭秘

美国百年薅羊毛攻略

《全职高手》：一口气刷了10集，对杨洋路转粉了

共同承担责任！Rookie谈BP问题：输了是我们打得太臭

LOL"中韩对抗赛"遭选手反对？Zoom直言不想打，Doinb的回答太真实

李亚鹏携李嫣出席慈善晚会，李嫣手上钻戒抢镜，1个动作获夸赞！

53岁郭富城再度升级当爸，方媛怀二胎，Chant要做姐姐了

那些拼命的演员：王宝强喝了一大桶牛奶，孙俪吃10斤瓜子

贾乃亮用上了“一米阳光”这个词，他依然渴望拥有美丽的爱情！

搞笑GIF开心一刻：我的老家农村，有妹子愿意嫁给我吗？

为什么只有edg赚钱？

程潇身材多好？双腿劈叉才明白，这才是“腿精”

张柏芝承认三胎产子，否认小伙的老爸是孙东海，看来她选择保密

T1战队抢注Faker商标，“囊括多个领域产品，商业潜力媲美乔丹”

云顶之弈“最不平衡的版本”诞生，全员抢一费卡，运气成吃鸡关键

LPL春季赛"6宗最"：Uzi最遗憾，阿水最惊喜，V5最离谱

雷佳音被问：跟佟丽娅拍那么多亲热戏是啥感受？他的回答笑翻众人

JDG成最“惨”冠军战队？拿到LPL冠军人气依旧低迷，TES成赢家！

乌镇热议人工智能借贷宝“互金+AI”模式将发挥规模效应

“科天云”想做AI领域的新型集成商把销售话术封装成 AI 产品

完成数千万元A2轮融资工业级无人机独角兽因诺科技如何看“无人机+AI”

AI+工业视觉服务商融资千万为企业省75%检测成本软件毛利超90%

ai 燃起来！ 2020 我们一起拼尽全力向阳而生

应急科普丨“五一” 期间气温回升谨防森林火灾隐患