我把苍井空的照片放进人工智能里算了算

我的一位盆友，在一家著名的新闻网站负责法务。

最近他这个法务比 CEO 还忙，因为网站每天都被人告。

原因很简单：新闻里用的图片侵权了。尤其是多年以前的旧新闻成了“重灾区”，那时候编辑的版权意识还不强，使用了很多某图库的插图。于是，这位法务重拳出击迎战版权方！

。。。

然后他败了，公司已经陆续赔出去好几百万。

图片侵权案件自古有之，当年林志颖就因为P了一张图，被摄影家索赔110万。

“这种铁证如山的侵权官司如果能逆转，简直是对共和国法律的践踏嘛！”受尽老板折磨的他怒吼。

不过，作为技术流的中哥，我却没和他在一个频道，当即问了他两个问题：

1、侵权的都是四五年前的旧网页，现在都几乎没人看了，那对方是怎么找到这些图片的呢？

2、为什么这么多年都是风平浪静，单单今年你们的侵权行为被暴风骤雨般诉讼呢？

看着他迷茫的小眼神，我甩给他一个最近刚刚看到的网页：

你看，现在反盗版的斗士已经鸟枪换炮，靠人工智能自动寻找侵权图片了。它的效率可不是人能比的，有诗赞曰：

从来不吃饭，

只需几度电。

价格很低廉，

还不知疲倦。

有人工智能帮忙，找盗版图片肯定小菜一碟，难怪千年坟图都能给你挖出来。

送走这位纠结的朋友，我却陷入思考。

过去说到 AI，大家都觉得这是科学家的事情。

但是现在，一家图片社都可以娴熟地驾驭 AI。

“AI 反盗版”这个案例背后，可能藏着一个技术大脑洞。

一、“扫码借智商”

我注意到一个细节：

在“反盗版”这件事情里，图片社使用的人工智能，不是他们自己开发的，而是使用了华为云的“深度学习服务平台”训练出来的。

之前我对阿里云、腾讯云和百度云比较熟悉，唯独对华为云有些陌生。于是我千方百计找到华为云一位神秘的老司机（这位技术大牛很低调，所以要隐去姓名），跟他请教了一下这“深度学习平台”背后的脑洞。

先来科普一下，深度学习是目前人工智能的一个重要分支技术，它的原理不难解释：

让机器“看”大量的数据，它就会自动学会一种技能。

你日常体验到的人脸识别、语音识别，大多是深度学习的产物。

“深度学习服务平台”，简单来说就是人工智能界的“共享单车”。哪家公司自己的“智商”不够用，需要让人工智能帮忙完成任务，就可以从平台“扫码借智商”。

扫码借智商，我P的。

共享单车用起来很简单，嘀一下刷开就可以骑，咔一下关锁就可以走。老司机告诉我，华为这个“深度学习平台”也很简单：哪怕你是个不懂代码的小白，也可以通过输入一些样本，拉拽一些参数，瞬间定制出一个“大脑”。

依靠这样的共享平台，有人玩出了不少“骚操作”：

1）布料达人

在绍兴的柯桥，有一票服装行业的工厂，它们是中国服装业的半壁江山。很多大商人每天的工作，就是从千万种布料里面选出自己想要的那种，然后采购回去做成服装。

然而，虽然这些服装商都是身经百战，但面对千万种花纹、颜色、走线极其类似的布料，也像看到王珞丹和白百何一样，两眼发蓝懵的一比。

但时间可不等人，在服装行业，有时候流行趋势是变化得很快的，这个布料你几分钟之内不拿，可能就被别人抢走了。所以这些老板们迫切需要一种人工智能技术，只需要它做一件事：认识布料。

果然，他们就把市场上成千上万的布料照片，一股脑输入深度学习平台，很快就训练出一个能认识各种布料的“人工智能专家”。后来业务员只需要给布料拍张照片，就能自动比对，告诉你这是不是你要的那一款。这种骚操作，省下了大量人工走访判断的时间，下订单特别快，他好我也好。据说现在各个服装厂都在用。

这是一张示意图，你感受一下

2）脸盲福音

深圳是个比脚大的城市，2100万人，只有2万个警察叔叔。

1996平方公里的辖区，警察叔叔靠双腿可溜达不过来。大多数情况，他们都会通过监控探头来发现违法的坏人。而让他们吐槽无力的是，很多摄像头的清晰度都不高。

经常发生这种情况：摄像头拍到了一个嫌疑人，一群警察叔叔围在屏幕前犯了脸盲症，很难把这个人和公安数据库里的人脸对应上。

所以，警察叔叔就用深度学习平台，搞出了一套“模糊图像匹配系统”。这样，即使视频里的人像模糊到怀疑人生，人工智能还是能告诉你，Ta 和数据库里的谁最匹配。

果然，这个系统效果炸裂。

就在2018年春节的时候，深圳龙岗区有一个3岁的孩子被人贩子拐走了。警察叔叔接到报案，马上在监控里找到一个片段：一个中年妇女把孩子领走了。但是这个妇女的脸非常模糊。于是警察叔叔马上想到了自己的“脸盲福音系统”。一下子就把她和身份证库里面的人对应上，拿到了嫌疑人的高清无码大图。从孩子失踪，到警察叔叔狂奔到武汉救回孩子，全程只有不到15个小时。

一般的监控有多模糊，你感受一下。（这是一张示意图，并非事发当时的画面）

3）勤奋的书记员

另外，还有很多企业的销售部门，需要把手动填写的单据转化成 Word 归档，或者对身份证、名片上的名字和数字进行识别。这些枯燥的转录任务，原来是由人来做的，最近都换成人工智能来完成了。

这是用文字识别系统识别的发票内容

此外还有挺多，篇幅有限就不列举了。

有句话叫“简单就是力量”。

最近抖音这么火，主要原因就是它的操作够简单，却能赋予每个人无限的创造力。同理，人工智能平台的操作够简单，各家公司也能在上面创造出五花八门的应用。

这个趋势就是——“AI 平民化”。

二、“H”的另类人工智能史

说了这么多，你可能有一个和我相同问题：提到云计算，我们听说更多的是阿里云、腾讯云，为什么最近华为云会出现在我们的视野？

应该这样说，“对外提供 AI 服务的能力”并不是你想有，想有就能有。至少要具备两方面的条件：

1、强大的 AI 技术——AI 技术能力来自于大量的数据和应用场景锻炼，所以这个公司必须是大公司；

2、强大的硬件基础——AI 服务需要的硬件基础，来自于云计算。所以这个公司需要有云计算业务。

符合这两个条件的选手只有BATJH（百度阿里腾讯京东华为）这类大公司，华为当然也在其中。只不过很多人在日常的新闻里对互联网巨头比较了解，却很少有机会了解华为的过往。

说到这，中哥得先转述一下华为的“人工智能简史”。

1）“世界末日”的决定

2012年（也就是世界末日那一年），华为突然成立了一个神秘的实验室——2012实验室。没错，这个实验室的重要任务之一就是用各种姿势研究人工智能。在那个时候，人工智能还不被大众了解，甚至被妖魔化。然而，当时任正非的态度很明确：“我也担心人工智能对人的价值观产生破坏。但是我们挡不住人类社会前进的步伐。”

“2012实验室”下属的前沿人工智能实验室名字就叫“诺亚方舟”，更昭示了一种“救生艇”的意味。

2）直接“干实事”

那时候，华为的人工智能，主要用于解决自身的实际问题。当时华为业务大面积拓展，人手突然不够用。特别是技术流的“老湿傅”不够用了。于是，AI “临危受命”，被用来解决火烧眉毛的问题。

我给你举几个例子：

环境健康安全：华为的很多业务都需要进工地施工。在施工之前，要有专人检测工人“反光背心身上穿，安全帽儿带规范”。这种本来靠人的检查后来被人工智能给替代掉了。摄像头自动分析你的装束，合格就放行，不合格绝不通融。
供应物流：华为的日常业务，需要运输很多设备到海外。这时候，就有一个世纪难题：集装箱怎么装才能塞进最多的货物？这就像小时候，你从盒子里拿出积木的时候，他们排列整齐，当你放回去的时候，却总是多出来几块，盖不上盖子。在集装箱里，华为就用人工智能排兵布阵，几秒钟就制定货物摆放的最佳方案。
基站规划：华为的王牌业务，是建设通信基站。每个区域的基站建设，都需要一个高级工程师对线路的走位、基站的位置进行科学规划。这是非常考验经验的，一个一年经验的工程师，设计出来的效果可能比五年经验的工程师差很多。眼看老湿傅不够用了，华为就把他们的经验值传给 AI，然后让 AI 辅助年轻的工程师做规划。

一秒告诉你最短路径

2012年，距离后来 AI 围棋大师“阿法狗”出山还有四年时间，华为就已经开始用人工智能低调地解决业务难题了。从时间上看，他们算得上是人工智能界的“老炮儿”了。

3）帮其他小朋友“补课”

小时候，老师都会安排班上学习好的同学帮助别人补习功课。华为比小朋友更自觉，既然自己的人工智能已经相对成熟了，那下一步就是帮助其他企业一起进步了。

你可能了解，华为的行事方式就是：不看准不出手，一旦出手就不松手。2017年，华为终于觉得时机成熟了，于是整合成立云事业部。他们雪藏多年的人工智能技术“存货”通过华为企业智能 EI（Enterprise Intelligence）开始对外服务，

这才有了开头“图片社怒怼盗图君”之类的故事。

三、“吃素”的华为云 & AI 平民化的漫漫长路

随着研究的深入，我越来越想弄明白：华为在“AI 平民化”的过程中，到底想承担什么角色呢？

几大巨头里，华为云应该是最晚对外开放云计算和人工智能的公司（2017年成立“云事业部”）。

，但有两点让它不能被忽视：

1、华为的体量巨大：它的营收等于 BAT 三家的总和；

2、华为的基因特别：同样做云计算和人工智能，但 BAT 是从互联网切入，而华为是从硬件和实体经济切入。在“AI 平民化”的浪潮里，AI 被更多地用于实体经济，所以实际上是 BAT 正在强行并入 H 的优势赛道。

竞争对手的评价，可能最说明问题。前两天我和国内公有云 No.1 的阿里的同学吃饭，私下提到腾讯云，他们谈笑风生；但是提到华为云，他们全都竖起拇指：“华为云是值得尊敬的对手”。

很多人说华为有“狼性”文化。但在我心里，华为其实是“吃素”的。

首先，华为不上市，不觊觎资本加持，更专注于民族技术本身。

其次，华为有著名的三不：不做应用，不碰隐私，不投股权。把自己的边界划得非常明晰。

当你说的“No”越多，你的“Yes”就越有重量。华为用近乎严苛的自我限制，使得各行各业天然相信它能提供稳定高效的产业工具。（这也是过去华为成功的经验之一。）

读懂这些，你就能感觉到：华为想为“AI 平民化”提供一个“稳定、高效、人人都能学会”的工具。

那位华为大牛告诉我，为了让这个“深度学习平台”稳定、高效和易学，技术团队做了很多技术努力：

首先，是软硬件结合的部分（智商）

每个人都会思考，但人和人的智商可是不一样的。

同样，每个人工智能都可以运作，但它们的“智商”也是不同的。

从脑科学来看，人类智商和每个人大脑神经元联动过程的强弱快慢有很大关系。对应到人工智能上，硬件之间的网络通信速率，网络带宽，都是影响它“智商”的重要因素。而“网络通信”这些底层硬件的优化，是华为在运营商时代就开始积累的传统强项。

在底层的硬件空间里，华为争取把技术做得更前卫，这也是他们最能和阿里云腾讯云拉开差异的地方。

（注意，我把这种优化定义为“软硬件结合部分”的优化。这种优化并不涉及“脑细胞”——也就是 GPU 本身——的优化。在计算芯片层面，华为和其他人工智能服务平台并没有区别。）

其次，是纯软件部分（学习技巧）

智商高的人并不一定成为人生赢家。如果把一个聪明的孩子放到山区的学校，一定不如他在北京四中接受顶级系统化教育学得好。这就是学习技巧的作用。

对应到人工智能平台上，同样有很多“技巧”。比如华为云开发了一个叫做“Moxing”的平台（这个平台有两个中文名字：模型、魔性），就添加了很多“特色服务”：

1）把深度学习的模型做成了不同的“套餐”，无论需要什么类型的图像识和语音识别，都可以像在麦当劳买套餐一样，直接拿来就吃。另外还有类似番茄酱、冰水这样的“辅助开发工具”提供，尽量提高人工智能训练的效率。

2）深度学习分为单机模式和分布式模式，以往如果想从单机模式切换到分布式模式，是需要重写代码的。而这对于很多企业来说非常不方便，Moxing 平台为这个事情也专门作了优化，一套代码既能跑单机，也可以跑分布式。这同样可以提升人工智能训练的效率。

类似这样的细节还有挺多，它们都可以提升使用者的感受。不过在我看来，想要真正实现“AI 平民化”这个宏伟的目标，还需要更劲爆的东西。

之前也说到，人工智能平台，从某个角度来说就是“共享经济”。共享经济能够发展的动力之一，就是不断把成本摊低。

而摊低成本有两条路：

1、吸引越来越多的人加入这个共享社群；

2、利用资金和技术进步直接把成本降低。

这两条路径，是鸡生蛋和蛋生鸡的关系。而作为技术流的厂商华为，显然会在第二条路上走得更远。

举个例子：

在大规模深度学习计算的时候，会需要非常多的 GPU 同时工作。而依靠现有的调度能力，在超过10枚GPU同时工作的时候，性能会出现很大程度的损耗（劣化）。简单来说就是，即使1000颗 GPU 同时工作，效果也和10颗 GPU 差不多。

华为云在做的，就是对软件进行改进。让他们引以为傲的一个数据是：在1000个 GPU 同时工作时，性能可以达到它们单独工作时的80%。这个数据，在人工智能界工业界应该算第一梯队。而减少损耗提高效能，就是标准的成本节省。

以至于这位华为的大牛羞涩地说：我们的优势是“性价比”。。。

而能效提高，从另一个方面看就是时间的节省：

使用深度学习平台的用户，目的往往是在平台上试验出一套最好用的模型算法。而这些算法往往不是一次就能成功。就像“苦吟派”诗人那样，吟安一个字，捻断数根须。需要反复调整参数进行试验，才能让识别率到达最优值。

在这个场景里，时间成本非常重要。你想，如果一个企业开发一个识图模型就需要一个月的时间，就差不多等于你扫码共享单车之后，十分钟锁才打开。。。所以，华为云的深度学习平台，拼命做了优化，实现了让一个模型在一天之内或者几个小时之内搞定。