我把苍井空的照片放进人工智能里算了算

TensorFlow与机器学习 徐 自远 495℃

我的一位盆友,在一家著名的新闻网站负责法务。

最近他这个法务比 CEO 还忙,因为网站每天都被人告。

原因很简单:新闻里用的图片侵权了。尤其是多年以前的旧新闻成了“重灾区”,那时候编辑的版权意识还不强,使用了很多某图库的插图。于是,这位法务重拳出击迎战版权方!

。。。

。。。

。。。

然后他败了,公司已经陆续赔出去好几百万。

图片侵权案件自古有之,当年林志颖就因为P了一张图,被摄影家索赔110万。

“这种铁证如山的侵权官司如果能逆转,简直是对共和国法律的践踏嘛!”受尽老板折磨的他怒吼。

不过,作为技术流的中哥,我却没和他在一个频道,当即问了他两个问题:

1、侵权的都是四五年前的旧网页,现在都几乎没人看了,那对方是怎么找到这些图片的呢?

2、为什么这么多年都是风平浪静,单单今年你们的侵权行为被暴风骤雨般诉讼呢?

看着他迷茫的小眼神,我甩给他一个最近刚刚看到的网页:

你看,现在反盗版的斗士已经鸟枪换炮,靠人工智能自动寻找侵权图片了。它的效率可不是人能比的,有诗赞曰:

从来不吃饭,

只需几度电。

价格很低廉,

还不知疲倦。

有人工智能帮忙,找盗版图片肯定小菜一碟,难怪千年坟图都能给你挖出来。

送走这位纠结的朋友,我却陷入思考。

过去说到 AI,大家都觉得这是科学家的事情。

但是现在,一家图片社都可以娴熟地驾驭 AI。

“AI 反盗版”这个案例背后,可能藏着一个技术大脑洞。

一、“扫码借智商”

我注意到一个细节:

在“反盗版”这件事情里,图片社使用的人工智能,不是他们自己开发的,而是使用了华为云的“深度学习服务平台”训练出来的。

之前我对阿里云、腾讯云和百度云比较熟悉,唯独对华为云有些陌生。于是我千方百计找到华为云一位神秘的老司机(这位技术大牛很低调,所以要隐去姓名),跟他请教了一下这“深度学习平台”背后的脑洞。

先来科普一下,深度学习是目前人工智能的一个重要分支技术,它的原理不难解释:

让机器“看”大量的数据,它就会自动学会一种技能。

你日常体验到的人脸识别、语音识别,大多是深度学习的产物。

“深度学习服务平台”,简单来说就是人工智能界的“共享单车”。哪家公司自己的“智商”不够用,需要让人工智能帮忙完成任务,就可以从平台“扫码借智商”。

扫码借智商,我P的。

共享单车用起来很简单,嘀一下刷开就可以骑,咔一下关锁就可以走。老司机告诉我,华为这个“深度学习平台”也很简单:哪怕你是个不懂代码的小白,也可以通过输入一些样本,拉拽一些参数,瞬间定制出一个“大脑”。

依靠这样的共享平台,有人玩出了不少“骚操作”:

1)布料达人

在绍兴的柯桥,有一票服装行业的工厂,它们是中国服装业的半壁江山。很多大商人每天的工作,就是从千万种布料里面选出自己想要的那种,然后采购回去做成服装。

然而,虽然这些服装商都是身经百战,但面对千万种花纹、颜色、走线极其类似的布料,也像看到王珞丹和白百何一样,两眼发蓝懵的一比。

但时间可不等人,在服装行业,有时候流行趋势是变化得很快的,这个布料你几分钟之内不拿,可能就被别人抢走了。所以这些老板们迫切需要一种人工智能技术,只需要它做一件事:认识布料。

果然,他们就把市场上成千上万的布料照片,一股脑输入深度学习平台,很快就训练出一个能认识各种布料的“人工智能专家”。后来业务员只需要给布料拍张照片,就能自动比对,告诉你这是不是你要的那一款。这种骚操作,省下了大量人工走访判断的时间,下订单特别快,他好我也好。据说现在各个服装厂都在用。

这是一张示意图,你感受一下

2)脸盲福音

深圳是个比脚大的城市,2100万人,只有2万个警察叔叔。

1996平方公里的辖区,警察叔叔靠双腿可溜达不过来。大多数情况,他们都会通过监控探头来发现违法的坏人。而让他们吐槽无力的是,很多摄像头的清晰度都不高。

经常发生这种情况:摄像头拍到了一个嫌疑人,一群警察叔叔围在屏幕前犯了脸盲症,很难把这个人和公安数据库里的人脸对应上。

所以,警察叔叔就用深度学习平台,搞出了一套“模糊图像匹配系统”。这样,即使视频里的人像模糊到怀疑人生,人工智能还是能告诉你,Ta 和数据库里的谁最匹配。

果然,这个系统效果炸裂。

就在2018年春节的时候,深圳龙岗区有一个3岁的孩子被人贩子拐走了。警察叔叔接到报案,马上在监控里找到一个片段:一个中年妇女把孩子领走了。但是这个妇女的脸非常模糊。于是警察叔叔马上想到了自己的“脸盲福音系统”。一下子就把她和身份证库里面的人对应上,拿到了嫌疑人的高清无码大图。从孩子失踪,到警察叔叔狂奔到武汉救回孩子,全程只有不到15个小时。

一般的监控有多模糊,你感受一下。(这是一张示意图,并非事发当时的画面)

3)勤奋的书记员

另外,还有很多企业的销售部门,需要把手动填写的单据转化成 Word 归档,或者对身份证、名片上的名字和数字进行识别。这些枯燥的转录任务,原来是由人来做的,最近都换成人工智能来完成了。

这是用文字识别系统识别的发票内容

此外还有挺多,篇幅有限就不列举了。

有句话叫“简单就是力量”。

最近抖音这么火,主要原因就是它的操作够简单,却能赋予每个人无限的创造力。同理,人工智能平台的操作够简单,各家公司也能在上面创造出五花八门的应用。

这个趋势就是——“AI 平民化”。

二、“H”的另类人工智能史

说了这么多,你可能有一个和我相同问题:提到云计算,我们听说更多的是阿里云、腾讯云,为什么最近华为云会出现在我们的视野?

应该这样说,“对外提供 AI 服务的能力”并不是你想有,想有就能有。至少要具备两方面的条件:

1、强大的 AI 技术——AI 技术能力来自于大量的数据和应用场景锻炼,所以这个公司必须是大公司;

2、强大的硬件基础——AI 服务需要的硬件基础,来自于云计算。所以这个公司需要有云计算业务。

符合这两个条件的选手只有BATJH(百度阿里腾讯京东华为)这类大公司,华为当然也在其中。只不过很多人在日常的新闻里对互联网巨头比较了解,却很少有机会了解华为的过往。

说到这,中哥得先转述一下华为的“人工智能简史”。

1)“世界末日”的决定

2012年(也就是世界末日那一年),华为突然成立了一个神秘的实验室——2012实验室。没错,这个实验室的重要任务之一就是用各种姿势研究人工智能。在那个时候,人工智能还不被大众了解,甚至被妖魔化。然而,当时任正非的态度很明确:“我也担心人工智能对人的价值观产生破坏。但是我们挡不住人类社会前进的步伐。”

“2012实验室”下属的前沿人工智能实验室名字就叫“诺亚方舟”,更昭示了一种“救生艇”的意味。

2)直接“干实事”

那时候,华为的人工智能,主要用于解决自身的实际问题。当时华为业务大面积拓展,人手突然不够用。特别是技术流的“老湿傅”不够用了。于是,AI “临危受命”,被用来解决火烧眉毛的问题。

我给你举几个例子:

  • 环境健康安全:华为的很多业务都需要进工地施工。在施工之前,要有专人检测工人“反光背心身上穿,安全帽儿带规范”。这种本来靠人的检查后来被人工智能给替代掉了。摄像头自动分析你的装束,合格就放行,不合格绝不通融。
  • 供应物流:华为的日常业务,需要运输很多设备到海外。这时候,就有一个世纪难题:集装箱怎么装才能塞进最多的货物?这就像小时候,你从盒子里拿出积木的时候,他们排列整齐,当你放回去的时候,却总是多出来几块,盖不上盖子。在集装箱里,华为就用人工智能排兵布阵,几秒钟就制定货物摆放的最佳方案。
  • 基站规划:华为的王牌业务,是建设通信基站。每个区域的基站建设,都需要一个高级工程师对线路的走位、基站的位置进行科学规划。这是非常考验经验的,一个一年经验的工程师,设计出来的效果可能比五年经验的工程师差很多。眼看老湿傅不够用了,华为就把他们的经验值传给 AI,然后让 AI 辅助年轻的工程师做规划。

一秒告诉你最短路径

2012年,距离后来 AI 围棋大师“阿法狗”出山还有四年时间,华为就已经开始用人工智能低调地解决业务难题了。从时间上看,他们算得上是人工智能界的“老炮儿”了。

3)帮其他小朋友“补课”

小时候,老师都会安排班上学习好的同学帮助别人补习功课。华为比小朋友更自觉,既然自己的人工智能已经相对成熟了,那下一步就是帮助其他企业一起进步了。

你可能了解,华为的行事方式就是:不看准不出手,一旦出手就不松手。2017年,华为终于觉得时机成熟了,于是整合成立云事业部。他们雪藏多年的人工智能技术“存货”通过华为企业智能 EI(Enterprise Intelligence)开始对外服务,

这才有了开头“图片社怒怼盗图君”之类的故事。

三、“吃素”的华为云 & AI 平民化的漫漫长路

随着研究的深入,我越来越想弄明白:华为在“AI 平民化”的过程中,到底想承担什么角色呢?

几大巨头里,华为云应该是最晚对外开放云计算和人工智能的公司(2017年成立“云事业部”)。

,但有两点让它不能被忽视:

1、华为的体量巨大:它的营收等于 BAT 三家的总和;

2、华为的基因特别:同样做云计算和人工智能,但 BAT 是从互联网切入,而华为是从硬件和实体经济切入。在“AI 平民化”的浪潮里,AI 被更多地用于实体经济,所以实际上是 BAT 正在强行并入 H 的优势赛道。

竞争对手的评价,可能最说明问题。前两天我和国内公有云 No.1 的阿里的同学吃饭,私下提到腾讯云,他们谈笑风生;但是提到华为云,他们全都竖起拇指:“华为云是值得尊敬的对手”。

很多人说华为有“狼性”文化。但在我心里,华为其实是“吃素”的。

首先,华为不上市,不觊觎资本加持,更专注于民族技术本身。

其次,华为有著名的三不:不做应用,不碰隐私,不投股权。把自己的边界划得非常明晰。

当你说的“No”越多,你的“Yes”就越有重量。华为用近乎严苛的自我限制,使得各行各业天然相信它能提供稳定高效的产业工具。(这也是过去华为成功的经验之一。)

读懂这些,你就能感觉到:华为想为“AI 平民化”提供一个“稳定、高效、人人都能学会”的工具。

那位华为大牛告诉我,为了让这个“深度学习平台”稳定、高效和易学,技术团队做了很多技术努力:

首先,是软硬件结合的部分(智商)

每个人都会思考,但人和人的智商可是不一样的。

同样,每个人工智能都可以运作,但它们的“智商”也是不同的。

从脑科学来看,人类智商和每个人大脑神经元联动过程的强弱快慢有很大关系。对应到人工智能上,硬件之间的网络通信速率,网络带宽,都是影响它“智商”的重要因素。而“网络通信”这些底层硬件的优化,是华为在运营商时代就开始积累的传统强项。

在底层的硬件空间里,华为争取把技术做得更前卫,这也是他们最能和阿里云腾讯云拉开差异的地方。

(注意,我把这种优化定义为“软硬件结合部分”的优化。这种优化并不涉及“脑细胞”——也就是 GPU 本身——的优化。在计算芯片层面,华为和其他人工智能服务平台并没有区别。)

其次,是纯软件部分(学习技巧)

智商高的人并不一定成为人生赢家。如果把一个聪明的孩子放到山区的学校,一定不如他在北京四中接受顶级系统化教育学得好。这就是学习技巧的作用。

对应到人工智能平台上,同样有很多“技巧”。比如华为云开发了一个叫做“Moxing”的平台(这个平台有两个中文名字:模型、魔性),就添加了很多“特色服务”:

1)把深度学习的模型做成了不同的“套餐”,无论需要什么类型的图像识和语音识别,都可以像在麦当劳买套餐一样,直接拿来就吃。另外还有类似番茄酱、冰水这样的“辅助开发工具”提供,尽量提高人工智能训练的效率。

2)深度学习分为单机模式和分布式模式,以往如果想从单机模式切换到分布式模式,是需要重写代码的。而这对于很多企业来说非常不方便,Moxing 平台为这个事情也专门作了优化,一套代码既能跑单机,也可以跑分布式。这同样可以提升人工智能训练的效率。

类似这样的细节还有挺多,它们都可以提升使用者的感受。不过在我看来,想要真正实现“AI 平民化”这个宏伟的目标,还需要更劲爆的东西。

之前也说到,人工智能平台,从某个角度来说就是“共享经济”。共享经济能够发展的动力之一,就是不断把成本摊低。

而摊低成本有两条路:

1、吸引越来越多的人加入这个共享社群;

2、利用资金和技术进步直接把成本降低。

这两条路径,是鸡生蛋和蛋生鸡的关系。而作为技术流的厂商华为,显然会在第二条路上走得更远。

举个例子:

在大规模深度学习计算的时候,会需要非常多的 GPU 同时工作。而依靠现有的调度能力,在超过10枚GPU同时工作的时候,性能会出现很大程度的损耗(劣化)。简单来说就是,即使1000颗 GPU 同时工作,效果也和10颗 GPU 差不多。

华为云在做的,就是对软件进行改进。让他们引以为傲的一个数据是:在1000个 GPU 同时工作时,性能可以达到它们单独工作时的80%。这个数据,在人工智能界工业界应该算第一梯队。而减少损耗提高效能,就是标准的成本节省。

以至于这位华为的大牛羞涩地说:我们的优势是“性价比”。。。

而能效提高,从另一个方面看就是时间的节省:

使用深度学习平台的用户,目的往往是在平台上试验出一套最好用的模型算法。而这些算法往往不是一次就能成功。就像“苦吟派”诗人那样,吟安一个字,捻断数根须。需要反复调整参数进行试验,才能让识别率到达最优值。

在这个场景里,时间成本非常重要。你想,如果一个企业开发一个识图模型就需要一个月的时间,就差不多等于你扫码共享单车之后,十分钟锁才打开。。。所以,华为云的深度学习平台,拼命做了优化,实现了让一个模型在一天之内或者几个小时之内搞定。

我试着从身边找了两张图片,

放到了华为云 AI 平台 Demo 体验了一下。。。

(想要体验网址的私信我)

从业界来看,云计算厂商都在把“人工智能平台”作为下一个重点的业务。

就在前几天,AWS 上海站技术峰会就透露了亚马逊在人工智能平台上的野心。这家全球顶级的云计算厂商会通过AI平台提供图像、语音、自然语言理解这三种能力,这和我们的民族云计算厂商不谋而合。可见 AI 平民化,并不是我们一个国家的特例,而是一个世界潮流。

任何一种改变世界的技术,都不是上帝挥手抛到人间的。

我们今天能方便地用到电能,不仅要感谢法拉第发现了电磁感应,更要感谢爱迪生和西屋公司用商业的力量把它的成本降低到人人都能负担得起。

人工智能同样如此。从图像识别到机器翻译,从“AI 反盗版”到“AI 找孩子”,普通人已经慢慢被各种 AI 技术包围。

在它背后,是华为云和无数人工智能平台为了降低 AI 的成本做出的不懈努力。

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以关注微博:@史中方枪枪,或者搜索微信:shizhongst

不想走丢的话,你也可以关注我的公众号“浅黑科技”

 

 

我把苍井空的照片放进人工智能里算了算http://t.jinritoutiao.js.cn/djS57J/

转载请注明:徐自远的乱七八糟小站 » 我把苍井空的照片放进人工智能里算了算

喜欢 (0)

苏ICP备18041234号-1 bei_an 苏公网安备 32021402001397号