这一天,我们读了千页往事,和一页叫做“百度大脑”的未来

脑极体 2019-04-26 智造
30800 25

刚刚过去的世界读书日,大体与所有节日一样,都是媒体和各企业必要参与的节庆。

相信大家都已经看到,社交媒体上大家都在推出各种和读书、书籍有关的东西。有人笑言,这一天把一年也看不完的书都推出来了。

所有企业和媒体,无论推什么书籍、书人和书事,必然都是关于历史和往事的内容。但今年却有了一个例外。百度大脑在这天推出了一个同样切题世界读书日的玩法,实际上为读者奉上的却是一碟未来。

4月23日,百度大脑携手Kindle,发布了一个名为“遇见著名的你”的创意H5。这个H5的玩法不同之处在于,用户只需上传自己的正面照,百度大脑就会自动进行分析,把对用户的识别和理解,匹配到名著中某一段关于人物的描写或者故事情节。

 

 

 

从而告诉用户,此刻的你最像哪本名著中的哪段故事。这种感觉很是奇妙,在一个不期然的瞬间,突然知道此刻自己的衣着穿戴和表情,竟然与多少年前秉烛夜读时遇到的文字如出一辙。

 

 

唤醒对阅读的追忆和神往,“身临其境”显然是一种不错的选择。

但是这场优雅而隽永的“遇见”,回归到技术层面却并不容易。对AI有了解的朋友,显然会发现这个H5在识别和判断中所展现的“智慧“,已经远远超出大家对类似玩法的常识认知。

遇见名著中的自己之后,我们也许有必要细数这背后究竟隐藏着哪些技术因素。借此,或许可以精准读取出关于AI的未来能力。

“穿越回名著“是一个入口,曲径通幽连着不同远近的未来图景。而这条“径”,被称作百度大脑。

此刻的未来:AI能做的,远比想象中更多

对于AI带来的识别能力,相信大家已经并不陌生。今天机场车站都已经运用了人脸识别功能,解锁手机也有3D人脸识别这一选项。

但是如果大家觉得AI只能识别人脸,那可能就大错特错了。

从“遇见著名的你”H5中,百度大脑最直接展现出的能力,是其所提供的AI能力种类,已经远远超过了大众想象。

换句话说,在大家刚刚开始习惯简单人脸识别的时候,百度大脑已经小试牛刀展示出了AI技术在识别和理解层面可以达到的高度——对于大众行业来说这是未来,对于百度大脑来说,这就是现在。

比如说,在这个H5中,百度大脑不只是能够识别出人脸,还会更加复杂地进行“人脸属性识别”。具体来说,就是百度大脑能通过照片上的面部信息,识别出照片中人的性别、年龄、表情等信息。我在几个同事身上做了测试,年龄识别这个很困难的技术,百度大脑的判断都相当准确。

 

 

而在人脸属性识别之外,百度大脑这次还展现了另一个AI技术:人体分析。顾名思义,这一技术的识别对象不是人脸,而是人的体态。在H5中,百度大脑通过对全身照用人体分析能力,可以识别出照片中用户的性别、年龄、服饰类别及颜色、佩戴物、行为动作等信息。最终通过把理解后的信息抽象出来,与AI所理解的名著段落进行匹配,完成“穿越”。

同时,H5中还融入了百度大脑的车辆识别能力,能够识别图片中的交通工具。

能够看懂用户的容貌体态,才仅仅是个开始。要想准确匹配到名著的段落,还需要对大量名著文本信息进行理解,这就涉及语义理解这个AI能力。通过对Kindle提供的超过百万册书籍进行学习,百度大脑将各部名著中的人物描写和情节段落进行了准确抽离。让AI把读书学来的知识,和看人识物的本事放在一起,多种能力融合,这才带给用户一场“名著穿越”。

作为测试,我拍了一张同事的照片交给百度大脑来匹配。通过识别出年龄29岁、表情是高兴,然后搭配黑色长裤,这张照片被匹配到了《钢铁是怎样炼成的》中保尔回到冬妮娅身边那一幕。

 

 

同事问我这代表了什么,我说这是AI觉得你像刚从战场回来的。

以上多维度的AI能力综合,才最终做到了这件很是神奇的“小事”。而其背后,则意味着我们期待的大量AI能力为人类服务,这一非常“未来”的景象,其实已经被百度大脑带入了我们身边。

即将发生的未来:当我们习惯用百度大脑来“智慧结绳”

更深一层的未来,在于这一H5背后展现的,并不是一个个单体的AI技术,而是将大量技术融合到浑然天成。用户在毫无知觉的情况下,就得到了经过复杂识别与匹配的结果。

让我们一同思考这样一个问题:人的智慧和单一的机器,二者到底有什么区别?

最大的区别可能在于,无论多复杂的“机器”,都只能用单一能力完成单一目标。无论是生产线还是电脑,莫不如是。而人的能力在于,我们可以利用手耳眼脚心,集成所有的感官和思考,在同一点上迸发出来,解决同一个问题。我们可以听到命令,经过思考,马上实践。这样的综合和转化,是传统意义上“机器”不具备的能力。

然而规则正在发生改变。

运用之妙存乎一心,在这次“穿越名著”背后,百度大脑展示出了对多跟AI技术丝线的“结绳”。即通过整合调用,把大量技术融合解决同一个问题。这个思路的背后,事实上是百度大脑3.0的核心技术突破“多模态深度语义理解”。多模态融合与多信道统一,不仅让AI能听和看,还可以理解实物背后的含义。比如说理解一张照片如何匹配名著中的一段情节,既要能够看清看懂照片上有哪些因素,又要读懂名著的大段内容中,哪些是关于人物表情、服装、配饰和交通工具的描写。二者结合,才有智慧。

 

 

而现实世界中,也在经历必须让AI从单独的听和看,走向多看多听之后的自我理解这样一个趋势。这是一个极其广泛的技术需求,甚至大量产业应用AI能力都必须以其为基础。而这样的需求,就要求技术综合体必须具备三个能力:平台化、实用导向和多模态融合。

经历百度多年AI技术积累的百度大脑,恰好就处在这样一个位置。它包括视觉、语音、自然语言处理、知识图谱、深度学习等 AI 核心技术和 AI 开放平台,对内支持百度所有业务,对外全方位开放,赋能各行各业转型升级。

从有技术到能够用技术,从单体智能走向泛智能,百度大脑已经打开了开关,这个即将发生的未来,意味着社会化生产的全新AI可能性。

未来的未来:或许,我们终将靠AI之舟跨过“庄子悖论”

为了凝视更远的未来,让我们回到世界读书日的意义。

哪怕每一天都是世界读书日,必须承认的是人类已经彻底陷入了“庄子悖论”,即生有涯而知也无涯。在信息爆炸、知识碎片化、体系学习成本越来越重的未来,人类究竟如何与“知识”这个怪兽相处呢?

 

 

日本著名漫画家、《圣斗士星矢》的作者浜津守,还有一部知名的作品,翻译为《铁甲神兵》。那部漫画里有一个令我印象深刻的角色,他是一位哲学家,但面对浩如烟海的知识,他感到生命如此短暂。最终他选择把身体化为分子态以求永生,就是为了读完所有的人类知识。

虽然是一个漫画人物,但这却是一个鲜明的隐喻。知识体系越来越细分,好内容不计其数,但适合自己的书籍又隐藏在我们难以意料的角落里,这样一个时代,人类究竟该如何妥善地阅读?

百度大脑在这一天,展示了这样一个未来的一角:不仅仅是人去阅读知识,而是让AI来阅读人类,通过识别和理解,把最适合你的那一页放在你的面前。

对抗人类与知识的鸿沟,或许会在未来成为人类主要难题之一。虽然那还是非常遥远的未来,但百度大脑无疑掀起了帘幕一角,让我们看到不用追求永生,人类同样可以更高效率地追逐知识。

当然,这里不是教导大家放弃阅读,一味等候智能。但不可否认的是,人类与信息的交互方式正在快速迭代,从固定时空阅读,到随时阅读,再到未来的AI来为你阅读。世界读书日这天,百度大脑带来的终极人文关怀,是关于知识与生命交互的一次勇敢思考。

欢迎搜索关注钱塘号的微信公众号: 定时推送,福利互动精彩多

13

相关阅读

评论
评论

0/500

最新评论

点击加载更多评论
X

请先登录

登录
忘记密码?

没有注册? 注册

已有账号登录
X

注册

>>>请拖动滑块完成拼图>>>

注册
已经注册? 登录
X

找回密码

>>>请拖动滑块完成拼图>>>

确定