BAT这三家公司一直备受关注。其中一个巨头百度在9月1号举办了百度世界大会。CEO李彦宏说,移动互联网时代已经过去,互联网的下一幕是人工智能。他第一次公开介绍了百度人工智能的发展,我们来一起听听。
李彦宏说,人工智能对百度来说就是“百度大脑”。它由三个部分组成,第一个是人工智能算法,模拟了人的神经元组成网络。第二个是计算能力。百度大脑用来计算的数十万台服务器里,很多是GPU,也就是图形处理器。在模仿人类深度学习时,一块GPU的计算能力相当于100个CPU。第三部分是数据。百度大脑的数据量特别大,已经收集了几万亿的互联网网页,同时还有每天几十亿次的搜索请求,和几百亿次的定位请求。
好了,有了算法、计算能力和数据,百度大脑就可以开始工作了。它有什么功能呢?李彦宏介绍了四个。
第一个是语音能力,包括两个方向,一个是语音的识别,另一个是语音的合成。先来看语音识别,李彦宏说,百度的语音识别搜索引擎准确率能达到97%,有时候甚至要超过人。它能在哪里应用呢?比如电话销售,新人特别多,没有经验,拿到单子的可能性很低。怎么才能让新人也能有很优秀的销售能力呢?过去的做法是,把经验总结成册子,让新人去背,很容易就忘了。但如果有了高精度的语音识别能力呢,就能识别出客户在问什么,然后在屏幕上告诉新人,该怎么回答这个问题。
语音能力的第二个方向是语音合成,就是机器把文字转换成语音,然后念出来。以前的声音是那种匀速的、没有语调起伏的机器声音,现在能用比较自然的人声。语音合成能模拟任何一个你喜欢的人的说话方式,可以做到每个人听的东西都不一样。李彦宏说,只要你按要求说50句话,百度大脑就能学会你说话的方式。以后出差或者加班,还能用合成声音给孩子讲故事。
说完了百度大脑的语音能力,我们再来看第二个功能,图像识别。很多人立刻就能想到人脸识别技术,这个技术现在的准确率能达到99.7%,已经很高了。除了人脸识别,图像识别还有很多用处,比如地图全景。大家在地图上搜某个陌生地点的时候,有时会想看看这个地方是什么样子。地图采集图像之后,还要进行识别,比如大楼是什么样的大楼,那个路标上写的是什么字,给用户一个直观的感受。还有一个很重要的应用是无人驾驶汽车,最终要依赖计算机的视觉能力,要能识别各种各样极端的情况。比如对面有什么车过来了,遇到障碍物怎么办,怎么才能识别出行人和树木的不同等等。
百度大脑的第三个功能是自然语言的理解。李彦宏说,这个技术不如前两个成熟,但是也能给大家带来不一样的体验。百度做的个人智能助理叫度秘,百度的度,秘书的秘,能用人的语言来跟人交流。度秘还跟篮球评论员杨毅,一起合作解说了里约奥运会的篮球赛。杨毅觉得,度秘储备了大量的比赛知识,每个运动员的情况都掌握,还能跟用户互动。如果以后球迷看球时旁边放一个小机器人,有啥问题随时问它,都能解答,这就真正成了球迷的好朋友。
最后我们来看百度大脑的第四个功能,用户画像的能力。这是什么意思呢?百度现在识别了将近10亿用户,用了几千万个细分标签给用户分类,比如性别、年龄、地理位置,还有这个人在金融领域的情况,在旅游方面有什么爱好等等。这些东西合在一起,就组成了用户画像。百度就知道你是什么样的人,喜欢什么样的东西。那它有什么用呢?比如,今年6月份上映的电影《魔兽》,在宣传的时候把人群分成了三类,一类是不管怎样都要看的,一类是不管怎么都不会看的,第三类是可能会进电影院的。他们就用百度大脑的用户画像功能,识别出第三类人群,对他们定向宣传,结果这部电影的票房比预想的涨了两倍。
李彦宏最后说,未来会把百度大脑的语音、图像、自然语言理解、用户画像这四个功能开放出来,大多数情况下要免费提供,希望能给各行各业带来帮助。
以上就是李彦宏在百度世界大会的分享精华,供你参考。
本文源自:百度世界大会李彦宏演讲
音频稿:荷包蛋
讲述:杰克糖