跌下“神坛”的人工智能,会与场景撞出怎样的火花?-黑科技

不知你是否察觉,在一个不断释放新概念的技术世界,过去几年,大众对“人工智能”的热议周期已实属漫长,在从业者,资本和媒体的合力缔造下,社会舆论迫不及待地将 AI 奉上神坛,整个市场对 AI 概念本身的狂热,也在很大程度蒙蔽了大众对 AI 的认知——你知道,在激进者的渲染下,“人工智能是否将超越人类?”“奇点是否即将来临?”等并不高明的通俗臆想,成为关于 AI 话题的最佳谈资。

好在,现实令人欣慰,更像是一次“去魅”过程,进入 2018 年,对于人工智能概念的热炒似乎进入尾声:在公众一端,也许是偏见被慢慢消除,也许是流行热点本身的消逝,更也许是被商业噱头说得麻木,大众逐渐降低了对于“人工智能”四个字的敏感度。

更重要的是,在产业一端,从业者也普遍脱离亢奋状态,那些把 AI 当锤子到处找钉子的“妄人”,也逐渐被市场淘汰——而当潮水褪去,AI 跌下神坛,裸泳者被赶下舞台,也终于意味着,从今往后,人工智能将转变为惠及大众的实用科技,迎来一个掷地有声的落地阶段。

而落地的方式各有所长,以刚刚发布财报的猎豹移动为例,北京时间 11 月 21 日,他们发布了截至 2018 年 9 月 30 日的第三季度财报,猎豹移动 Q3 总收入 13.52 亿元,同比增长 15.6%,环比增长 22.5%,超过公司业绩指引上线,净利润同比增长 20%,达 1.93 亿元。

根据财报显示,在这个季度,猎豹移动在工具和娱乐业务保持稳健增长的同时,与 AI 相关的硬件业务也取得不错的进展,譬如 7 月 19 日基于社交场景的小豹翻译棒正式发布,并成为当月中国翻译器行业线上销量冠军,在刚刚结束的双十一中,也并不令人意外地以全网突破 15000 台的销量遥遥领先同类产品,小豹翻译棒也将在 12 月全面向线下发力,构建“线上+线下”全链路销售通路。

不过依我之见,相较于单一硬件产品的稳健发展,更具商业参考价值的,是在 AI 落地的细节上,猎豹移动的人机交互产品基因结合猎户星空的全链条 AI 技术,带给整个 AI 行业的一些启示。

自研全自研 AI 技术的内在逻辑

业内皆知,过去两年,猎豹移动携其投资的人工智能公司猎户星空,搭建了一整套包括语音识别,视觉识别,室内导航平台,机械臂平台,麦克风阵列等在内的行业唯一的全链条 AI 技术。
当然,人们不禁好奇,这种对于不同技术细节的“自包自揽”,内在逻辑是什么?

我个人认为,除了想要在 AI 时代夯实自身的技术根基,不再受制于人,自研完整技术链条的最大原因是:现阶段 AI 产业成熟度的相对羸弱,让完全以技术拼接的方式,搭建一款真正用户体验良好的产品变得较为困难——而用户体验良好,又恰是猎豹移动多年以来最珍视的核心策略。

嗯,尽管选择不同技术供应商,如搭积木一般迅速让硬件拥有智能,似乎是更节省成本的商业选择,但其用户体验往往会打折扣,傅盛就曾举例道:“很多开发者拿一块板子,拿一个所谓的开放平台,就想实现很好的语音识别效果,其实是非常难的。以智能音箱为例,换个外壳罩上去算法就得调整,因为混响不一样,就像在你的耳朵上加一个耳塞,听力就可能大幅度下降,和你的大脑聪不聪明没关系。”

而与之相反,自研全链条的一大优势,就是通过技术整合能力,让不同技术模块之间的衔接不再单摆浮搁,以一种更具整体感的交互方式,让用户体验更为流畅。

智能音箱的黏性来源——语音交互的快感

事实上,全链条 AI 技术最先渗透进的场景,正是智能音箱。

作为“后手机时代”第一个真正被大众接受的智能硬件产品,从市场反馈来看,与 2014 年左右那股“智能硬件创业泡沫”相比,很多用户一旦用上智能音箱,产生的黏性往往非常高。
不过,前提是它足够“好用”——这里的“好用”,当然不是指望花几百块钱买的东西,就能瞬间如科幻电影里那样担当能“对话”的机器管家角色(人与机器离真正意义上的“对话”,还有一段无比漫长的路要走),其实除了内容本身,目前智能音箱最主要的黏性来源,是它能用语音指令替换遥控器带来的快感。

而受益于猎豹移动深耕多年的产品思维,不少评测机构都指出:横向对比市面上的语音系统,猎户星空OS的体验度格外出众。一方面,这当然有赖于技术本身,作为猎豹移动投资的 AI 公司,猎户星空如今已掌握麦克风阵列、语音唤醒、语音识别、语义理解和语音合成等全套远场语音技术,不同技术的无缝融合,让交互体验尤为出色:垂直领域深度语义理解 96% 的正确率,全链路流畅网络下 1.5s 的平均响应速度,线上服务 99.9% 的稳定性,无一不在印证这一点。

另一方面,猎豹移动人机交互的产品基因,除了促使猎户星空 OS 通过温暖自然的语音合成,给用户带来更好的人机交互体验,还让产品经理对用户需求有更人性化的理解,傅盛举过一个例子:“我们买来了对手的产品,发现点歌根本点不准,只有 50% 的准确率。为什么?不是语音识别的问题,而是内容上的问题。比如说今天抖音出了个神曲叫《我们一起学猫叫》,有的时候用户说叫‘学猫叫’,有的说喵喵喵,有多种的说法。这不是一个智能的活儿,这是个产品的活儿。”

事实上,随着智能音箱市场竞争进入深水区,很多真正想做好一款音箱,而非单纯为了争夺流量入口的企业,都开始愈加珍视语音体验:譬如,不久之前,锤子科技推出了由猎户星空语音 OS 技术支持的首款智能音箱,老罗在发布会上特别表达了对猎户星空的感谢:“我们提了最多,最变态和最让他们意外的需求,他们仍然给了我们最好的支持”。

而摊开时间轴,上个月底,华为推出的首款智能 AI 音箱也独家采用了猎户星空的语音合成技术;加上更早之前的小米小爱同学,美的小美 AI 音箱,喜马拉雅小雅音箱和小豹 AI 音箱等产品,并未用太久时间,猎户语音 OS 每天线上语音指令就超过 2000 万次,且拥有上百万小时的远场语音数据积累,占中国智能语音市场份额超过 30%,日趋庞大的用户群体和语料数据,也得以让猎户语音 OS 通过人工智能的收益递增原则,进一步技术迭代,提升用户体验。

加快机器人商业化落地步伐

当然,除了 2C 一端的智能音箱,以全链条技术为支柱,以出色的产品思维为着力点,这条更为艰辛务实的商业道路,同样贯彻在机器人领域。

如你所知,人类每一次技术工具的进步,都伴随着生产效率的提升,机器人也不例外,它并未脱离麦克卢汉“技术是人类延伸”的经典定义,就拿接待机器人来说,在增加趣味性的同时,它能帮助很多不同领域的企业降本增效,实现收益扩张。但就像傅盛所言:“目前机器人行业还处在非常早期的阶段,比如说一些厂商人脸识别的算法好用,但是如果真正要接待一位用户,就需要时刻感知用户的位置和需求,光有单点技术的支撑是远远不够的。”

正因如此,结合猎豹移动人机交互的产品基因,以及猎户星空的全链条 AI 技术,接待机器人“豹小秘”应运而生,它具备语音视觉,室内导航和算法等核心技术,这种对于全链条 AI 技术的掌控力,也为其产品落地带来诸多优势。

譬如,专门针对机器人定制的麦克风阵列以及前端处理算法,能够保证“豹小秘”在八九十分贝高噪音的环境下,仍能清晰识别人的声音,加之与多模态视觉交互以及低成本导航等技术的自然融合,让它能够流畅地响应用户在接待,导览和导购等场景下的落地需求。

此外最值得一提的是,全链条 AI 技术的另一优势,是巨大的灵活性,让它可以在很短时间内,实现导览场景的定制化需求,且同时保证了稳定性和安全性,这无疑会极大加快接待机器人在不同场景的应用步伐。

事实上也是如此。今年 8 月,猎豹移动携猎户星空与来自十大行业的 13 家企业签订了千台“豹小秘”意向订单,刚刚公布的财报也显示,四季度起“豹小秘”将实现商业化量产——而倘若你知晓量产之于 AI 产业的特殊意义,就会理解这次合作之于中国接待机器人产业的里程碑价值:相较于其他尚处于襁褓且不够实用的机器人,“豹小秘”大大缩短了各个行业对接待机器人的认知周期,也让其自身能以更快的速度完成落地,“豹小秘”的服务场景从最初的酒店和写字楼,已迅速扩展到银行,医院,政务大厅以及鸟巢和八达岭等景点。

嗯,通过智能音箱与机器人的例子不难发现,作为最早一批关注 AI 场景化落地的企业,在充分融合猎户星空的全链条 AI 技术之后,猎豹移动的 AI 战略,已经逐渐在不同领域落地生根,开花结果。
而猎豹移动对于自己未来的期许,是通过“真开放”策略,打造一整套 AI 赋能的云端操作系统,与更多行业的开发者一起,构建出一个更为庞大的 AI 生态。

当然,无论是眼前的智能音箱和机器人,还是未来那个庞大生态,在我看来都再次印证了一点:AI 不是洪水猛兽,用 AI 创造更多价值,是这个时代技术带来人类的最大福祉。