我对比了 2018 上半年各家手机大厂的语音助手告诉你语音助手哪家强

 
       

  原标题:我对比了 2018 上半年各家手机大厂的语音助手,告诉你语音助手哪家强

  从 2011 年第一款语音助手 Siri 伴随着 iPhone 4S 惊艳亮相,到现在五花八门、名称各异的语音助手占据各大主流手机品牌,已经走过了 7 年历史。据 Strategy Analytics 的报告,2018 年全球出售的智能手机中,有 47.7% 配备了语音助手,而到 2023 年,语音助手渗透率将达到 90%。

  只不过,在语音助手百花齐放的背后,很多语音助手还是被人们视为调戏的对象,沦落到被贴上「人工智障」的标签而非「助手」的境地。

  复杂环境下拾音不准确,用户要发音清楚,不得不一字一顿地说话;语义理解不佳,换一种表达方式就答非所问;在公众场合唤醒语音助手,总是自带尴尬滤镜;智能化程度较低,更像是语音识别与搜索功能的简单叠加;应用场景有限,最多只能帮你打开 App,还不如触屏交互便捷。

  众多因素,使得手机语音助手长期成为了鸡肋般的存在,大多数用户使用手机的习惯,还停留在触屏交互上。以致于有些用户拿到新手机之后其中一个步骤,就是为了省电而默默关闭后台的语音助手,当然也包括一直奉行「能打字就绝不说话」原则的我。

  然而,从去年开始,人们的刻板印象正发生着变化。当看到「给小张发送 88 块钱微信红包并备注生日快乐」这种骚操作也能通过单纯说话实现之后,语音助手终于不再被当成一个笑话。Bixby、小爱同学、Jovi 的出现,让我们不得不重新审视语音助手在手机上的地位。手机厂商、人工智能服务商、芯片厂商联手一起,终于开始认真打造起语音助手的用户体验了。

  本次测评,我们选择了 2018 上半年主流手机厂商的代表性语音助手:小米小爱同学,华为 HiAssistant,苹果 Siri,三星 Bixby,vivo Jovi,来一番对比体验;

  评测环节分为四个维度:设备控制和系统功能调用,第三方应用支持,对话与智力水平,技能学习能力。各环节分值为 5 分,以下就来看看各家语音助手的表现吧。

  从 2018 年开始,一个明显的趋势是,各大手机厂商陆续为语音助手配备独立的 AI 按键,意味着语音助手的地位正逐步提高。

  前有三星 S9 的 Bixby 按键,后有 vivo NEX 的 Jovi AI 按键。按键作为手机交互的第一层级,高于触摸操作,让用户在不接触手机屏幕的情况下快速调用特定功能,同时带来的好处是,缓解了用户在公共场合唤醒语音助手的尴尬癌。

  除了 Bixby 和 Jovi,小爱同学和 Siri 也在灵活调动已有的按键资源为语音助手赋予第二入口。小爱同学可通过长按电源键 0.5 秒唤醒,Siri 也可设置长按 Home 键唤醒(iPhone X 则是长按电源键唤醒),唯独华为 HiAssistant 没有实体唤醒入口。不过,从实际体验上看,从按下按键到激活语音助手需要等待 0.5~1 秒,比起语音唤醒没有显著的效率提升。

  首先从基本的手电筒启用来看,小爱同学、华为 HiAssistant、Bixby、Jovi 都能迅速地接收指令并开启手机闪光灯,小爱同学还贴心地提供了开关按钮。

  Siri 则还未拥有调用闪光灯的权限,不支持开启手电筒。华为 HiAssistant 可以开启手电筒但却不能语音关闭,比较令人费解,而且在语义理解上需要多次纠正才能理解我的意思。

  在亮度调节上,5 款语音助手都能很好地完成指令,而且都能展示亮度条实现精准调节。从下图可以一窥各家语音助手的 UI 风格,小爱同学和 Jovi 多是以悬浮窗的形式呈现交互界面,华为 HiAssistant 和 Bixby 经常以对话框或跳转到相应设置界面来呈现,而 Siri 不管是系统内还是第三方应用操作都是在对话框完成。

  悬浮窗给人的直观感受在于语音交互都在原有页面层级之上进行,减少了频繁跳转界面给用户带来的割裂感,这一点小爱同学做的尤为出色。

  在计算功能和日程提醒上,各家语音助手都能胜任,其中华为 HiAssistant 还能让用户确认是否确认创建提醒,同样可以注意不同语音助手的 UI 设计。

  当我想给朋友发短信或打电话时,华为 HiAssistant、Siri、Bixby 和 Jovi 都能迅速给出反馈,在编辑好短信后需要手动点击「发送」确认;小爱同学在收到指令后只是打开了短信应用,既没有搜索联系人也没有进行短信编辑。

  信息搜索上,当我说出「今天天气如何」,华为 HiAssistant、Siri、Bixby 和 Jovi 都提供了每小时的天气状况,Bixby 更是给出了一份气温曲线图,比较专业。在描述上,小爱同学和 Jovi 会给出比较直观化的陈述,例如「挺热的」、「非常热」,Jovi 还会提醒你注意防暑。

  了解完天气,我还想知道今天的新闻。小爱同学会直接跳转到浏览器自带的新闻栏目;华为 HiAssistant 会接入神马搜索的新闻排行榜;Siri 则是在对话框中直接弹出浏览器搜索结果;Bixby 会跳转到新浪新闻;Jovi 则接入的是腾讯新闻,一组五条,还提供语音播报。

  新闻搜索方面,Jovi 的表现是最好的,小爱同学也基本满足「今日新闻」的需求。其余三款语音助手都还需要用户手动搜索才能找出今天的新闻,有点不太走心。

  又到了午饭时间,「附近有哪些地方吃的」,小爱同学是去浏览器搜索关键词;华为 HiAssistant 和 Bixby 都调用了大众点评的服务;而 Siri 使用了自家地图应用帮我找餐馆。

  对于本地搜索,我想让语音助手找出最近的一条短信。小爱同学又耿直地在浏览器搜索栏查找「最近一条短信」;华为 HiAssistant 则是答非所问;Siri 虽然找出了,但不是很懂为什么不能跳转到短信应用而是通过语音播报。只有 Bixby 和 Jovi 完美实现这一需求。

  在一些复杂的深度设置上,例如将「锁屏时间设置为 10 分钟」。这时小爱同学直接表示「臣妾做不到」;华为 HiAssistant 和 Jovi 都只能帮你跳转到设置页面,锁屏时间还需要自己去调整;Siri 更是连界面跳转都还需要用户点按。只有 Bixby 能自动帮你调整好锁屏时间。

  备忘录测试可以检验各家语音助手的听写识别水平。当我说出「创建备忘录,记录甲方如更改活动方案需及时告知乙方」,这里包含两层操作,一是激活备忘录应用,二是听写文段「甲方如更改活动方案需及时告知乙方」。

  在这里 Siri、Bixby、Jovi 都能实现激活备忘录 + 听写,而华为 HiAssistant 虽然能创建备忘录,但语义理解能力不佳,尝试几次都不无法录入完整的句子。

  小爱同学的表现更为突出,在这里备忘录的创建分为三步。第一步录入语句,第二步确认文段是否正确,甚至你还能继续录入文段,实现分点记录!第三步即可呈现在备忘录中。

  对于「帮我卸载应用」这一需要更高系统权限的指令,5 款语音助手都表示爱莫能助。

  值得一提的是,各家厂商的特色功能也能拓展语音助手的使用场景,例如小爱同学、华为 HiAssistant、Bixby、Jovi 可以通过语音调用自家系统的「智能识图」功能,轻松实现智能翻译、智能识物、智能扫码等功能,算是一个加分项。

  另外,小爱同学还有一个强有力的杀手锏,那就是它背后所连接着的庞大米家生态链。只需要呼唤一句「小爱同学」,绑定着的米家产品都可以被唤醒,极大丰富了用户体验。

  很多 iOS 的用户都知道,Siri 的第三方应用支持是一个永远的痛。尽管作为语音助手的鼻祖,但因为苹果一直以来的隐私政策,加上接入第三方应用 API 需要冗长的业务谈判,导致伴随 iOS 迭代数年的 Siri 可支持第三方应用依然屈指可数。

  △ iPhone 安装的 40 多个第三方应用中,支持 Siri 的寥寥无几

  许多对隐私敏感的用户也许会赞同苹果的做法,只不过很大程度上限制了语音助手的价值。从 2017 年开始,其他手机厂商另辟蹊径,通过模拟手指点击的方式,巧妙避开了 API 接口和复杂的商业谈判,实现各个 App 内的深度操作。

  在微信上,5 款语音助手都能实现简单的「给 XX 发微信,今天晚上一起吃饭」。对于发送微信红包并备注这种操作,华为 HiAssistant 表示需要你先选择应用程序;Siri 直接耿直地发送「100 块钱的」信息;而小爱同学、Bixby、Jovi 实现的方式如出一辙,整个过程实测 5-6 秒,比手动操作更便捷:

  当我想查看最新的微信朋友圈,小爱同学、Bixby、Jovi 均可实现;华为 HiAssistant 则去了浏览器搜索「朋友圈」;Siri 虽然准确识别了我的需求,还是可怜巴巴跟我说「我很想帮你,但微信还不支持这种操作」。

  在微博上,华为 HiAssistant 和 Bixby 一样都能「打开微博,发送今天很开心」,总算帮华为挽回了一点颜面;小爱同学和 Jovi 都只能帮你打开应用,而不能进行深度操作;Siri 就连打开应用都需要用户手动点击。

  在 Bixby 的对话框中,可以发现在微博应用下对话框有一个小小的微博图标。意味着 Bixby 此时进入了应用内操作模式,Bixby 可以理解当前的应用环境,用户对该应用的所有指令 Bixby 都能进行识别和操作,这种细节值得给一个好评。

  在导航方面,华为 HiAssistant 和 Bixby 使用的是百度地图,能直接在应用内启用百度 DuerOS 语音服务,非常方便;小爱同学和 Jovi 使用的是高德地图;Siri 调用的是自家的地图应用。此外比较突出的是 Jovi 还能通过语音设定途径点。

  而对于网易云、QQ 音乐等应用,Siri 直接表示不支持;华为 HiAssistant 货不对板,「播放网易云的推荐歌单」却给我打开了本地音乐应用;只有 Bixby 和 Jovi 可以无障碍打开应用播放指定音乐。

  有趣的是,对小爱同学说「打开网易云音乐播放青花瓷」,它只能打开网易云音乐应用本身。而当我对小爱同学命令「打开 QQ 音乐播放青花瓷」时,它却行云流水般打开应用,搜索《青花瓷》,点开播放,合作方的待遇果然不一样。

  「在爱奇艺上搜索播放楚乔传」,只有小爱同学自动打开播放了《楚乔传》,华为 HiAssistant、Bixby、Jovi 只能打开应用本身。而且让人眼前一亮的是,如果对小爱同学说出影视剧的名称,它就会把拥有该剧版权的 App 信息汇总给你,让用户省去了提前了解哪个 App 拥有版权的麻烦。

  从声音体验来说,比起 Siri、华为 HiAssistant、小爱同学充满机械味的音色,Bixby 的音色、语气停顿是最接近人声的,对话起来很舒服。Bixby 的男声配音员名叫王聪,女声配音员叫张喆,他们录制了不少完整的实际场景语音,然后再经由三星研究院合成,因此 Bixby 的发音十分自然。

  在自然语言理解方面,Bixby 和 Jovi 的表现也非常出色。「我想看五月拍的照片」和「五月的照片帮我搜索一下」这种同一指令不同的表达方式,它们都可以准确识别。相比之下,华为 HiAssistant 要逊色不少,很多时候必须要不断调整句子语序,答非所问的情况依然很严重。

  小爱同学在对数字进行语义理解时,会更偏向中文数字的理解,即录入的文段是「一二三」而非「123」。而在英文理解方面,小爱同学的识别精度也并不是很准确,跟它说「打开 FM」,它识别成「打开 FA 梦」;跟它说「打开 Yeelight 台灯」,它识别成「打开依赖台灯」,或许准确的英文识别需要更地道的口语水平,这可多少有点为难我了。

  同时,我发现 5 款语音助手都无法准确断句,所以在听写长文时,我们还是得手动输入标点。

  在讲笑话方面,发现除了 Siri,其他都没有找到笑点,是我理解能力太低了吗?

  相比之下,华为 HiAssistant 莫名其妙的回答和小爱同学实力卖老板,反而更能博人一笑。

  「你的爸爸是谁」,小爱同学、Jovi、华为 HiAssistant 的回答比较耿直;Siri 的回答很温馨;Bixby 的回答非常婉转含蓄。

  当问及如何评价自家品牌与竞品时,只有华为 HiAssistant 勇敢地夸耀自己;小爱同学、Siri、Bixby 在网上搜集一堆观点交给用户评判;而 Jovi 用一个充满哲理的回答打起了太极,可以说求生欲非常强了。

  而在「什么是隐形贫困人口」「哲学的基本问题是什么问题」这种知识性问答上,华为 HiAssistant 充分发扬了「不知为不知」的精神;其余 4 款则从搜索引擎上把解释摘录下来,小爱同学的回答还附上了贴图。

  与 AI 独立按键一样,2018 年另一大趋势,是各大厂商开始打造自己的语音助手学习平台,让用户成为语音助手的老师,使之「越用越懂你」。

  5 款语音助手中, 小爱同学、Bixby、Jovi 都有自己的技能学习平台,而 Siri 和华为 HiAssistant 则落后于时代,不过随着 iOS 12 正式版发布,拥有 Shortcuts 加持的 Siri 也许能重获新生。

  Bixby 的技能学习分为「自定义聊天内容」和「快捷命令」两大板块。「自定义聊天内容」可以把 Bixby 对特定语句的反馈改造成个性化的回答,从实用性来说意义不大。

  「快捷命令」则可以把多条命令汇总到一句话中,例如一句「导航回家」,就可以把「开启导航」、「输入目的地」、「调高音量」、「调高亮度」、「发送微信告诉家人我要回家了」等五项操作连在一起编成一句指令,简化了操作步骤。

  不过缺点在于,用户只能调取 Bixby 命令库中的命令,其实还是工程师提前预设好的,用户并不能随心所欲地定义自己的操作。例如在手机淘宝命令库中,只能找到「搜索卖家具的店铺」这一命令,而没有「搜索卖电器的店铺」「搜索卖文具的店铺」,本质上还是一种伪技能学习。

  小爱同学、Jovi 的「录屏教学」模式,应该是最接近真正意义上的自定义操作。在 Jovi 语音 App 和小爱同学 App 上,分别找到「我的教学命令」和「训练计划」,打开录屏教学模式,用户模拟一遍操作流程,语音助手即可记住你的点按套路。

  例如,在没有教小爱同学之前,小爱同学是没办法做到「打开哔哩哔哩观看人生一串」这样的操作的。打开录屏教学,我先亲手模拟一遍操作流程:

  小爱同学记住了我的操作套路后,当我说出指定口令,小爱同学就像流水线一样对我的演示进行复现。

  小爱同学和 Jovi 可以支持应用内「点击」以及「文本输入」这两种类型的教学,满足大部分 App 内的操作方式。

  如果不想手把手对语音助手教学,小爱同学和 Jovi 分别还有「公共训练」和「Jovi 广场」,可以找到其他用户共享的创意技能,添加到自己的教学命令中。

  录屏教学极大地激发了用户的创造性,类似「支付宝收能量」(打开支付宝,点击更多、财富管理、蚂蚁森林),「浦发信用卡还款」(打开浦发银行,点击信用卡还款),「我想吃肯德基」(打开饿了么,点击搜索,输入肯德基)这些命令已经在技能广场上屡见不鲜。这也让我有一个大胆的想法:如果通过录屏教学,教会语音助手帮我每天领取「绝地求生」的登陆奖励,岂不是美滋滋?

  尝试过后,我发现我还是太年轻,几次教学都止步于「账号登陆」这一步。看来对于登陆游戏这种更高级别的权限,已经不是手机厂商能够给予的了,当语音助手也能自动帮你刷分领经验,这不是在抢游戏脚本的饭碗吗?

  是多任务运行?是滑动屏幕时的卷轴特效?还是像电脑一样可扩展第三方应用程序?

  10 年前,这些令我们惊呼 Amazing 的特性,现在早已成为了习以为常的存在。

  当我想获知某类信息时,它能立即给我答案;当我想使用某项服务,它能迅速地调出,不需要频繁切换界面,一步到位;当我处于某个场景下,它还能预知预判我的下一步行为,并把一切工作准备妥当。

  我们使用手机的方式多种多样,尽管通过语音交互不能百分百接管所有的场景,但随着小爱同学、Bixby、Jovi 技能学习平台的出现,让我们看到语音助手正逐渐找到自己的定位——专注于解决较繁琐但却有规律可循的任务,简化用户调取手机服务的流程。

  让用户自己教导和训练 AI,不需要去「不断尝试」什么样的指令是语音助手能听懂的,App 开发者也不再需要去思考「用户会说什么关键词来触发我的服务」。

  让一句话,同时进行设闹钟、开勿扰、打开白噪音、发送微信表情、关灯等几种操作。给语音助手编写好「工作流」,设置「触发词」,制作一个个语音开关,实现「一触即发」的体验。这正是语音助手所擅长的,也是小爱同学、Bixby、Jovi 以及 iOS 12 的 Shortcuts 的发展方向。

  回到我们今天对比的 5 款语音助手,小爱同学的悬浮窗 UI 和背后庞大的米家生态链成为它的加分项;Bixby 拥有最出色的自然语言理解能力和音色调校;作为后起之秀的 Jovi 凭借技能广场,在打造技能生态上已经初露锋芒; Siri 则受限于系统,祝愿它能在 iOS 12 正式推出之后完成蜕变;至于华为 HiAssistant,语义理解和可支持的服务似乎还停留在 7 年前的水平,需要继续努力。

  我希望,未来的语音助手,不仅仅是充当「一触即发」的语音开关,还能举一反三,将类似的「工作流」应用在更多的场景下,真真正正帮助用户提高效率。

      太阳城,澳门太阳城,太阳城娱乐


网站地图