广告位API接口通信错误,查看德得广告获取帮助

凤凰时尚网移动版

首页 > 资讯 >

三天发布100个新产品 谷歌能否走出增长瓶颈?(2)

  在搜索具体名词时,谷歌还加入了3D图像与AR图像。在谷歌中搜索一双新百伦的鞋子,可以看这双鞋子的各个侧面,包括鞋底的展示。目前,谷歌正在与NASA、新百伦、三星、沃尔沃汽车和美国超市Target、美国家具平台Wayfair合作,在搜索结果中呈现更多3D图像。

  如果搜索白灰鲨鱼,会在手机上出现鲨鱼的3D图像,还可以使用点击移动功能。现场展示者就将大鲨鱼的AR图像移动到了舞台上。转动摄像头,甚至可以通过手机看到大白鲸的牙齿。

  Google Assistant 语音助手

  去年,谷歌首次推出智能语音助手的一款更加智能的程序Duplex,它可以模仿人的语气电话订餐、并且在机器说话的时候加入停顿词,可以连续发出多个请求,不需要每次都用“Hey Google”唤醒。谷歌资深科学家、技术大神Jeff Dean介绍称:“仅这一个系统就涉及了多项技术,包括自然语言处理和对话理解、语音识别、文本到语音转换、用户理解和有效的 UI 设计。”

  今年语音助手连续发出了8个指令,可支持多任务同时进行,甚至可以让语音助手挑选出相册中在黄石国家公园有动物的照片,甚至是有牦牛的照片。

  谷歌还推出了基于网页的Duplex版本,只要说出为我下一次旅行订车,Duplex可以通过Gmail知道你喜欢的车型、订车时间,自动帮你完成所有需要填写的表单,全程不需要手动输入,这项功能将在今年下半年上线。

  当你告诉语音助手:“导航去妈妈的家”,其中“妈妈的家”可能是一家餐厅的名字,也可能真的是你母亲的住所。谷歌可以识别这些个性化信息。

  考虑到强大的“填表机器人(300024,股吧)”可能比用户更清楚地记得自己的信用卡账户、妈妈家的地址、航班和出行的详细订单,在隐私问题频繁出现的硅谷,需要用户自己在语音助手中设置个性化信息。

  不过,这些新技术的展示就好比泡面盒子上的展示图片与真实图片的差距。在去年的现场展示中,Duplex在帮助人类订餐时,甚至可以模仿人的语气词,以至于餐厅老板也无法确认,背后到底是一个人还是机器人。

  但在真实的应用中,谷歌承认Duplex有25%的电话是人打出去的,而不是真正的语音助手,在机器打出去的电话中,15%会受到人的干预。现场多数人在看完演示以后,会很简单地以为这个机器人无所不能,真相是,它最擅长的功能就是“预订餐厅”,因为谷歌一直在反复训练它,尽管如此,它有时候还做不到那么好。

  今年,语音助手还将加入到谷歌地图中。只要说出“Let’s Drive”,就可以通过车内环境语音打开Youtube上的音乐、决定是否接电话。可以确定的是,通过语音直接调取应用程序越来越主流,语音正在成为入口。

  关爱特殊人群

  谷歌的价值观是:“让所有人都可以享受技术的便利,而不是一部分人。”今年,谷歌也推出了很多使用科技帮助残障人士的新功能。最终,这些帮助残障人士沟通的新技术进展,也可以给普通人在特定场景下使用。

  Steve Saling患渐冻症已经有13年,这种病在发病后肌肉僵硬、抽搐、说话或者吞咽困难,四肢开始逐渐无力,最终丧失自主运动的能力,著名物理学家霍金就患有此病。

  谷歌通过识别Steve的面部表情,来训练机器学习的模型。最终他只需要稍稍做出不同的面部表情,就可以操作谷歌智能家居设备Google Home。

  这个项目名为Project Euphonia,由失聪设计师Elise Roy与哈佛教授Michael Brenner共同研发,但它需要尽可能多的声音样本。

  谷歌语音研究员Dimitri Kanevsky就是一名听力障碍者,失聪后才开始学习英文,因此在谷歌现场播放的大屏幕上,完全无法听清楚他在说什么——这段英语发音模糊,单词输出不清晰,无法与人沟通。于是,他录入了1.5万条自己的语音模型训练,最终,机器可以准确识别他的声音与讲话方式。但这种个例并不具有普适性,谷歌正在寻找更多的样本为残障人士提供交流渠道。

  谷歌还研发有一项Live Caption系统:你所说的话字幕会实时出现在手机屏幕上,这样失聪的人就可以通过文字“听”到语音电话了。除了给残障人士使用,这项场景应用广泛,比如在嘈杂的酒吧看球赛或者电视(美国电视都不带字幕),或者不太方便收听电话时均可使用,语音可以实时转换成文字。

(责任编辑:admin)
广告位API接口通信错误,查看德得广告获取帮助