`
mmdev
  • 浏览: 12926658 次
  • 性别: Icon_minigender_1
  • 来自: 大连
文章分类
社区版块
存档分类
最新评论

VisionMobile:虚拟助手(VA)- Siri背后的前沿UI技术(三)

 
阅读更多

三、虚拟助手的竞争

Siri仅是充分竞争市场冰山的尖顶。Apple的产品在去年引发一波模仿和创新,有数十个智能手机应用。在报告中将分析Siri及另外4个应用:语言识别专家Nuance公司的Dragon Go,i-Free创新工场的可视化驱动Everfriends,人工智能创业公司Dexetra的iris,和AT & T实验室的Speak4bit。

我们统计了Android和iOS上43个虚拟助手应用,他们总共有133.3M(1.333亿)次下载。其中94%的下载是Android应用。Google的语音搜索——只有一次语音动作被执行的VA——在133.3M的下载中占了超过81%的下载量。即使除去语音搜索,Android应用仍在剩余的24.2M下载中占68%的比例。相反,iPhone和iPad应用有接近90%是付费下载,占VA应用收入的86%。VA总体收入宣称有$1.8M,就潜力而言,目前的收入是微薄的。

前十应用占总收入的42%。Pannous的Voice Actions单个就接近总收入的36%,仅随其后的是QuanticApps的Voice Assistant和True Knowledge的Evi。除了Pannous的Voice Actions,进入前十的付费应用只有AIVC和Speakto。这前十VA应用要么是语音识别厂商的产品,要么出自人工智能研究创业公司。Google和Naunce几乎为所有的前十应用提供语言识别引擎,只有一个应用例外,使用iSpeech。很多VA厂商承认曾尝试其他的引擎,比较过多个SR引擎,但在语音识别质量或报价上不满意。

对于VA任务和特性,我们定义了一些通用标准来分析。大部分VA具备本地搜索和通用搜索,包括天气预报,语言拨号和短信,包括联系人查找和导航。关键的VA特性,在十大应用中有广泛的实现,包括个性化,本地语种,访问第三方和本地内容。这些特性要求在研发中增加与技术公司的合作或者增加投资,以及拓展本地第三方内容合作。由于语音识别仍需大量研发,应用通常是由单个公司驱动。

对VA进行个性化,使之更似真人。Siri的讽刺个性肯定有助于模仿真人。部分应用使用定制化头像来加强VA的个性化。另一重要差异特性是访问第三方内容,典型的例子是Facebook,YouTube,Spotify,last.fm,或者是需求很大的本地内容。本地内容和本地语言支持是互相关联的特性。例如,Siri在美国工作良好,由第三方内容支持。但是在其他地区由于缺乏本地内容,娱乐性大为减弱。

表:Android是VA的平台选择

Dragon Go:Nuance进入消费者领域

“Nuance正投资在直接面对消费者领域,因为我们相信此是研究人们喜好,将创新推向市场的最快途径”Matt Revis,Nuance公司移动和电视部门的副总裁。

Nuance为Siri提供语言识别功能,公司传统的收入主要来自垂直行业。在过去两年,它还是在直接面向消费者领域有竞争对手,如Vlingo和SVOX Mobile Voices。它推出的面向消费者应用,有Dragon Serach,Dragon Dictation和Dragon Go,其中Dragon Go是首个Nuance商标的成熟的虚拟助手。Nuance目前也在车载、电视、台式机和手提电脑上进行研究,认为VA技术可部署在从照相机到微波炉的所有消费者电子产品。Dragon Go音乐和推荐的内容合作伙伴们将它作为内容发布平台。Nuance还通过B2B商务为面向消费者应用衍生了价值消费者洞悉和语音识别引擎训练。与此同时,它不断增长的B2C商务使它和它的客户直接进行竞争。

Everfriends:第三方服务和个性化

“根据互动特性建立的对话逻辑有助用户更加投入”Kirill Petrov,i-Free的创始者之一,和i- Free创新工场的领导者。

i-Free创新工提供是VA应用EverFriends,它是位于圣彼得堡的i-Free公司的子公司,i-Free公司提供出产手机应用和游戏并进行IT研究和风险投资。它认为目前的声控助手只是基于云的个人服务访问的垫脚石,可用于任何设备,使用自然语言和互动头像在用户和VA之间建立更深关系。Everfriends的不同的收入来源是研究VA商务模式的好例子:87%的收入来自第三方合作伙伴,5%来自广告,8%来自头像定制化。i-Free创新工场的核心关注点是头像定制化,它期待定制化收入会增长强劲。i-Free预期VA生态系统将向开放语音和自然语言API演进,因而允许第三方开发者创建衍生服务。它部署的计费能力、允许第三方交易也是第三方服务收入增长的关键因素。

Iris(alpha):最大独立厂商的VA应用

“手机不仅响应你,还可以和你说话” Narayan Babu,Dexetra公司的CEO。

在几个小时之前,Dexetra推出首个虚拟助手iris版本,将Siri的功能部署在Android手机上。目前,Dexetra大部分收入来自广告,它视OEMs和运营商为关键合作伙伴。Dexetra已经和Micromax签订许可合同,允许这个手机制造商将iris的印度版集成到设备。Dexetra计划与运营商共同建立应用商店。Dexetra计划在2012上半能够达到500K设备销售。公司正在开发基于上下文识别的内部beta版本,并在将来开发语音广告。此外,公司的Friday项目正在优化NLP引擎,这是beta版本内的项目,可搜索用户搜索历史,计划在2012年6月推出。

Siri:第一个大众市场上的嵌入式虚拟助手

“Siri的推出在虚拟助手市场上产生巨大的冲击,最重要的是,它是第一个大众市场下的自然语言处理”,Kirill Petrov, i-Free的联合创始人,i- Free创新工场的领导者。

Siri的推出促进了对声控助手的关注,更重要的是,它引发一波虚拟助手的创新,包括可下载的应用和业界的研究。有不少VA试图追随Apple的成功,诸如“Siri的朋友”,“Android上的Siri”或者“类似Siri”。根据4月份出版的Parkes Associates研究报告,1/3的美国iPhone 4S拥有者每天使用Siri进行电话呼叫、短信或搜索。其余的用户中,有87%每月至少使用一次Siri,绝大部分是语音呼叫、短信和信息搜索。

Siri的语音识别由Nuance提供,它的搜索结果由Wolfram Alpha提供。Siri和其他VA的区别在于,Siri完全嵌入iPhone的UI和核心应用,包括联系人和日历。作为领头的手机声控界面,Apple的下一步将在其他设备集成语音UI,从平板和传说中的Apple TV开始。Apple也在努力增加所支持的语种,这是成功实现本地搜索以及更重要的本地内容交易的关键因素。我们也了解到Apple的Siri引起Google的搜索流量的下降,我们相信这会促使Google推出免费的跨平台竞争产品。

Speak4it:创建多种模式VA

“结合手势和语音带来巨大的机会,Speak4it是目前唯一的提供多种模式理解的应用”,Mazin Gilbert,AT & T实验室的技术研究部副总裁助理

Speak4it是使用语音和手势识别的本地搜索应用。由AT&T是实验室开发,使用AT&T的“Watson”人工智能平台。公司认为虚拟助手将在未来3-5年内成为所有类型设备的自然接口。为实现这个愿景,AT&T希望吸引第三方开发这到它的AI平台引擎。目前只开放给AT&T的合作伙伴的AT&T的Watson API库,计划在2012年6月开放给第三方开发者。AT&T将首先开放语音到文字,通用和本地搜索,语音邮件和SMS的库,而多模式能力(结合语音和手势识别)将仍只提供给其战略合作伙伴。AT&T将它的智能网络视为不断发展的VA领域的核心竞争优势。由于版权许可交易商业化的潜力,AT&T实验室在AI领域的600个专利肯定给它带来竞争优势。

分享到:
评论

相关推荐

    visionmobile:2012年跨平台开发工具报告.docx

    visionmobile:2012年跨平台开发工具报告.docx

    VisionMobile-生态系统的碰撞-英文版

    本文来自Visionmobile,原作者为Michael Vakulenko。报告不仅对移动操作系统的历史和演化过程进行了回顾,并对新的移动平台生态系统进行了分析,严重推荐下载。

    全球移动开发者报告:Swift崛起,物联网大火!

    VisionMobile发布2015年度第一期DeveloperEconomics调查报告。Swift语言表现强劲,平台盈利能力Android、BB10、WP差距小,开发者对物联网的兴趣非常高,其中智能家居最热门,而是否使用跨平台工具已成收入指标。近日...

    第五次作业函数第一题代码

    第五次作业函数第一题--

    基于深度学习的作物病害诊断内含数据集和运行环境说明.zip

    本项目旨在利用深度学习方法实现作物病害的自动诊断。作物病害是农业生产中的重要问题,及时诊断和处理对于减少产量损失至关重要。 我们采用深度学习算法,通过分析作物的图像,实现对病害的自动识别和分类。项目使用的数据集包括公开的作物病害图像数据集,如ISIC等,并进行了预处理,包括图像增强、分割和特征提取等。 在运行环境方面,我们使用Python编程语言,基于TensorFlow、PyTorch等深度学习框架进行开发。为了提高计算效率,我们还使用了GPU加速计算。此外,我们还采用了Docker容器技术,确保实验结果的可重复性。 项目完成后,将实现对作物病害的快速、准确诊断,为农业生产提供有力支持,有助于减少产量损失。同时,项目成果也可应用于其他图像识别和分类任务。

    机械设计CD驱动印刷设备step非常好的设计图纸100%好用.zip

    机械设计CD驱动印刷设备step非常好的设计图纸100%好用.zip

    tensorflow-2.7.2-cp37-cp37m-manylinux2010-x86-64.whl

    python烟花代码

    python烟花代码示例

    附件中是一个简单的烟花效果的代码示例: 在Python中,可以使用多种方式来模拟烟花效果,其中一种常用的方法是使用turtle模块,它提供了一个画布和一个小海龟,可以用来绘制各种图形。 这段代码首先导入了turtle模块和random模块,然后在屏幕上绘制了10次烟花爆炸的效果。每次爆炸都是由5个小圆组成,颜色随机选择,圆的大小也是随机的。 请注意,这段代码需要在支持turtle模块的Python环境中运行,并且需要有图形界面的支持。如果你在没有图形界面的环境中(比如某些服务器或者命令行界面),这段代码可能无法正常运行。

    商业化产品经理,到底如何实现产品商业化?.docx

    商业化产品经理,到底如何实现产品商业化?.docx

    Panduit 工业以太网部件内部销售指南

    Panduit 工业以太网部件内部销售指南

    Java版三维装箱代码示例

    在Java中,实现一个三维装箱(也称为三维背包问题)的算法通常涉及到组合优化和动态规划。这个问题是一个典型的优化问题,其中目标是在三个维度的限制下最大化价值的总和。下面是一个简单的Java代码示例,它使用动态规划来解决三维装箱问题。 请注意,这个代码只是一个简单的示例,它假设所有物品的第三个维度的大小都是1,并且没有给出如何回溯选择物品的完整逻辑。在实际应用中,三维装箱问题可能更加复杂,需要考虑所有三个维度的限制,并且可能需要更复杂的算法来解决。 此外,这个问题的解决方案可能需要根据具体问题的要求进行调整,例如物品是否可以分割、是否允许超过一个的物品等。如果你有特定的问题描述或者需要进一步的帮助,请提供更多的细节。

    常用品牌EPLAN部件库

    常用品牌EPLAN部件库

    单片机开发的教程.doc

    单片机开发的教程可以分为以下几个步骤: 1. 了解单片机基础知识:在学习单片机开发之前,需要了解单片机的相关知识,包括单片机的基本结构、指令系统、编程语言等。 2. 选择开发板:选择一款适合自己学习开发板的型号和厂商,通常需要关注开发板的性价比、开发环境是否友好等因素。 3. 学习开发环境:根据所选的开发板,学习相关的开发环境和使用方法,例如Keil、IAR等集成开发环境。 4. 掌握编程语言:单片机常用的编程语言包括C语言和汇编语言,根据实际情况选择其中一种进行学习。 5. 基础操作:熟悉单片机的引脚定义和IO口配置,了解单片机的启动代码,可以通过修改启动代码进行基本功能调试。 6. 综合实践:根据具体项目需求,进行单片机开发的综合实践。在实践中需要掌握如何编写程序、如何进行硬件调试、如何使用相关工具软件等技能。 下面是一个单片机开发的简单教程介绍: 首先,确定所使用的单片机型号和开发板类型。在这个阶段,需要查阅相关资料,了解开发板的规格书、芯片规格等基本资料。 其次,安装并配置开发环境。根据所选的开发板,安装相应的集成开发环境(IDE),并配置好开发环境。 接着,学习并掌

    Q1.ipynb

    Q1.ipynb

    (自适应手机端)IT网络建站公司pbootcms模板 互联网营销企业网站源码下载.zip

    (自适应手机端)IT网络建站公司pbootcms模板 互联网营销企业网站源码下载.zip

    Bematech 激光扫描器用户手册

    Bematech 激光扫描器用户手册

    激励视频接入文档.pdf

    激励视频接入文档.pdf

    java jdk1.8 202版本下载window linux打包

    java jdk1.8 202版本下载window linux打包

    Lite Beam M5快速指南 Lite Beam M5天线设置指南

    Lite Beam M5快速指南

Global site tag (gtag.js) - Google Analytics