Siri推出时,万众瞩目;两年后,几乎没人再用。难道Siri仅仅是苹果的一个销售噱头吗?
文 | 沈凌莉
在讨论Siri遇到的问题时,我们首先要理解Siri究竟是什么。现在对它最大的误解可能就是,认为 Siri这类语音智能助手产品是由前端的语音识别、语义解析技术和后端的搜索组成的。事实上并不全是这样。
简单地说,智能助手产品是由三部分组成:前端的交互方式,也就是信息输入和输出的方式,比如语音是其中一种;中间的智能分析,相当于人的大脑;后面是数据库或者是获取方式,包括自有的数据库、第三方的数据库,以及搜索引擎等。
苹果的Siri目前是把语音作为前端的交互方式,这是和Nuance等合作来实现的。而苹果收购的Siri公司更核心的能力是在后端的智能分析上。
这确实是件很复杂的事,所以当最初投资 Siri项目之一的风险投资公司摩根塔勒合伙人Gary Morgenthaler说,“Siri的创始团队看到了未来、定义了未来并且顺利地迈开了通往未来技术的第一步,但被收购之后(苹果)Siri缓慢的商业化进程让我们这些创始团队感到非常失望”时,我不禁要问:这真的仅仅是个商业化的问题吗?
“对于人工智能来说,现在谈商业化还为时尚早,”小i机器人的创始人袁辉这样认为。他下这个判断是因为他在10年前就在人工智能领域做过了艰难的商业化尝试。
小 i机器人是国内最早的智能机器人平台运营商,成立于2001年。据其官方发布的数据,2004年到2007年倚靠微软MSN平台,小i的用户超过1亿,交互量达到100亿次以上,覆盖100多个国家。2007年小i机器人获得了包括英特尔投资、IDG在内的5家风险投资机构的千万美元投资。但是大量的用户并没有给公司带来太多收入。
有用户没收入,袁辉在很长一段时间内一直把原因归结为“小i没找到好的盈利模式”。后来发现,用户的快速增长实际上掩盖了小i最根本的问题——究竟满足了用户的什么需求?
袁辉说,“小i当时的目标和如今的 Siri一样,希望做成一个无所不知、无所不能的变形金刚。但这几乎是很难实现的”。首先,语音识别不是完全靠算法能解决的,无论是Nuance还是科大讯飞都花了很多年去研发。而后边的智能分析和数据库密切相关,二者的匹配和系统构建是非常核心的,既包括开发互联网的信息还包括机器学习,这需要大量的整合和多年的积累。“时间是智能机器人最大的壁垒,而这不是靠开放平台、靠人多、钱多就能解决的,必须先知道要怎么做才行”。2009年,小i机器人全面转型到公司(B2B)业务上。
或许,这样一款产品,真的不能等在实验室里进行完各种微调和全面测试再推向市场,起码第一步它必须接触到从音质到自然语言解读的尽可能多的变化。
败给Google Now?谈胜负还早了点
但既然推向了市场,总免不了比较。Google推出语音数字助理Google Now,用户发现,暂且不提人工智能,仅从语音搜索来看,Google Now的准确率比Siri更高。于是,问题来了——谁能代表移动搜索的未来? 在这一点上,面对PC端搜索的老大,且Google有多年积累的知识图谱做后盾,确实让人为Siri捏一把汗。但移动搜索和PC搜索能一样吗?
“移动搜索有很强的场景性,不像桌面搜索是用关键词搜索大量资料,然后慢慢看。所以并不需要很深的知识图谱,反而对非结构化的、实时产生的数据有更大的需求。”智问创始人朱胜这样总结移动搜索的特征。
为了建立非结构化数据库,国内另一家语音助手类产品“虫洞语音助手”除了通过网络抓取、第三方合作,还开设了社区。虫洞的联合创始人郭家的总结是,“作为助手类的产品,长尾信息的组织是一大关键,它很难通过通用型搜索产品获得。”
显然,在非结构化数据上,苹果 Siri和Google Now都在以不同的方式发力。Siri与很多不同的服务集成在一起提供搜索结果,包括Yelp、OpenTable、Wolfram Alpha、Yahoo,以及Twitter和微软推出的搜索引擎Bing;Google Now也做出了重大革新,用户不再需要主动去搜索信息,谷歌会在适当的时候把信息提供给用户。这相当于搜索引擎在帮助人们做出决策。
从这一点来看,Google Now和Siri的目标都不仅仅囿于移动搜索,而是智能交互,搜索只是其中的一部分表现形式。最终,二者将殊途同归——整合数据库,提高智能分析能力,让机器主动学习理解人、服务人——只是他们依托各自现有的优势从不同角度在往前做。在这个目标下,目前二者都发展得比较初级,谈胜负还为时过早。
千万别把Siri仅仅当成一个语音助手
其实,Google Now也有难题,就是落地难。对于Google来说,谷歌的手机厂商和运营商总是很难及时向用户提供Android系统更新。而对于苹果这样一个软硬件结合的公司,并拥有封闭的生态系统,将Siri的能力落地并推向消费市场正是其优势所在。
“千万不要把Siri仅仅当成一个语音助手,它是苹果整个产品线包括操作系统演进的方向。”正如朱胜所说,苹果在逐渐把 Siri整合到iOS操作系统和硬件产品中去。2012年6月,苹果公司发布了iOS6,这一操作系统对汽车行业最大的意义在于将地图、车辆控制和 Siri语音功能相集合。苹果为Siri 打造的 Eyes Free驾车系统也已经日趋完善,目前已经有多家知名汽车厂商加入 Eyes Free阵营。
可见,苹果一定会充分发挥其硬件的优势。相信不久以后,Siri会横跨苹果整个产品线。以Siri和iCloud为依托打穿不同的设备间的连接,与App Store一起组成苹果的生态系统。
同时,苹果会发挥渠道和入口的作用。Siri将不仅仅是一款应用程序,它同时也是一款自然用户界面系统,占据用户与数字设备和互联网的第一触点,它使得服务器端可以整合大量开放API的数据。而这些数据是无法通过网络抓取的方式获得的。被整合进苹果操作系统中的Siri,可以方便被第三方调用。
对于苹果来说,最重要的是通过 Siri把人工智能带进了现实生活中。苹果更可能走的一条路径是,打造智能交互的底层架构,由它来提供人工智能助手通用层面的支持。在此之上,将产生更细分、垂直的智能化应用和服务,将人工智能助手渗透进生活的方方面面,而这将是中小创业者的机会所在。而基于Siri的智能大脑和数据库,智能服务前端的交互方式也会变得更加多样,除了声音,比如图像、视频、脑波等都可能成为信息采集和输出的方式。[page]
本期观察家
江涛:科大讯飞副总裁
科大讯飞是中国最大的中文语音技术提供商,联想、华为、东软等数百家企业,智能360、虫洞语音助手等应用均采用讯飞的语音识别技术。
朱胜:智问创始人
朱胜创业七年,一直围绕着人工智能领域,智问专注中文智能语义技术,目前三块业务是智能客服、手机助理和语义开放平台。
李志飞:出门问问创始人
李志飞在博士期间的研究方向为智能机器人翻译,后来加入谷歌总部担任科学家,从事机器翻译的研究和开发工作,出门问问产品形态更接近Google Now。
郭家:虫洞联合创始人
虫洞是在国内Android平台上目前累计下载量位列前三的语音助手类产品,并开发出语义识别引擎“虫洞语义云”,在后台数据库的建立上也将社区作为一种数据采集方式。
袁辉:小i机器人
袁辉在2003年起推出面对个人用户的智能机器人服务,小i机器人是智能机器人技术提供和平台运营商,用户超过1亿,2009年全面转型到公司(B2B)业务上。
李传丰:智能360联合创始人
智能360是在国内Android平台上目前累计下载量位列前三的语音助手类产品。自主研发语义解析技术,并推出语义解析“语义云”,尝试B2B与B2D的商业模式。
观察一:Siri为什么不好用?
郭家 ● Siri可能也还没完全想清楚生活助手类产品的作用。看Siri的广告,目前为止还都是两个使用场景,开车和跑步,这说明苹果还把它定位于帮人们解放双手进行语音控制,做的还是查天气等一些很基础的功能。但智能助手的作用远不止于此。在数据库的组织上,以目前的科技水平来讲,有些信息还必须得实时发动人来提供,苹果的数据库资源也是个问题。有些提问即使机器听懂了,但没有数据来源,依然不能给出很好的解答。更何况苹果这种通用型的定位,更难以无所不知。
李志飞 ● 从产品角度来说,Siri目前是个失败的产品,实际上用的人并不多,顶多“调戏”两句,但真正问严肃的问题,发现大多解决不了,实用价值并不大。
袁辉 ● 无所不知、无所不能的智能交互的机器人,现在没有一家公司有把握能做出来,这是Siri现在遇到的最大问题。这跟商业化没关系,也不是资金条件的问题,主要是技术的挑战。
朱胜 ● 苹果只是把Siri做成一个通用型的生活助手。但实际上,现在任何一个计算机系统还不能包含世界上所有的知识和信息。
观察二:苹果推Siri,只为卖硬件?
江涛 ● Siri最初承载着“do engine”(执行引擎)的理想,但这个初衷在苹果这样的公司很难实现。Siri是iPhone 4S最大的卖点,帮助它多卖出了很多设备,这在财务投资的角度已经是很成功的了,是苹果收购Siri的最大现实价值。苹果本质上不是一个互联网公司,而是一个硬件销售公司。
朱胜 ● 苹果推出Siri是为了卖4S手机。美国影视作品大量塑造未来人机互动,看到Siri的时候,人们自然就会想去挑战它。但苹果低估了用户想要挑战它的欲望。
李志飞 ● 像苹果、Google、微软这样的公司,可能很难决心只做一个很垂直的产品,从品牌价值、商业价值等方面考量,垂直型的产品不是它们的目标所在。什么都想满足,没有清晰的方向,在技术实现上的难度自然很大。
观察三:Siri能在竞争中取胜吗?
郭家 ● Google 也推出了自己的对话助手 Google Now,我认为真正能做成智能助手的是Google这样的互联网公司。Google的理念一直是“让用户快速获取信息”,它其实一直在做语义分析。
李传丰 ● Siri发展缓慢,与苹果对它的定位有很大关系。和Google比,苹果在技术上的追求可能稍小一些。苹果的特点是把商业和艺术结合,长于设计。它是个很商业化、很理性的公司,Siri对它的意义更大在于帮助销售硬件。而技术积累不是一日之功,Siri在苹果的发展会受到一些限制。
观察四:Siri如何改进?
朱胜 ● 苹果首先要把硬件优势充分发挥出来,在手机控制方面,比如查电话号码等,这是它的强项。
李志飞 ● Siri的产品包括三部分:对话、语音控制和信息查询。首先,是回合式的对话而不是像Google Now那样直接的语音搜索。我不认为回合式的对话是个合适的形态,主要是目前在技术实现上难度很大。有了对话、上下文的理解等,用户的要求立马就不一样了,这种设计实际上会把用户的预期抬得很高。
郭家 ● 语音助手类产品契合互联网“得屌丝者得天下”的特征,这类产品在盈利等方面还需要一个等待期。这类产品现在公认的状况就是活跃度低,像搜狗语音助手最近开始推送新闻,可能是为了提升活跃度而增加流行的元素。
江涛 ● 苹果的最大长处就在于软硬件的整合。个人助手类产品在苹果、Google和Nuance及科大讯飞这三种公司中发展路径是不同的。