说到微博,相信经常上网的人都不会陌生。作为一个基于用户关系的信息分享、传播以及获取的平台,这种140字左右的迷你博客模式从2009年开始进入中国人的网络世界到现在,已经逐渐成为中国互联网最热门的应用。微博在多个领域的融合活跃将更加促进互联网时代的繁荣,至2010年末,中国移动互联网用户接近3亿,微博用户已超1亿,不管微博的用户数量还是发展速度还是影响力上来讲,微博这种互联网应用的成长速度都可以称为杀手级。
从技术上分析,微博作为一种分享型迷你博客,其技术创新的意义远远低于电子邮件、搜索引擎、IM软件等前几代的杀手级应用,但它们都不约而同地具有以下两个特点:1、让用户能非常方便的完成以前不能完成或是很难完成的事情(创新性);2、建立在以前成功应用的基础上(继承性)。讲到这里,相信有不少朋友会问,下一个互联网的科技趋势是什么呢?笔者的答案是:人机互动式的语音应用。
语音识别技术作为一种成熟的技术,相信大家也不会陌生,在六十年代,IBM推出了第一个名为“Shoebox”的实验性的语音识别系统,开始了对语音识别技术的研究,时至八十年代,Dragon Systems为当时的DOS计算机推出了第一个语音识别应用程序“Dragon NaturallySpeaking”,语音识别技术已经进入了实际的应用阶段。
在当时的背景条件下,语音互动确实在处于初级技术层面阶段,但Dragon Systems等语音实验室却一语既往地都投身其中。时光飞逝,在二十年后的强调人机互动的今天,让电脑、手机、汽车等设备“能听”、“能说”、“能反映”是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比其他的交互方式有更多的优势。
从手机的语音应用发展历程分析,智能手机的高速发展和3G网络的普及,这是语音应用发展为杀手级应用的导火线,智能手机强大的处理能力让语音应用能在不同的程序中实现语音交互操作,而3G网络则为语音云计算奠定了良好的基础,从杀手级应用的必备条件上分析,语音应用能满足手机用户在非静态条件下的输入和操作需求, “说”一直是人类的第一反应模式,也是适用范围最广,使用成本最低的互动操作方式(创新性),手机在发明之初就是以语音通话主要手段,在其基础上发展语音应用的多样化,确实有着得天独厚的扩散优势(继承性),而更重要的是,语音技术可以与其他应用程序进行协同工作,让其应用面大大提高。事实上,目前手机语音应用正如雨后春笋般出现,笔者以iOS为例,列举几个出色的语音应用:
语音类搜索应用:Dragon Search
Dragon Search是Nuance推出的,使用Dragon NaturallySpeaking语音识别(上文曾提及的语音识别技术引擎),从而进行在线搜索的应用程序,通过语音同时搜索包括Google、新浪爱问、淘宝、优酷、大众点评并的搜索引擎和内容资源。因为其语音识别的效率很高,而且做了很好的本土化工作,使用起来非常方便,界面上方能选择不同的搜索引擎,而且Dragon Search已经内置了一个移动浏览器,点击就能得到搜索结果,非常方便。
语音类翻译应用:Google Translate
作为Google 推出的语音类应用,用户只要以一种语言说出一个单词或短语,即可看到或听到另外一种语言的对应翻译。该应用目前支持15种语言的语音输入,可以被翻译成50种语言,合成音频输出则支持23种语言。
语音类游戏应用:Voice Fantasy(最终幻想语音版)
非常经典的游戏,最终幻想语音版,游戏的设定非常新奇,通过语音来创造主角进行游戏,创意十足哦,不用手动动嘴就能和敌人战斗。
语音类音乐软件:Shazam
作为一款专业的语音识别音乐软件,Shazam具有识别音乐的功能,可同步音乐到网络,在Twitter和Facebook等SNS网站共享识别的音乐。
语音类(听写功能整合)软件:Dragon Dictation
为什么笔者要这样形容Dragon Dictation这个语音应用呢?原因很简单,作为一个专业的语音识别软件,Dragon Dictation无论在中英文语音识别和单词长句的识别中都已经达到流畅的输入水平(普通话不好的朋友识别效率可能会差一点),更重要的是,其语音识别的范围已经涵盖了我们手机中的基本应用,通过其内置功能,你可以通过Dragon Dictation的语音识别功能发送电子邮件、更新个人SNS、编写手机短信,甚至玩微博。
通过以上应用程序的列举,我们不难看出目前语音应用在智能手机上呈现的蓬勃的发展趋势,特别是语音识别技术应用与移动SNS和微博等热门应用相结合,更是让其得到充分地发展助力,沟通作为语音技术的根本特性,语音应用与微博和SNS几乎可以完美结合,可以想象一下,在你想发微博的时候,不再需要用手机键盘输入文字,只需要通过Dragon Dictation等语音识别技术软件,就可以用“说”的方式发送微博,这样,人与人的沟通,不是更加亲近和自然吗?
更甚者,语音技术已经跳出程序应用类的范畴,Nuance基于VoCon 320开发的Vocalizer for Automotive的全新中文语音识别及合成技术的车载解决方案,用户只需“君子动口不动手”,使用语音便能轻松实现车内多种功能的控制,例如目的地输入,打电话,发短信,音乐播放等。放眼未来,从我们的生活出发,如果能把语音应用整合到我们的生活中,让手机、电脑、汽车等一系列产品都可以通过“说”来进行互动,不难想象语音产业将会迎来爆发式的增长阶段。
诚然,语音应用要成微博后的下一个科技趋势,还需要时间去孵化和推动。但语音识别技术作为一种成熟的技术,相信在将来,会有越来越多语音类软件将融入到我们的生活,让我们的生活更加方便顺心,如果你对语音识别的效率有疑问,不妨试用一下上面列举的软件,必会发现语音技术原来已经离我们很近很近了。