在近期“2017陆家嘴新金融全球峰会”上,红杉中国专家合伙人、原阿里巴巴集团副总裁、首任阿里数据委员会会长车品觉于会后接受了《陆家嘴》杂志记者的专访,讲述了他与大数据之间的渊源和对于大数据行业现状和未来发展的看法。
数据的本质不在于数量
《陆家嘴》:您为什么对数据感兴趣?
车品觉:说起来有些奇特,从小我就很好奇未来。长大以后我便开始探索有没有一种方法,无论量化与否,能让我早一点比别人知道这个世界的未来。
我大学的毕业项目是做外汇的预测,当时连我老师都讶异我为什么要挑选难度那么大的项目,因为我的专业是计算机,完全可以选一个在我能力范围内的项目去做论文,而非超出能力范围的。但我一直有一个想法就是只有做自己喜欢的事情才能做好。所以,在大学期间,通常当我的老师布置给我一些编码任务的时候,我只喜欢写两种,一种是病毒,另一种是预测。幸运的是,恰好因为这个毕业项目我顺利拿到了很多人都梦寐以求的汇丰银行的录取信。
后来,我离开了汇丰去做产品经理。我是一个没有数据不知道怎么做产品经理的产品经理。从香港电信到MSN到eBay,我都是一进去就问数据在哪里,而且我在做每一个项目的时候都对数据布点是十分清楚的。其实这些都能归咎于一点,我好奇未来的初心。
《陆家嘴》:您认为数据的本质是什么?
车品觉:在《数据的本质》一书中,我其实有讲到,首先数据不是要大。数据更像是一个拼图一样,每个拼图都有一个主题,我们需要根据场景去判断你的数据到底够不够,而不是在于数量多不多。
这些数据有了以后,你就可以开始做数据引擎。什么叫做数据引擎?用简单的话来解释就是,你有一个任务,这个任务会产生更多的数据,这些数据又会帮助你把任务完成得更好,这样一来就会形成一个循环。然而,不是所有的场景在这个循环里都能走得很顺利。在这个循环里,很可能会有断点,也就是一些数据的空白,导致这个循环不能顺利运作。一般来说,断点越少,循环越快,算法优化越快。
《陆家嘴》:现在您看到数据行业的哪些问题?
车品觉:现阶段,人们已经广泛意识到了数据的价值,因为有价值,数据本身的保护在现阶段变得特别重要,包括有没有人为了数据的“多”或者造成某种影响在数据里面灌水。我觉得整个数据行业是需要整治的,未来我们将会看到更多的治理机构出现。
另外,人工智能发展到现在,狭义的人工智能已经成功了 ,因为它所需要的数据量相对比较少,但是当扩大到广义的人工智能时,它所需要的数据的数量和质量会出现一个非常大的跨越,这时大数据就需要不断信息化、被治理。我们非常期待下一个新科技的出现。
如果你问我未来几年会看到什么趋势?我认为,未来几年机器人将会充斥在这个世界的不同角落里,只是这些机器人并非有四肢,而是有着不同的形态。所以与其说是机器人,不如说是机器智能与人之间的交互,在未来几年一定会大量出现。
数据隐私问题尚待解决
《陆家嘴》:哪些行业可以从大数据挖掘中受益?如何从海量数据里找到商业活动中最有价值的数据?
车品觉:总体来说,第一个是广告及媒体行业,因为广告和媒体自身的特殊属性和形态变化本身就需要更精准的用户数据群;第二个是金融行业,金融行业在识别一个人的征信方面就像是放款和借贷中的中转站,需要大量的用户数据;第三个是医疗行业,医疗行业应该在这几类行业当中是对人类是最有意义的。这并不是说前两者没有意义,只是医疗行业致力于让每个人更长寿、更健康,能让人活得更有意义;第四个是政府事务,政府为了提升和改善公共事务使用大数据,本质上和企业利用大数据提高利润是同一个道理。比如说在铁路修建等方面,大数据如何去赋能整个中国的经济,这一点我觉得是要爆发的,但是具体在哪个时间节点尚不清楚。
《陆家嘴》:您认为大数据时代下,企业应该如何守护用户的隐私?
车品觉:之前我在美国的时候,见到一个在隐私问题上给美国总统提意见的专家,当时和他对于这个问题也进行过深入的探讨。他说,关于个人隐私会有一个颠覆性的变化,这一变化在欧洲已经开始了,现在美国开始紧随其后。比如说,当用户使用某一个应用时,都会和应用方签订一个协议,表明自己同意将自己的数据交给应用方来改善用户体验,但大部分人都不知道自己同意的是什么,而仅仅是点击了“同意”。美国的法律对此准备有所修改,这可能会改变大数据产业使用数据时的权利。
互联网数据分为可识别数据和不可识别数据两种类型。有的数据能够识别出来使用主体,有的识别不出来。遇到不可识别数据的时候,你不能完全知道使用主体是谁,也没有办法告诉他你是否同意。这是一个比较头疼的问题,现在美国正在对这一块进行讨论和改善。
还有另一个问题就是,数据的拥有权在谁手里?之前大家对数据拥有权是用实物来制定法律,后来发现这条路行不通。数据的奇特之处就是看见就看见了,不在于你拿着还是我拿着。
涉及到隐私问题,大部分用户更多地是希望在隐私和数据间找到一个平衡点。你拿到我的数据,是需要用一些好处来交换的,数据分享是互惠互利的。你用我的数据却不告诉我,这样是不行的。美国有些法案,个人数据的隐私问题不是放在单独的方案当中,而是放在行业里面。为什么放在行业里面?因为个人隐私和行业有关,如果是卖药品的,个人隐私的监管会非常严格。如果是游戏类的个人数据,则会相对简单一些。而欧洲,整个法律体系是一样的,不分行业。欧洲人认为,隐私是一个人的底线。而美国,认为价值和隐私之间可平衡,在中国,现在这个问题也越来越受重视。这些都是未来亟待解决的问题。