谷歌几个月前发布微博社交网络Buzz时,公司夸口说,基于Gmail以及其他服务显示出的通信记录,采用一些算法将用户联系起来,该网络已经自动生成了。
然而,许多用户踟蹰于建立他们认为被误读的社交关系,这迫使公司急刹车,将Buzz服务变得少些自动化,多些用户控制权。
尽管发生了这样的事件,依然有许多公司对通过电子邮件和社交网络通信记录自动判断用户的社交关系越来越感兴趣。例如,IBM的Lotus部门提供一款名为Atlas的产品,它构建来自公司通信的社交数据,而微软则研究利用这样的数据自动将雇员接收的电子邮件进行优先排序。但是研究者们表示,根据通信模式产生和分析社交网络还存在许多尚待解决的问题。
在北卡罗来纳州罗利市举办的WWW 2010会议上,一组来自雅虎研究者在论文中指出,在构建一副准确的社交网络图成为可能之前,研究者们必须先对于怎样才算两个人之间有联系给出更好的定义。两个只通过一次电子邮件的人应该认为是朋友吗?又或者,应该经过10次通信他们的联系才算建立起来?
“你不要直接观察关系本身,而要观察通信事件,”参与该研究工作的雅虎研究院社交动态组研究员杰克·霍夫曼(Jake Hofman)如是说。根据对于通信事件的不同解读,算法会推断出大相径庭的社交结构。这样的网络可能更适合于不同的环境。比如,一个基于相对较少通信的网络可能颇为适合分享标签新闻等。更为频繁的通信则可能与为分享私密信息设计的网络契合得更好。
“我们(对自动生成社交网络)设置的阀值大部分来说都是武断的,”密歇根大学信息学院和复杂系统研究中心的助理教授拉达·阿达米克(Lada Adamic)如是说。阿达米克指出,还有一些问题并未在雅虎的论文中提出。比如,她说,大多数算法定义网络太过简单化——人们要么有联系,要么没有,缺乏对真实生活中常见的灰色地带的描述。
她表示,虽然可以不断完善算法,但由于现有的数据无法涵盖全部的模式,所以错误会一直存在。比如,两个人可能没互相发过电子邮件,但他们可能定期在电话上或者见面聊天。
不完整的信息足以打消自动构建个性化社交网络的念头,埃里克·吉尔伯特(Eric Gilbert)如是说,他今年秋天时将成为佐治亚理工大学交互计算的助理教授。算法可能会漏掉关于最亲密的联系的定义,因为它们很可能是面对面的沟通而非数字通信——吉尔伯特将这样的问题称为“伴侣问题”或者“室友问题”。
吉尔伯特认为,更详细地研究网络结构能在一定程度上弥补这一缺陷。比如,一对已婚夫妇通常有很多共同的朋友。不过他也承认,这并不能解决所有的问题。
配偶问题的另一方面是在Buzz推出时颇为突出的“前任伴侣问题”。当算法将一度频繁通信,却不再也不希望这样做的两个人——比如分道扬镳的恋人联系起来时,这个问题就会出现。吉尔伯特解释说,自动发现像分手这样的事件很难,因为围绕这个问题的变量太复杂。两个人不再联系可能是因为其中一个太忙,或者去度假了。算法必须检查对比复杂的行为随时间如何变化,并在相关联系的上下文中理解它。
曾经在雅虎研究院,现在在微软研究院工作的孟蒙·德·乔杜里(Munmun De Choudhury)表示,为了使算法更好地理解社交关系的本质,需要做更多的研究。比如,频繁互通电子邮件可能表示一个很积极,或抑或很消极的关系,进一步的分析可能助算法一臂之力确认两者之间的差别。
最终,阿达米克表示,我们的问题是自动产生网络时产生多少错误属于能容忍的范围。在一些情况中,挖掘电子邮件和其他通信记录的算法运用效果不错,在提供关系概览或者过滤信息时可以节省时间。
在将消息排列优先顺序或者建立供用户稍后确认的隐私设置时,自动推断社交关系的性质可能很有用。然而,“你不会想要细致过度的定义,那样会让人毛骨悚然,”吉尔伯特提醒说。
所有的研究者都认同,允许用户清除算法引起的错误至关重要。“你始终要把人的因素考虑进来,”阿达米克如是说,“你可以让算法准确度达到95%,然后让用户自己去处理剩下的5%。”
社交网络能自动生成吗?
评论
8 views