你知道「河蟹」(和谐)吗?你知道「8平方」和「VIIV」(六四事件)吗?如果你是资深乡民,那你可能对这些词不会太陌生。很多如上列的网路用语,都是中国网民发想出来的创意,目的是避免留言被删除。在中国,除了无法使用Facebook(要使用人人)、Google(要使用百度)或YouTube(要使用优酷)外,大家都知道中国会对网路上的言论进行管制。当你看到「这个网页无法开启或载入」时,表示那则发言可能已被中宣部(中共中央宣传部)删除。

在中国专门负责言论管制的中央机关是中宣部。简单来说,中宣部管制言论的方式有几种,一是直接将网站屏除在防火牆外,只要你人在中国的网域内都无法登入这些网站(像是上述的网站);二是针对某些敏感关键字(像六四),官方会透过侦测系统自动删除;第三种,就是透过人工手动删除(谜之声:中宣部究竟聘用了多少人在做这项工作?)。

若说绝大部分的言论都必须透过手动删除,那究竟哪种言论会被挡下呢?如果你去问一个中国人,他可能会跟你说只要不要触碰太敏感的议题应该都不会有问题。那究竟,哪些议题算敏感?哪些议题又能安全过关呢?是只要出现反政府发言,中宣部就会「河蟹」那则发言吗?

这个人人好奇但却只能从外围臆测答案的问题,哈佛大学的三位政治学研究者(Gary King, Jennifer Pan, and Margaret Roberts)透过史前无例的资料,提供了我们最新的答案。他们的研究显示,跟我们想的不一样,骂政府并不是一则发言是否会被河蟹的标准。相反的,被中宣部系统性打压的发文,是隐含可能召集群众走上街头的讯息。换句话说,中共当局并不太鸟你在发文中是支持或反对它,只要你是在家裡打嘴抱就好,它在意的是这些发言是否真的有可能造成具体的抗议行动,因为抗议或上街头才会对政权造成实质的威胁。因此当一则发文有可能引发、召集、或令人联想到以前曾经发生的抗议事件时,这则发文被删除的机率就会提高,就算言论内容是支持政府也会被删除。

这项研究不仅结论劲爆,研究方法也相当新颖,因此分成了两篇,分别刊登在顶尖的《美国政治学评论》期刊(American Political Science Review)以及《科学》期刊(Science)。这些作者一共是透过三种不同的研究方法而得出这项结论,三种研究方法分别是:电脑辅助的文本分析法 (computer-assisted text analysis)、实验法(field experiment)以及观察参与法(participatory observation)。


首先是电脑辅助的文本分析,在2011年的上半年,作者透过自行设计的软体与程式语言,撷取将近1400个中国社群网站的发言,由于软体的自动设 定,因此得以在每一则发言一跳出来的瞬间就自动撷取,远在中宣部能将看不顺眼的发言手动删掉前,这些发言都已被下载并储存。为了知道哪些则发言遭到下架的 命运,作者透过程式语言让电脑能自动侦测,定期连回各个网站,去比对哪些发言被删掉了。

不过,在浩瀚的网路海中下载所有的发言并不切实际,因此作者採取分层抽样法,在现有文献的基础上,先选了85个不同的主题,按照政治敏感度分成高、 中、低三类。举例而言,与艾未未相关的发言属政治性高的议题;一胎化政策算是敏感度中等议题;线上游戏算是政治性低的议题。接著他们替每个主题设定关键字,由电脑去将含有关键字的每则发言都下载下来。用这个方式,在半年内作者总共蒐集到了三百多万笔发言,然后从中随机抽样十二万笔发言进行分析。除此之外,作者们也针对挑选了几则时下的新闻做更详细的追踪(例如:薄熙来与谷开来的政治事件)。

根据作者的分析,中共在言论控管的执行上非常有效率。当重大的政治事件发生时,争议性言论在24小时之内就会被予以删除。不过并非是所有的发言都会被删除,纯粹与新闻或政策相关的发言只有1-4%的会删除,但若发言涉及抗议或上街头等集体行动,平均有27%的发言会被删除。

作者按照发言被「河蟹」的幅度去排列各个事件,同样发现河蟹幅度最高的几个政治事件皆与抗议事件相关(例如:内蒙古的抗议、深圳的抗议、艾未未被捕…等),而且皆在事件发生的高峰(例如抗议的当天或艾未未被捕的当下),前置网路与删文的幅度也最高。

除此之外,作者们另外发现有两个主题,会持续且高频的被删文。其中一个不令人讶异,是与色情有关的内容;另一种也会被「河蟹」掉的发言比较有趣,是研究者发现,当发言内容涉及诋毁负责控管网路言论的情报人员时,那则发言从网路上蒸发的机率也会变高。

为了证明这些观察到的删文模式的确符合假设,也就是执政者并不怕诋毁政府的言论,怕的是有可能煽动人们上街头的言论,作者们接著採用了实验法与观察参与法去重新建构中国政府箝制言论的逻辑。

在实验法上,秉持了实作的精神,作者们直接在中国各大社群网站都注册帐号(每个网站注册两个帐号,总共选了100个网站),聘请(不知多少个)研究 助理,随著中国的时事发展,在事件发生当下随机在各个社群网站上发言。事后,透过他们已经有的电脑软体,让软体用同样的方式逐一比对哪些发言被「河蟹」了,哪些没有。实验法同样印证了他们的假设。

不仅如此,作者们最后甚至直接出资,在中国开设一个社群网站,实地和当地协助社群网站架设的公司合作,深入的透过架设网站的过程中,去观察并了解「河蟹」一则发文的逻辑、可以有的选项、以及步骤1。

透过这三种不同研究方法的交叉检验,得到的结论仍旧一样,那就是:中共政府脸皮其实很厚,并不怕你骂它,只怕你真的走出来抗议拆它的台。


后记

文章的最后,想提供一个不负责任的小八卦,那就是作者之一Gary King在演讲场合自述,他一开始并非是对中共的言论管制有兴趣,而只是想将自己研发出来的文本分析软体用在一个非英文的语言上,去测试软体的表现是否一 样好,但在检视软体表现的过程中,意外地发现某些抓下来的社群发文在数小时之后就从网路上消失了,经过比对,才发现消失的言论呈现出某种模式,因此也才发 展出后面这一系列的研究。

另一个小八卦是,King自己说,在这篇文章问世之后,中共高层有透过各式不同的管道让他知道,他们知道这篇学术论文的存在,并 且中宣部也曾开过一个会,专门讨论这篇论文。