禅之博客

---====收集和撰写一些有趣的文章====---

2006年12月18日

为什么在Google上搜索不到某些关键字(之一)

近来有不少人通过QQ发表google进行搜索过滤的信息,并建议中国人都使用baidu,在此,我想从这个问题进行澄清并引申到中国网络的审查制度问题。(本文部分资料参考自维基百科)




近来有不少人通过QQ发表google进行搜索过滤的信息,并建议中国人都使用baidu,在此,我想从这个问题进行澄清并引申到中国网络的审查制度问题。

在baidu和google搜索“6*4事件”或者“钓鱼岛” (我承认,这不是我们现在应该讨论的话题)有什么区别?前者会搜到很多结果出来,后者很大机会会显示该页无法显示,并且在短时间内不能登录google (我说的是在正常情况不加代理或加密的情况下)。
那么,这是否说明了google的亲美或亲日的性质呢?是否像这些人在QQ上说的那样“丑恶的美国鬼子企图从互联网上对我国进行信息封锁”呢?是否baidu就是客观的代表呢?好象上述问题的答案都是肯定的。

但事实并非如此。

现在让我为大家介绍一个可能初学者很少听甚至没听过的名词:防火长城(The Great Firewall)下面我简要地介绍一下这个GFW:
防火长城,正式名称中国防火墙或中国国家防火墙,指中华人民共和国政府在其管辖互联网内部建立的多套网络审查系统的总称,包括金盾系统和相关行政审查系统。一般情况下主要指中国对互联网内容进行自动审查和过滤监控、由计算机与网络设备等软硬件所构成的系统。


主要技术
从90年代初期,中国大陆只有教育网、高能所和公用数据网3个国家级网关出口,中国政府对认为具有颠覆性质的站点进行IP封锁,这是有效的封锁手段。对于IP封锁,用普通Proxy技术就可以绕过。只要找到一个普通的海外Proxy,然后通过Proxy就可以浏览自己平时看不到的资讯了。但网络封锁部门也就开始把人们常用的Proxy加入了IP封锁列表。(尤其在最近几年)



主干路由器关键字过滤阻断


在2002年左右,中国大陆研发了一套系统,并规定各个因特网服务提供商必须使用。思科等公司的高级路由设备帮助中国大陆实现了关键字过滤,最主要的就是IDS(Intrusion Detection System)--- 入侵检测系统。它能够从计算机网络系统中的关键点(如国家级网关)收集分析信息,过滤、嗅探指定的关键字,并进行智能识别,检查网络中是否有违反安全策略的行为。利用这些设备主要进行网址的过滤和网页内容的过滤,如果符合即定的规则,则向用户发送ACK-FIN,自动打断用户与服务器的会话连接,使数据流中断,而在终端电脑上会显示主机无法识别。不同的IDS甚至有可能在一段预定或随机的时间内试图阻止从用户主机发出的所有通信。


所以在访问境外网站时,如果数据流里敏感字符时,即会被提示“该页无法显示”,随后在5-15分钟的时间内无法用同一IP浏览此域名或IP地址上的内容,屏蔽时间据猜测和敏感词等级以及所属网站有关。 (这两段已经说明了我们为什么不能在google上搜索某些关键字并且搜索之后在一段时间内不能登录google了)。


关键字过滤的弱点就是对已加密的信息无能为力,而网址的关键字和网页的关键字都可以用不同的手段来加密,从而使这样的信息过滤系统从根本上失去作用。不同的加密手段也是后来所有突破网络封锁软件的基础。 (这是我们研发破网软件的理论依据)


“思科公司为中国特制了数据包级别的内容过滤路由器(content filtering router),而中国的路由器80%是思科公司的。”正在进行中的“金盾工程”是一个与Novell的合作项目。这个工程将包括生化监控、人工智能、自动识别等技术。


域名劫持


在世界上一共有十几个根(Root)级别的域名服务器,到目前没有一个安装在中国大陆,所以中国大陆方面不能从根本上控制修改域名。


2002年左右,中国大陆开始采用域名劫持手段,他们用路由器提供的IDS监测系统来进行域名劫持,防止了人们访问被过滤的网站。同时,为了防止高级用户自己直接使用有正常功能的境外的域名服务器,中国大陆也开始不断地封锁海外的DNS服务器,已经封锁了几百个北美的DNS服务器。
下面引用wikipedia 上的一些数据:


被管制和限制的网站不完全列表


所有境外的网站都受到关键词过滤的影响,出现偶尔不可访问(比如Gmail);大量色情的论坛或网站,所有民运、********在大陆被查禁的宗教的境外网站,台湾的大多数政府网站与论坛,绝大多数台湾的新闻网站,或综合网站中提供新闻的分站都被封锁。


被限制的境外知名网站:
维基百科及所有维基媒体基金会项目。


无法使用Google的部份功能:Google网站本身在大陆不可搜索敏感词。


Google网页快照功能大部分时间不可用(在2005年10月初解除封禁,但除去敏感站点,目前还不知道是否象以前一样是暂时状态。)。


Google 新闻台湾版;



(jason5ng32告诉大家:还有很多网站的名字一打出来就无法显示,所以我就索性不打了)



好了,说到这里,相信大家对于GFW已经有比较深的了解了,也应该很清楚为什么我们不能在google搜索“6*4事件”或者“钓鱼岛”了。


那么,在QQ上发布那样的信息的人的居心何在呢?一种可能就是这些人并不知道真相,令一种可能是,他们被baidu利用来做宣传。


相关链接:


为什么在Google上搜索不到某些关键字(之二)


为什么在Google上搜索不到某些关键字(之三)



标签:

0 条评论:

发表评论

订阅 博文评论 [Atom]

<< 主页