警告。該日志文字內容很多,容易造成瀏覽器崩潰。
里面有很多低俗詞匯,可能引發GFW探針,請自帶代理訪問本文。
前幾天Google事件轟轟烈烈的時候,大家都建議Google公開支共提供給它的關鍵字列表,順便也就向全世界拿出了支共干擾網路言論的直接證據,于是乎可以公示這一丑行云云。
可見大家對身邊的事情是并不那么關心,只顧著上twitter追求真理去了。其實你開過論壇或者備案過網站,都會拿到過一份關鍵字列表,更不用說是訪問量極大的verycd了。這份關鍵字表絕無可能是工作人員自己編撰的,原因很簡單:第一他們也不會這么無聊,第二他們也知識面不可能如此的廣。
前次的1.1.11版本的wordfilter.txt文件在\easyMule\config的目錄下。第一次啟動后,是什么都可以搜索的,然后才會建立這個敏感詞文檔。軟件始終在appdate目錄下沒有生成什么,比較詭異。
鄙人去年在部落格用一篇列舉verycd關鍵字的文章騙了一大堆搜索。
在google Analytics (分析)看各種變態佬根據各種變態的搜索來到我這里,曾經是去年我茶余飯后的一大樂趣。
在未安裝的時候,用7z打開它的exe目錄,可以看到conig目錄底下是有個wordfilter.txt文件的。但打開之后失望的發現。這是個字碼表,幾乎包括了所有的漢字和大小寫英文字母,由于沒有西歐字符,所以德文肯定是一個也沒屏蔽。
顯然是另有一個加密算法。由于這個閹割版吸血電騾也是開源的,所以我輕松找到了他們的加密代碼:
摘錄一些精華的,給大家鑒賞鑒賞:
/*if (strSearch.GetLength() > 20)
{
return false;
}*/
for(int i = 0; i < m_count; i ++)
{
if(KMP_Match(strSearch, m_filterwords[i], m_kmpvalue[i]))
{
//AddLogLine(false,_T("KMP_Match"));
return false; // 关键词命中了,被fliter了
}
}
//AddLogLine(false,_T("漏掉的"));
return true;
}
上面那段是生效判斷
底下這個解釋為什么單獨刪除wordfilter文件沒有用
if(m_filterall){
//AddLogLine(false,_T("m_filterall"));
return true; // 检测不到文件,或者读取错误的情况下放弃过滤
}
if(m_count == 0){
//AddLogLine(false,_T("m_count == 0"));
return true; // 文件是空的时候,放弃过滤功能
}
CString strSearch = ((CString)sReduceString).MakeLower();
//vc-huby: 过滤中文字符超过15字符
//CString sReduceString2=strSearch;
int k=0;
現階段,破解辦法是在conig文件夾下面建立一個名為wordfilter.txt和一個wordfilter.new的文件夾
當然,更好的辦法是和我一樣用xtrme客戶端。不用這種萬人唾棄的吸血騾子。
加密的方式在WordFilter.h中
#include <tchar.h>
#ifndef WORDFILTER_H
#define WORDFILTER_H
/////////////////////////////////////////////////////////////////////////////
//
// WordFilter.h : interface of the CWordFilter, used to filter limited words
// Added by Soar Chin
//
/////////////////////////////////////////////////////////////////////////////
#if _MSC_VER > 1000
#pragma once
#endif // _MSC_VER > 1000
#define FLITER_FILE _T("wordfilter.txt")
class CWordFilter
{
private:
int m_count; // Count of limited words
TCHAR ** m_filterwords; // Limited words for filter
int ** m_kmpvalue; // KMP Next Value
bool m_filterall;
void Free();
public:
CWordFilter():
m_count(0), m_filterwords(NULL), m_kmpvalue(NULL), m_filterall(false) {} // Init values
~CWordFilter();
void Init(); // Init class and read from data file
bool VerifyString(const CString & sString); // Verify if the string has limited words
};
extern CWordFilter WordFilter;
#endif // WORDFILTER_H
這兩個文件我打包給各位下載
WordFilter.zip,包含.h和.cpp兩個文件- - Version:-Downloaded 74 times 兩種wordfilter未轉碼文件,2的是最新版-54.47 KB - Version:-Downloaded 66 times
有了加密方式,解密自然那就不是不可能的任務。
請了個高手幫忙,拿到了最新版的verycd easymule 1.1.11版關鍵字和100120關鍵字,通過比對,我發現,并沒有比上一版增加太多,也沒有什么熱門詞匯被放入,看來最近一段時間,verycd和檔中央賭氣了吧?!放在初始文檔中的54k刪除后生成的只有30K,也是比較奇怪。
以下是關鍵字。因為誘發GFW探針的可能性太高,設為回復可見,訂閱用戶不會被影響。
【【抱歉,如果您不是注冊用戶(請登錄),您必須先回復這篇文章才能看到此處隱藏內容】】
或者您不想回復,在這里也可以下載到電驢關鍵字- - Version:-Downloaded 94 times
總共2763條
這個里面亮點絕對多。
這貼讓我的編輯器卡得要死,明天專門開個新文章討論討論。
還有一個更大的爆笑點
http://www.webcitation.org/5mx35LBXn
全國網評員的網路會議,看得我笑掉了一層皮……

相關網志




啊,原来verycd屏蔽字。。。能起到seo优化的效果。 这招确实强大
嘿嘿,現在設為這種回復可見,搜索引擎的爬蟲帳號應該抓不到了
Twitter观光团前来围观~
[...] This post was mentioned on Twitter by heifenbrug and 大巨傻, 宋迈克. 宋迈克 said: 顶技术贴。 RT @heifenbrug 2010年最新VeryCD emule 0.49c 100120版本被屏蔽關鍵字http://z.pe/NEQ #FuckGFW [...]
所谓吸血鬼飘过
我試了沒有問題,回復就能看到
hgfhfhgfhd
再来是一次
[...] 特别是上一篇日志的出现,让我更加坚定了要让Google爬虫探测全部内容的决心: [...]
呵呵
纯粹路过,为了获得GFW的屏蔽词而留言
纯粹路过,为了获得GFW的屏蔽词而留言
纯粹路过,为了获得GFW的屏蔽词而留言
莫非您实验回复显示无效?
应该是可以的吧 这个插件很灵的啊
正确方法 回复后刷新可见
抱歉,很久沒到这个博客,所以沒有留言了嘻嘻
回个话该题
打酱油路过,嘿嘿~~!