|
不知道发到哪儿~~权当灌水吧~~咔咔
9 r- f: a5 e' w/ j: \2 |& l
0 r/ i) J! A. P. \! j- f3 {/ ~7 a0 v偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!4 A& K; B% T9 K% x, A R
1 D1 H+ @9 ^4 [先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了- {) S. J4 I! r6 w- ?
3 w( M; m+ Z) n8 ]* K( H6 Y
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。2 t8 I# J7 D& a. s" V0 f
4 ? ]( H5 s) K( b- ~
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
& q& _" x& m; Q' \/ ~* n1 v D/ d3 e/ {; @
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"4 g& t* [6 Z! D) E/ R4 q5 h
+ F- N9 c0 K' x/ a% K& l( p0 ]% G9 d就是说,Robot报告的东西就是Google能查到的。
- e" }0 I! x! x8 f/ M& [. w5 S( D% D- O! z" t7 [2 V
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。" g+ ?5 E/ C. @2 g3 Y5 T+ }( R" k
6 x9 b0 W( w. K4 ~5 L9 T
废话说了介么多,好啦好啦,进入主题!怎么做?$ y# t: ^! u. u% j
/ t+ ]* g! P t+ X真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
" \' G; a* j+ P, S5 Q$ B/ O4 j9 `5 J, y
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
# D% b& u( m$ R7 q: j3 I/ E. e# v' S2 g; k
把下面两行贴进去,当然你要一个字一个字打偶也不反对: u% S8 @# h. P. j8 ] x
' m- |! q, M% P& q! \0 \2 JUser-agent: *
; u) Z0 S4 h$ b9 T" c% a3 A% |, eDisallow: /
1 ~3 m% e- t+ ~+ X8 R$ \% z1 h( s: C" l' p6 K. i
保存,然后丢进你的网站http根目录里。
! `6 n k0 D& P
2 w' O1 x$ f' Y( a完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
. V. C. r, w/ U# @8 i6 _( k% a! e# m- W/ w- y
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
d+ I1 t/ K. K d2 P1 p
6 r: ]+ _. Q2 \: \& u9 ? A) P1 ^User-agent: *3 R* j$ e3 Y- F& x
Disallow: /bbs
1 W" z! B6 W( m7 Z0 K
% B2 O2 I- V0 F- S4 N. w可以了!! v* \0 n9 T: }# g. X7 F+ [
& f$ s a/ H7 e8 [6 x& a1 }4 W; J
再来个例子:: {: F J1 S4 J' h% [) o
" a C3 I8 I8 S0 Q$ KUser-agent: *
1 R3 W2 [( t8 }. FDisallow: /pub# s2 @8 Q, x2 N: _" o
Disallow: /img
$ x3 F6 O* _3 }* o" `9 ~2 P' ?Disallow: /cgi-bin2 r/ X a3 k, V$ W& w& M4 v; G
Disallow: /forum
" R+ I4 H5 u% t3 g( w' R. l. o1 cDisallow: /shop- b% k M, o7 P- c `
1 k& o+ @6 |$ Z看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~* X; o0 K; e4 a" ?- V3 |4 C
9 [1 c" w% f2 E! s" r$ P! q7 }
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
" i; y( b8 `8 S" \8 b" p4 B* [* ~$ z
+ G3 `8 T7 H( o9 G- X+ X9 r ups:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔 + p A, d# K& `7 A. @6 A5 X1 T- a
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 $ d" I7 L# c1 s8 _
6 O a# U8 r3 W! E* W; o[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|