|
不知道发到哪儿~~权当灌水吧~~咔咔
5 p; b; I/ T D8 J4 R$ s* @: m" t" ]! N( o$ H( ^/ `: r# Y# e
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
+ x) s0 ^. T' i) j4 ]# C( s* c' E1 b" y' ]; L6 P# {. T
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了+ g" Z% s' t: ]7 K5 k
1 q- ^* X* m8 w
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
6 a$ R# {! s" u
+ |3 b% R$ B/ H& j9 u; M$ ?) gRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
0 E* z- I# m" u Y
7 F% @' t; ?. i' x" L: H( Vcrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
, z) Y* @; y6 j* V2 r( J% I; h2 L
& h: z( W( i+ J就是说,Robot报告的东西就是Google能查到的。3 G( x) K5 q) y! u- e9 @
9 V1 M& ]: ^- v u
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。0 {: z3 x& e1 A. `
J2 w, P* Q/ f$ i0 G! ]/ U
废话说了介么多,好啦好啦,进入主题!怎么做?( j$ G e2 m6 U2 x! S9 r
' V: o" {, ~0 a+ b( c
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
% S3 {" M/ ^3 m
% O- L, `0 ]0 Q首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说/ b" k. f/ D; z6 i7 {: }
/ D- p, R! o$ l5 D, m: k C/ b把下面两行贴进去,当然你要一个字一个字打偶也不反对4 l. o! w) ?6 S$ r/ N. f
; Y+ e7 @8 ~( x+ p6 h: ^
User-agent: *, X6 h- \9 J1 `
Disallow: /
% h, B. d- `4 K6 R' t* Q0 i
( \+ {+ G- h3 Q" t# u9 }保存,然后丢进你的网站http根目录里。! [- L6 X v( ]; T9 C0 d, o' s
# Q. P4 b4 U4 z' H$ V; N完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了) O C5 V4 m6 i$ A
9 B" s$ }' J# K& N+ ^ b8 M( e' j
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
4 f& v1 ?. E5 y+ j- O. }, T: B9 B+ Q! O
User-agent: *' d% O' J$ ^9 x4 j/ S
Disallow: /bbs
2 F& F# B- U9 H$ ~- F& ~4 D# T9 O# G W
可以了!8 U' [+ Q! B- {1 I+ e+ c$ F
* E" ~5 o0 O- S }0 ~再来个例子:# i& D2 @, y. y$ j* O% R7 S9 v, D
) v# D% z8 q6 _9 I7 S+ @2 V4 {User-agent: *8 L2 x2 M! C& k' x! ~2 K. ^" Y; u
Disallow: /pub; c. f% ]2 x4 V* ?9 X* [+ y
Disallow: /img
; f, }& }6 h7 d& X4 E7 F6 I2 hDisallow: /cgi-bin! p% G- W- C* A3 \4 T$ O4 z
Disallow: /forum
9 l* M3 X0 }9 O6 E% l9 cDisallow: /shop
, ~% _. F: ]. C8 T9 m7 k% N
# d7 B+ u' ?! F8 M看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
& [: n/ \- \+ |8 \4 g" j3 D' d3 k
6 T8 I; n8 T7 j3 j8 C( c3 z最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔$ s+ v$ R0 ?# D, ~4 l7 `9 p5 i2 K
% M7 _5 S/ N0 ^# W6 h& Y1 U5 m
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
5 O( r+ w7 U7 I8 R `7 abtw:007介种表演欲旺盛地曝露狂就表看偶地文章了 
2 r/ J" o0 Y" U" Q, G
* H! u# e$ ]9 A/ o% [- L" L[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|