|
不知道发到哪儿~~权当灌水吧~~咔咔 3 N% F: s3 r, U* p- m' e. @
. q4 O3 r: n5 ]6 v
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
. T3 g1 t. O1 _. H% Y1 C) p2 T8 n
/ @4 A! h7 }0 c先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了* A. v$ J( h/ ^! d2 U6 ?0 d
+ x' ~' G9 L6 u6 W) K/ c* C0 E网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。* x3 J- S, Q) ?9 E; N
$ I H9 m g" P9 M/ N
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
0 y ] W4 I, r$ Q( H9 q3 l! W& Y, B! q* i# _
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"% }- J! ^# H1 ?6 d+ K
) F+ W$ N6 P3 x
就是说,Robot报告的东西就是Google能查到的。# N2 j2 A/ S( {/ Y1 A
* y# X5 J! u9 Q此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
; j/ x) G' l8 E4 X2 s/ I: O4 G- v. @# y$ v
废话说了介么多,好啦好啦,进入主题!怎么做? d. x2 B: v% h9 L
; K$ _& _$ ^" w/ j真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
7 [- s( h: c( i
8 E# o" Q: E# ^* n首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
4 z% I( l1 k- e5 k2 t2 k
: X( a, \0 d: Y, ^) o把下面两行贴进去,当然你要一个字一个字打偶也不反对2 I: U. j. l6 H+ }7 s
. o8 s2 J8 \' J" O. E' ^; k+ d
User-agent: *
8 U# ]5 Q; {6 K. ]$ ^2 qDisallow: /1 l3 i- l* G; ?6 O; `' [
/ ^; R! f# h+ ^4 D1 n/ k/ Y" ~
保存,然后丢进你的网站http根目录里。7 \4 ~5 U' d& @ r7 Q
, q! N7 U* @$ H3 k9 W' t( {- g
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
' f$ P+ M/ P7 u% f* n$ Z& g' a& W6 U- \* m. C8 P c
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题) T: e! g% U) ]! c3 A
* m; C; |( S, ?9 u! Q$ uUser-agent: *3 A* c4 W5 W: W: `. F3 Z
Disallow: /bbs2 ?4 O4 p0 {$ j
0 n# f* T7 j( J! o9 u1 C2 J, Y" }
可以了!
; y" q! q$ U) {5 y3 f9 ~' w$ |( ~6 ]8 Q
再来个例子:- E& L2 ~3 J- C: S! P2 ?+ f+ F
9 W: k! b. J- w" m, Z/ h! L' s6 V+ H* ~
User-agent: *
0 P- h& q; m3 k3 p% uDisallow: /pub
* s4 }! S8 W l7 } DDisallow: /img
) J& m! O4 U" u, R/ d( nDisallow: /cgi-bin
8 |3 C$ m3 M' `% dDisallow: /forum! {6 S* F0 T4 n, h; \( O" R
Disallow: /shop+ c5 U# p4 | B t1 I1 L" F) t1 I
" K: f: i) u# E) |+ G看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~' Z3 m" h5 e1 m; M2 q+ A
. T, i) N+ N* Z# d最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
1 o' V1 @5 h2 d( o R- P$ o1 d. ^* j( F4 T7 `1 I
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔 3 @9 g# w! ?) I! t# c
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了 
, e: ~! x, \# ^" _' X! Y9 [) m% D* d3 T+ |1 Q/ i
[ Last edited by Newbie on 2004-11-30 at 19:22 ] |
|