作战2000论坛
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
[打印本页]
作者:
Newbie
时间:
2004-11-30 19:20
标题:
[醒目]给各位有网站地战友地安全建议——技术帖
不知道发到哪儿~~权当灌水吧~~咔咔
7 |. R, V) ^/ K& J' w
0 j( |9 O5 r" s2 F
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
; d8 K9 ?9 X% x
3 `# [" o: F% M4 w1 f d
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
/ C4 R9 {: ~* G0 p; V! [
! X$ f2 [$ p; T4 A4 v
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
+ W9 P* t5 w" o. S3 H8 [3 t2 x
0 x, H% L H) }
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
6 X. B5 P+ X; u0 i4 s6 x
9 i( {0 s$ J7 c
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+
http://www.googlebot.com/bot.html)
"
0 p: ]" S b5 {) n. Z. R( ~/ F
* x/ E( U- I* }9 l% C' |! _
就是说,Robot报告的东西就是Google能查到的。
& e) W, x$ Z p/ K5 w
2 y! |- c! ?- l
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
4 o5 C: i/ l' Y1 W
0 k# Q; P* r5 P( [1 [
废话说了介么多,好啦好啦,进入主题!怎么做?
, G" ]& u, i+ o8 ?" h2 _
7 b* c. ^: x, k9 m y5 i# V0 F
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
5 n! H; ~! b! C0 o8 o) B
4 g- S; c1 l) |& }, K9 w
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
0 ]+ @1 q+ T# m3 P: n x6 R
0 @* u1 I1 h3 {4 }! K2 k" U
把下面两行贴进去,当然你要一个字一个字打偶也不反对
9 A9 ~- \( d9 Z4 P$ w
8 C4 g5 Z4 ~7 O) {
User-agent: *
1 C! n9 F4 o" W% \0 b. _
Disallow: /
3 @! s/ w" N* G$ _3 C7 L5 Z
) ~2 B: i X8 ?5 H
保存,然后丢进你的网站http根目录里。
4 y) T+ M0 G* t* E! T6 W
" _7 C1 t. N( L, E( o$ o
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
2 i1 E) ~* D( Y5 I
& t( G& f3 B6 a6 i( f$ ]
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
% E$ h" v3 L s/ J
' j& V- r7 k& m* f$ W) F
User-agent: *
6 A# r1 C) A Q& \ ?3 |4 g( B
Disallow: /bbs
& A3 L2 g/ Y0 Q
' I5 b, A4 c. x! y
可以了!
M0 Y* o# z$ v. \1 g. D, _& J
( _" X& }8 T* [% \
再来个例子:
( P9 B, n9 U: q J; H( `
4 Y6 q4 w. y; m' g0 P7 u
User-agent: *
0 o" h6 o q" _9 v6 H5 P0 r# N
Disallow: /pub
- g. @- s9 _' M% ^* b
Disallow: /img
/ |, F2 Z) R% ?9 o+ [
Disallow: /cgi-bin
7 r/ a- X+ x+ y) R9 \- l
Disallow: /forum
- B* a8 k1 Z5 `) z: \ H
Disallow: /shop
# N% f: w* E2 F7 F5 f$ b' n" ^
) Z; ]$ d- [6 m8 N7 h. t7 e
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
, e- @* l1 b9 d
! J+ O0 t# o1 Q' w# r# g6 h' u# J
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
- K7 o% t! \+ k; R' y
' s+ G# f8 G! ]( T1 m# s. L4 v3 u
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
& H' p/ i2 R2 Q! E8 z
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了
- J' Z1 [" w. h% A' N; ^0 U! Y
6 H2 {: b. M2 B
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
作者:
HADES1974
时间:
2004-12-1 10:52
好东西,这阵风过去就又可以恢复回来了
欢迎光临 作战2000论坛 (https://combat2000.cn/)
Powered by Discuz! X3.2