设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 705|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔
6 n) F3 @, l$ S' G$ ~6 s6 N) ^# O8 q  B0 x, ]6 ^8 S# D' m+ P) e8 B
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!- `: U. d7 Q5 t* I

0 |; }2 m) I2 Z* W先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了5 Y% p9 x/ V5 ^/ l5 ?7 W- i5 \

; V4 o3 ~  _8 F1 D5 U$ ~+ d网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。; C! w4 C" H" k- V

0 R; e8 J' x7 {( L2 wRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
6 Y$ ^. N( ?% V) U% b
; J1 q% |- W& }6 u- k- ^crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"* ~2 X7 P  C6 f/ G3 H3 P; G: C
8 g+ a% W" R4 {7 B3 C
就是说,Robot报告的东西就是Google能查到的。# t! p7 X" t% ~3 |8 V* |* E0 H( t

, D8 s' U. m9 Z6 N) s此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
9 t( y( j5 [! d9 ]9 N+ B0 F* Y: f8 I/ g' J/ H$ d: ~
废话说了介么多,好啦好啦,进入主题!怎么做?
& M0 D% r' i) E- e% u7 P7 j9 d3 e
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵# d* D2 p, J3 ~9 X+ M

7 v( F. c: I* ~- `首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说8 D6 j  Y7 z' l$ d+ y9 S: L/ `
4 M4 \& W) ~7 ^: i7 E+ m0 z
把下面两行贴进去,当然你要一个字一个字打偶也不反对, Z4 s4 s" n/ \4 m

( u; I  ?& N; x  TUser-agent: *
5 w! P6 B  a* kDisallow: /( n& G+ E+ t" G/ d5 Y2 E

1 o: J/ ]/ y. E! T6 r保存,然后丢进你的网站http根目录里。8 Y' w7 R% u2 u" m; A2 R7 I) m
) H) _$ z/ Z6 Y+ _" B
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了7 M4 v2 v$ k8 F$ q$ o' L
% h/ S8 Y0 k& l% _1 o/ s3 ~
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
5 Q: t. n+ U5 j1 [9 K0 z- l# m
& u$ e) L) A3 A% Z* m5 |3 j' OUser-agent: *" S7 @6 S4 Q2 o/ b# ~. Z
Disallow: /bbs/ ?1 M7 D7 g/ `3 r# ?, s# t
! i$ m' v0 }( W5 I% n
可以了!- X" ?) {1 _% S  g; L3 t

) y* K& t" Q4 b$ z- g4 D; D再来个例子:
8 Y) h4 z% N+ u( |0 F
3 G( m& w4 [. Z; N, S6 X) [User-agent: *
- N8 A7 b3 Y- [* X* U2 M" eDisallow: /pub0 ^" b9 y$ v4 o$ f. f8 U
Disallow: /img
$ c' O5 f* e) T  _8 u, PDisallow: /cgi-bin/ I) y& O+ R! J5 _) f  u" \
Disallow: /forum2 M* [, F" \5 P3 x- M
Disallow: /shop
3 h5 J8 z" w" Y6 Y
: P, r2 B4 `* l0 o! p' U$ d5 g看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~8 C! I- J8 Y) V! C% w
' k; Y' O$ t3 F+ L9 A! q8 P
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
" @# s4 h, ]% o2 G- r8 y. C
, Z; s4 _: M( Z4 y+ Y1 _; zps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔& l( ?, [( G4 S
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了' s1 a3 d1 [: `( V* R" q' O
$ t2 m9 V5 w% u5 S# g
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表