设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 709|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔
9 r- f: a5 e' w/ j: \2 |& l
0 r/ i) J! A. P. \! j- f3 {/ ~7 a0 v偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!4 A& K; B% T9 K% x, A  R

1 D1 H+ @9 ^4 [先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了- {) S. J4 I! r6 w- ?
3 w( M; m+ Z) n8 ]* K( H6 Y
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。2 t8 I# J7 D& a. s" V0 f
4 ?  ]( H5 s) K( b- ~
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
& q& _" x& m; Q' \/ ~* n1 v  D/ d3 e/ {; @
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"4 g& t* [6 Z! D) E/ R4 q5 h

+ F- N9 c0 K' x/ a% K& l( p0 ]% G9 d就是说,Robot报告的东西就是Google能查到的。
- e" }0 I! x! x8 f/ M& [. w5 S( D% D- O! z" t7 [2 V
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。" g+ ?5 E/ C. @2 g3 Y5 T+ }( R" k
6 x9 b0 W( w. K4 ~5 L9 T
废话说了介么多,好啦好啦,进入主题!怎么做?$ y# t: ^! u. u% j

/ t+ ]* g! P  t+ X真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
" \' G; a* j+ P, S5 Q$ B/ O4 j9 `5 J, y
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
# D% b& u( m$ R7 q: j3 I/ E. e# v' S2 g; k
把下面两行贴进去,当然你要一个字一个字打偶也不反对: u% S8 @# h. P. j8 ]  x

' m- |! q, M% P& q! \0 \2 JUser-agent: *
; u) Z0 S4 h$ b9 T" c% a3 A% |, eDisallow: /
1 ~3 m% e- t+ ~+ X8 R$ \% z1 h( s: C" l' p6 K. i
保存,然后丢进你的网站http根目录里。
! `6 n  k0 D& P
2 w' O1 x$ f' Y( a完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
. V. C. r, w/ U# @8 i6 _( k% a! e# m- W/ w- y
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
  d+ I1 t/ K. K  d2 P1 p
6 r: ]+ _. Q2 \: \& u9 ?  A) P1 ^User-agent: *3 R* j$ e3 Y- F& x
Disallow: /bbs
1 W" z! B6 W( m7 Z0 K
% B2 O2 I- V0 F- S4 N. w可以了!! v* \0 n9 T: }# g. X7 F+ [
& f$ s  a/ H7 e8 [6 x& a1 }4 W; J
再来个例子:: {: F  J1 S4 J' h% [) o

" a  C3 I8 I8 S0 Q$ KUser-agent: *
1 R3 W2 [( t8 }. FDisallow: /pub# s2 @8 Q, x2 N: _" o
Disallow: /img
$ x3 F6 O* _3 }* o" `9 ~2 P' ?Disallow: /cgi-bin2 r/ X  a3 k, V$ W& w& M4 v; G
Disallow: /forum
" R+ I4 H5 u% t3 g( w' R. l. o1 cDisallow: /shop- b% k  M, o7 P- c  `

1 k& o+ @6 |$ Z看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~* X; o0 K; e4 a" ?- V3 |4 C
9 [1 c" w% f2 E! s" r$ P! q7 }
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
" i; y( b8 `8 S" \8 b" p4 B* [* ~$ z
+ G3 `8 T7 H( o9 G- X+ X9 r  ups:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔+ p  A, d# K& `7 A. @6 A5 X1 T- a
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了$ d" I7 L# c1 s8 _

6 O  a# U8 r3 W! E* W; o[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表