设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 637|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔- O; H9 M: i9 V- i2 v1 A9 b2 v

( c" Y6 ^  J% M' _* J1 d偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!7 ^+ ?7 q  j6 L. \

0 `- g: |/ j4 N先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
) b, J# b" z2 V1 V! T4 t8 }% f6 I. U
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
# _$ ^0 N+ t! @+ ?4 E' x$ n/ b+ y  W
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
! O0 \9 e( E% C
6 d4 \4 s+ p4 I6 E. W  Y- m# a' E( H7 Icrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"* N$ J. B7 J& U0 @( q1 M
) ^% f  @/ `0 L/ o6 n7 l
就是说,Robot报告的东西就是Google能查到的。0 j; z1 ~1 K8 Q* {9 s6 c

7 I" @8 |; M; R/ L此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。4 ~, x4 x$ U" X$ U" a0 ]- [

; h$ O# V. i6 j8 G1 t废话说了介么多,好啦好啦,进入主题!怎么做?& l- ~/ p. _5 z+ t8 u5 e- \

# g4 E. x( A+ h真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵8 r$ R6 Q9 x$ Z9 a% \
9 M3 g# ]5 _. y" ~
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
0 W' [+ E" A( P
3 ?& B% c: c# }) S$ c把下面两行贴进去,当然你要一个字一个字打偶也不反对
3 h5 \1 a6 {4 m% r5 Z% k0 j) C" x
  _* l2 A; \( G, m& }User-agent: *! ]- i: h+ s" c( ]3 _
Disallow: /
$ e% q6 l* g8 `6 v  o
$ c3 ~! B* N; @" c$ \0 E保存,然后丢进你的网站http根目录里。
8 S9 j# r" e! ?5 @# @
+ |% Z. Q8 _% r$ ^1 p! t完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
9 u6 j) y$ T& ?9 G, `
# [+ v# j' T& u7 A( @0 o等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题% _$ x, }5 U* M2 z
, O6 S4 K+ i1 \4 Z5 p! P
User-agent: ** J5 i( n7 x' o9 b4 j
Disallow: /bbs+ T% i0 v( i1 {" L' Y

$ _; u1 Y% t+ ~7 N3 p7 ~可以了!
: h( @- D/ T1 |/ f/ Y8 M; o9 ~; h) V8 k9 _& R6 b" q
再来个例子:# O2 V5 A7 c' ?2 N; D6 Q

0 b- g& j1 c. w; ZUser-agent: *
1 S7 J  \1 R/ S" l1 b. i: H8 Y1 }6 [/ ?Disallow: /pub
; l& c8 f9 P& j9 _$ bDisallow: /img0 Q. b3 y8 E# L$ z6 h0 }' R
Disallow: /cgi-bin
' h9 U) ~, ~& u$ v) R1 o) ?4 qDisallow: /forum4 T: G% B2 [$ L% h  Y# @6 K* r2 W
Disallow: /shop
- }+ l3 m4 ?3 ~4 e
4 x7 A7 E7 W( T看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
8 |% j  ^( v" r8 x! X9 Y4 W
; l/ y8 D( D8 U4 `, g* F+ D, J最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
. m* j7 u8 T5 X) t* V' I: Y7 }3 R; O$ f9 j
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
1 Y. f8 h3 E1 ^& m! \4 i8 Obtw:007介种表演欲旺盛地曝露狂就表看偶地文章了
- b) K1 G0 O- i& t  y  C8 Z5 m4 V& o7 c. e3 d! j
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表