设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 636|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔* w9 k% g: G* ^/ I: P7 z" `
& |, z" b$ Q  f& B. K% h
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
! m/ L! _% I$ L& o/ C2 I, l: x! H  s3 j) [, i$ }  j
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
, L* @; A% \* T1 d. x+ ]/ u* \- {
1 ^9 A( V( _( x+ u0 ]/ R, f网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
& a7 P  [8 }* N/ {  {& g
$ K. l8 R3 r$ `; v6 q( m/ F# [Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:9 V, |. k* ]; M* O1 ~. \& o% c% c

' J1 t9 v' r  k( ?6 H( l# @9 Xcrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)". {( D. {) J1 b5 H

( z" E2 }. ~2 S' d就是说,Robot报告的东西就是Google能查到的。1 k/ j* u1 z! Q

5 O7 N8 W1 q9 M! d. K此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。; c3 N* P& L4 T* N* A/ \

  X# M; b, s* V* I1 a废话说了介么多,好啦好啦,进入主题!怎么做?
% O) ]0 |, X: l5 f+ F9 `; `! B9 s; V" Z& z! d! r+ U" s2 f" o
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵* q& U! F( l2 ?) u* ^9 C
! e7 l9 x3 N$ k4 n/ b  ^; ]
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
$ O: t) f, @2 W9 b0 v8 t$ s1 O1 p
/ g( d9 W/ U$ `) c3 e* k3 J+ V. T2 I把下面两行贴进去,当然你要一个字一个字打偶也不反对8 |2 R! a# s* Q/ a( A7 r$ O
  O4 i+ {: v2 g$ v( A
User-agent: */ R% B/ R# ^. Z0 E" m
Disallow: /- Y4 p+ p) E) L  a. c

' E! K+ ~  l* L( d3 f保存,然后丢进你的网站http根目录里。* i" @( P+ B3 G( j9 p
' y2 J2 R0 D) J7 \2 K
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
2 S- T2 {9 B% t; z. X; K' H6 x! d2 q3 ~4 C4 {- b
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题4 H' B; \) F* J/ W4 h. P7 N; b+ }& Z
( T5 S, O: }; D" C; n% {
User-agent: ** I# T5 z! q( C- s
Disallow: /bbs
9 w2 t6 J) C2 W: I; c. s' T  }6 ^% u5 y4 g) N8 Y$ r* h5 Q
可以了!( G, k" [- V% l, W$ ~( n; n
: y2 v  p2 L  G! H$ l- ^+ T/ Y
再来个例子:8 }8 [$ Z( [1 x! h# a" h7 A
# ~2 A+ w9 u9 J/ F; _0 C
User-agent: *
) H) D, g; Q- R$ }# CDisallow: /pub; z! K- z+ {% ]4 e2 M# ^% E! r2 ^
Disallow: /img
* F4 F" p4 P; L9 ]& h, u, {Disallow: /cgi-bin
( R- E/ _: u9 ]! E- kDisallow: /forum
' G: G) a: U; J' i5 w3 P! \, g# ADisallow: /shop
- Y/ _! q( Z1 F9 @
, W2 \: [' R9 N看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~) t% M( ~: g& j+ l& F, M" p# y

! Y: ^' h1 @( U; p/ J: V; j最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔' z0 _; `0 |$ V9 }; @7 r7 T7 v

8 U- X. W/ L3 z1 y& @ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔9 R) o3 @. i- n% m" e( {
btw:007介种表演欲旺盛地曝露狂就表看偶地文章了/ h! r, k# g# j0 W7 H+ v6 J/ g
/ Q! {. L( Y) M; t5 V8 D0 H2 @$ y$ ]" Z
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表