设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 707|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔: K* _. ^* x) C9 O
+ c1 z/ c/ l+ j/ G+ ~3 H
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!/ ?- h& g  J$ ]9 |0 X! V' x

" D9 L0 q$ c) M! v先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了: U8 ^, h9 }( ], T8 M3 M
6 G. v9 t  O( S: V9 Q5 i6 y* {' z
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
/ y( t6 z9 ~7 c0 V* e& [+ c! f9 c5 {! E
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
$ [, z. d0 ^  g" i) k% ~
! \1 Z% M" V  ~4 S" Acrawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
6 ~# T* {8 T" x6 d. V4 f
6 ?& u4 |! r# ~( K8 x7 c7 H9 ~就是说,Robot报告的东西就是Google能查到的。7 {- i2 N' ?1 G  Y6 Z) k; ?9 G

0 d/ ^+ l: N* ~  d6 g此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
! F$ k& ~% ]+ [' S4 q
1 P: _7 X, J: \0 Z废话说了介么多,好啦好啦,进入主题!怎么做?
) n/ N5 ?; D8 e7 f  w3 z3 i/ t+ C% s( m0 S9 h# D4 M- }" z
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵
9 A( D' p+ z0 b  l6 m
9 m9 K2 K' d4 M( ^3 A  T9 W- @$ Z首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说$ X/ s/ f4 `. \- T

! m) P. e  w/ s# G6 }# Z把下面两行贴进去,当然你要一个字一个字打偶也不反对% e# R3 w! F7 J, ]- }
5 Z' c3 T! J0 I" `9 Y* Z
User-agent: *
* q" Z6 _! s) f& @0 d; R/ jDisallow: /
! U7 A4 L- w" Y2 [* c5 \& o3 s3 Y& `3 V
保存,然后丢进你的网站http根目录里。2 H: g% a, M9 G: H

$ i" k" S8 L2 t' ]' K完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了( f. G0 {# w. H- u1 k( x; @

3 h4 v* T9 I( K4 P% d等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题! G, G8 ]7 x  g" c7 d- i- I5 a
. Q9 g5 B9 f& E. K2 S" N
User-agent: *
" H# }, G- p6 s' U" b' G! U" HDisallow: /bbs% V7 c6 i9 A/ y' W# O9 {9 r( B

  h1 T. I/ M; T; m: n3 A# w0 l可以了!6 {+ z* e5 {7 Y0 ^3 g, X

" ?. k! C4 t0 w0 H4 t再来个例子:
9 z" v0 _: U7 Y% X! F7 i3 p1 f' _3 D  u
User-agent: *
/ a% d# K) ]8 Z/ F6 E6 s: Z5 JDisallow: /pub; F& j' l# Z1 j1 A# B' f/ v
Disallow: /img) }) l2 x; o8 I, U0 d7 G
Disallow: /cgi-bin
; \4 s' V7 W6 XDisallow: /forum
3 j+ Z$ w) E  `  L  I" xDisallow: /shop  d$ r; n! K- m* ]( V  m

: n) S6 h  x4 C3 O7 D6 ~看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
" N. v. r' ~  J2 q$ \4 C6 c! s* f4 `7 d) F% P8 E4 E3 _8 N# G+ X  `2 R
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
8 O/ ], A! ?' P5 M. M0 S
) S4 b) l  S6 r. D3 Jps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
, T3 I  E1 T0 R7 Y; t. ?btw:007介种表演欲旺盛地曝露狂就表看偶地文章了0 L* S. t) _/ l
! s$ q! R" d3 K6 d
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表