设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 713|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔3 U- d8 I9 s. y

+ H% J+ v5 {. @偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!" d6 V# o, N& N

" x. D8 Q5 d1 C先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了# V! U1 i/ @3 t
  F1 ]9 n* I) c8 h3 g, A; v
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
6 [' f& m' M9 Z" K2 q6 \! S0 f9 c" o" ]  P7 m+ W7 V
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:
8 K, m& E$ \4 A* E+ G- ]0 B- _" d. R0 b5 ?7 R0 t! u; t
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"
: {2 j0 D& U, k- s
1 n4 |1 M; [4 ^/ Q6 o/ W就是说,Robot报告的东西就是Google能查到的。
' J: x; r% K6 @- O  W5 G. \5 `1 Z3 w% v/ g& Z8 I* y5 |; D
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。* |% V% G, |. S5 P9 V
3 n: s8 u: S* K& `( V: G' d- Q
废话说了介么多,好啦好啦,进入主题!怎么做?
) A+ ?/ s$ E8 f8 M$ s% W' B9 t  L5 u! X+ W
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵& X/ d* a9 ~% n6 r$ q
% H) C; n# T& ?' Z) B) R' l
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说
  _4 P1 n4 T4 W3 Z, [  w; L9 x8 D$ B+ V% W
把下面两行贴进去,当然你要一个字一个字打偶也不反对
" Y# r5 C: G* P0 e" \# e+ a0 W* U  W" C" Z, Q
User-agent: *
5 T7 J6 Z; I( }7 _" yDisallow: /2 U% C8 O6 d: R5 I+ \# v
' @2 ]' f: J# g: k" Q3 e
保存,然后丢进你的网站http根目录里。
8 d  X% c. Y7 D2 V7 p2 x" m$ C4 M) B" I; b5 n
完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了/ c9 P' Y& z- E, [9 {7 ~2 f; I
' Q. W, B& h; \# u
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
. F$ V: Q5 y+ r3 G2 ~0 c' f
5 O) w; K* _4 M# G4 R2 g( ?User-agent: *+ y# Y5 F* F7 H' o: p' I
Disallow: /bbs. r2 n0 i# a# C( P+ E' E
: L8 F+ p( j2 m2 @
可以了!2 X' c7 `) H: M8 W# |6 [8 a* ^

. \  O1 G5 r8 k% ]8 I- W  R再来个例子:
. p- U1 Y9 G4 p* A8 i+ I1 U& O) c% c
User-agent: *, v; Z0 X' H, ?8 n* L& ]
Disallow: /pub& \4 m) N) R1 B9 \& o
Disallow: /img
% L1 `* M7 j0 R; SDisallow: /cgi-bin
. i; L( V- [% q, d4 `Disallow: /forum
; m" p: q! e. @5 b  F+ }Disallow: /shop* Z" t1 F8 P/ P4 w8 @, B+ v
! w9 D" Q( t1 f8 R
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~8 P6 V* b; M9 j" Y( p  H: Z
6 k; L5 [/ [, q
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
: N4 _* j) M8 J. C4 L5 l0 j# q
0 ^% N* ?$ H, W# ups:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
) ?9 R/ G3 K6 Hbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了4 ~" Y! L' W1 r( G: k5 `
+ O7 F: S& w0 E0 H
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表