设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 712|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔
/ p% n2 y% G5 _0 M% h. @, e3 H7 u0 x5 q& @( A& s& u
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
; B! @' X" B! T: F' W- ]* s$ Z: p- U/ _$ ~
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
, N6 j! h0 V7 ^: d, n: r$ {1 B- q( ?4 d* A& ^
网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
4 e$ s* ]% c1 h% H$ ?/ U1 a. Q7 I; Q4 }9 _& S, r1 ]- [
Robot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:8 {) y: x' w4 u1 l7 _) c' M" U
0 n8 j/ T8 t7 z( {% Q
crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"2 y$ A4 J! a& O, a8 @* |1 T1 E2 J! ?
& }$ Y" t* N1 \- B) p8 w
就是说,Robot报告的东西就是Google能查到的。
$ o7 e0 r1 N- h: Z8 b  c4 [( Z8 P7 C- s+ S" [  J
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
1 N# a$ P" E8 m3 _, [+ N; e! o, P- P( c" ?) u5 i% C; M2 R
废话说了介么多,好啦好啦,进入主题!怎么做?! G) @: {! y  U! G1 a

8 T7 ^+ X2 b1 z3 ]+ y真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵; H; S. i% _. R+ b- M) g6 h
$ D* x: w3 a: T+ g7 \
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说! |, |3 Y5 h5 b3 `6 p, \

5 D+ Z9 w9 `' S+ k8 }把下面两行贴进去,当然你要一个字一个字打偶也不反对0 Q" i/ _  M8 J7 a
& Z$ g' ^, `# G  ?: @7 ]3 c5 t3 |
User-agent: *
' ~; W' r) {# g5 G, h6 l7 ODisallow: /7 f  A* k2 h1 a. O) f2 W

  w; {3 x  p* ~- H# E! l保存,然后丢进你的网站http根目录里。  H8 j4 Z, D7 R0 A* _- ~

. l* o) N) j+ L+ i$ a完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了5 k3 p. W' d7 B$ d) R' U+ Q7 ^$ @( y

5 J8 F% U7 [# u# V等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
" `  O! T8 e% n8 M4 _$ E5 [- v6 {2 W8 i) _5 `
User-agent: *& o6 `% U( q2 E5 D& |* f- r4 |
Disallow: /bbs
: ?% _* F0 `5 j& v6 ~3 J
! \+ |% X+ _& \- z可以了!( \) g2 G" q' j3 b6 G8 F6 D6 ^

6 N1 c/ a! U: S; _再来个例子:
$ V2 i0 o  i5 k  U# o) b# m9 S1 y; k' r7 b
User-agent: *
: ]- H" @/ ]* Y: Z- W: cDisallow: /pub3 H! m9 Q9 F* M' F. l4 ^6 W
Disallow: /img
$ X8 F9 a, G8 s% {9 t; ADisallow: /cgi-bin
% P, {! m; [+ R- a" N! ^) xDisallow: /forum
# G& [5 c, y6 y" ]" S9 r: W2 f6 KDisallow: /shop: E& a! a; k" \( L, H2 i
9 m, W8 {' J1 E+ _/ D! [
看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~2 x: ~5 ~( h7 x$ ], b# Y4 Y1 V
. u& b) \1 `/ M
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
# P; E* g0 ]8 ]  y3 `; F$ M! ^* f# |: i4 U$ s( C8 D9 A$ v1 Y3 N( Y
ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
+ f1 C6 n2 x& \8 e5 Pbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了4 s! p1 i; v2 g5 {1 l1 O, x- ]

5 z6 u4 U# z6 M# I1 B[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表