设为首页收藏本站
打印 上一主题 下一主题

[醒目]给各位有网站地战友地安全建议——技术帖

[复制链接]
查看: 706|回复: 1
跳转到指定楼层
1
发表于 2004-11-30 19:20 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
不知道发到哪儿~~权当灌水吧~~咔咔& U9 m7 ?2 P1 B
- C$ n  }3 p* C5 ]* W
偶经常教人家的是怎么能让Google之类的搜索引擎尽量多的找到你的网站。鉴于近来风声鹤唳,为了各位战友的安全,偶今天来教教大家如何不让搜索引擎找到你的网站!声明,如果有网站的JS用这个方法将可能导致你的网站访问量下降!不会再有新的用户通过Google之类的搜索引擎查找到你的网站,慎用!
1 \, |+ O# \* G9 b6 ]1 n( I  n3 ]  q: B7 e; L
先来介绍点小知识,Google如何找到你的网站?网络达人或灭兴趣的跳过好了
9 w# w: }7 \; ]. p
' W$ v) T) s% r4 i- B2 B2 o网络搜索引擎主要由Robot(机器人又叫网络爬虫)、索引数据库和查询服务三个部分组成。Robot对互联网资源进行遍历,尽可能多地发现并采集新的信息;采用全文检索技术对采集到的信息建立索引存到索引数据库中,能够极大地提高信息检索的速度;查询服务接收并分析用户的查询,即将用户查询作为数据库提问式,根据一定的的匹配策略,如布尔模型、模糊布尔模型等方法遍历索引数据库,最后将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。
; h3 g' ~! a1 Q) p! b6 o/ X2 B1 P1 S
" }/ V( u+ _# c2 W+ I5 s( G& NRobot有各种定义,google定义为googlebot,就是Google+Robot的意思。下面看一个Robot的例子:' U4 A: }* d+ J9 k- p7 E

% B! y1 z" K# n3 w* ]crawler11.googlebot.com - - [08/Jan/2004:04:04:54 -0600] "GET /blog/archives/000010.html HTTP/1.0" 200 8953 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)"9 L: ~( C5 Q) r
+ \: F5 w$ G. C' N
就是说,Robot报告的东西就是Google能查到的。
1 |* D' T+ ]* }2 J2 ^' Y! K( P" @& u0 p8 O1 Y! c
此外,由于Google每次放出Robot有一定的周期,所以Google查到的内容并不保证是最新的。也就是说你的网站已经关闭了,可是在Google上还可能查的到;或者说可能Google查到的内容实际上是你的网站几个月前的内容。
1 C* O, N. S/ W  O$ N0 ?+ t! `, W: h6 J- E
废话说了介么多,好啦好啦,进入主题!怎么做?
% W/ Q4 N) J% b5 O, ^0 ^% S' r% c! r- m' \' z$ q1 t
真是太太太简单了,我都不好意思说了,免得被网络达人笑话~~呵呵/ }* I- U0 C# ~- v
5 P% m& o& u2 x) k
首先建立一个空白文本文档 robots.txt,注意,文件名必须是这个,而且必须是纯文本文件,用Windows的记事本就好啦,偶都用它写程序的说: @$ j6 Q, [$ m, O

( Y" h+ M% e5 O把下面两行贴进去,当然你要一个字一个字打偶也不反对9 F3 ?4 O) \; S/ V3 `. |

+ `: q( p3 W+ q' U/ S+ ^User-agent: *% B5 ^7 v1 E! ?* M: D+ z* S
Disallow: /
; {- @8 w; S+ }$ Y8 A
: J! O3 \5 ]' ?! C/ g; r5 Z保存,然后丢进你的网站http根目录里。
9 u( u1 {# g$ q& F* _. m! s
0 B4 c+ q6 H7 O" _0 p/ S7 M# j完了!简单吧。介样一来下次Google啊Yahoo啊之类的就不会再找你了
6 ]3 q  ^* J3 c6 g+ J3 q1 K& I* ^, @8 e3 ~5 s9 j
等一下~~~那位同学要发言。虾米?只想让论坛不会被搜索到?OK!灭问题
4 v5 U: W+ h; h9 G5 q4 O+ f; V# j1 {
User-agent: *
* s9 a6 Z, C; n0 M+ C" [Disallow: /bbs+ S" ?/ A$ ?8 W4 N* x" s( p

5 N! p# ?9 O* j/ V4 R- r5 _可以了!2 K) D( U8 a. ]& E( x

6 l" Q$ w9 E4 d$ ^/ j8 j再来个例子:; Q" C9 [' F3 a4 \% H5 k, }

0 w0 \( w& Z; P: X0 y5 I/ }User-agent: *
9 T' E  U& j: {. dDisallow: /pub9 u; Y+ ~$ o  L5 j. o) o
Disallow: /img
% p, F) A5 h& A& W+ i6 C! i0 T0 P. zDisallow: /cgi-bin
; n) A7 {* o2 n! n0 T9 nDisallow: /forum
7 [9 R8 S1 k2 MDisallow: /shop! j8 Z3 T- Y9 R- K

: F$ y2 J* b, g4 r) L看明白灭?想让哪个目录里的内容不被搜索到就添一行进去,注意,一行一个哦~~
# }" n) j- C$ `' N9 |* J' ?* G3 ^, v! w5 N" G* A
最后,想再次让Google搜索到的话,删除那一行就可以了。如果想整个网站都能被搜索到,直接删除那个robots.txt文件!简单吧~~哇咔咔
; C+ [, B! Y) ]$ e  |# F( `
3 J/ o/ D! @, s( ~" |ps:各位JS要是用了偶介个方法记得以后要给偶打折哦~~哇咔咔
2 [# F5 H2 F+ }6 n6 J8 wbtw:007介种表演欲旺盛地曝露狂就表看偶地文章了5 `8 [3 n3 F1 g' j0 K
+ i+ w5 b. c* s  `. }! t6 C0 K
[ Last edited by Newbie on 2004-11-30 at 19:22 ]
分享到:  微信微信
收藏收藏 分享分享
2
发表于 2004-12-1 10:52 | 只看该作者
好东西,这阵风过去就又可以恢复回来了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于我们

作战两千(COMBAT2000)成立于新世纪2000年,COMBAT2000品牌秉承精益求精的态度,以诚信为宗旨,力求获得广大用户的拥戴及所有合作伙伴以及供应商的支持。

联系我们

  • 地址: 广州市萝岗区科学大道起云路1号视联电子科技园A栋711室
  • 电话: (am10:00-pm17:00) 400 602 2000
  • 传真:+86-20-8231-1913
  • Email: sales@combat2000.com

分享到

新加入会员

© 2001-2013 COMBAT2000论坛.粤ICP备14001821号  Powered byDiscuz! X3.2 Licensed  
快速回复 返回顶部 返回列表