利用网站robots.txt文件探索Googleã€Baiduéšè—的秘密
æœç´¢å¼•æ“Žé€šè¿‡ä¸€ç§ç¨‹åºrobot(åˆç§°spider),自动访问互è”网上的网页并获å–网页信æ¯ã€‚但是,如果网站的æŸäº›ä¿¡æ¯ä¸æƒ³è¢«åˆ«äººæœç´¢åˆ°ï¼Œå¯ä»¥åˆ›å»ºä¸€ä¸ªçº¯æ–‡æœ¬æ–‡ä»¶robots.txtï¼Œæ”¾åœ¨ç½‘ç«™æ ¹ç›®å½•ä¸‹ã€‚è¿™æ ·ï¼Œæœç´¢æœºå™¨äººä¼šæ ¹æ®è¿™ä¸ªæ–‡ä»¶çš„内容,æ¥ç¡®å®šå“ªäº›æ˜¯å…许æœå¯»çš„,哪些是ä¸æƒ³è¢«çœ‹åˆ°çš„。
有趣的是,这ç§ç‰¹æ€§å¾€å¾€ç”¨æ¥ä½œä¸ºå‚考资料,猜测网站åˆæœ‰ä»€ä¹ˆæ–°åŠ¨å‘上马,而ä¸æƒ³è®©åˆ«äººçŸ¥é“。例如通过分æžGoogleçš„robots.txtå˜åŒ–æ¥é¢„测Googleå°†è¦æŽ¨å‡ºä½•ç§æœåŠ¡ã€‚
有兴趣的读者å¯ä»¥çœ‹ä¸€ä¸‹Googleçš„robots.txt文件,注æ„到å‰å‡ 行就有“Disallow: /searchâ€ï¼Œè€Œç»“å°¾æ–°åŠ ä¸Šäº†â€œDisallow: /base/s2â€ã€‚
现在æ¥åšä¸ªæµ‹è¯•ï¼ŒæŒ‰ç…§è§„则它所éšè—的地å€æ˜¯http://www.Google.com/base/s2,打开之åŽå‘现Google给出了一个错误æ示:“æœåŠ¡å™¨é‡åˆ°ä¸€ä¸ªæš‚时性问题ä¸èƒ½å“应您的请求,请30秒åŽå†è¯•ã€‚â€
但是把s2最åŽçš„æ•°å—æ¢æˆ1ã€3或者别的什么数å—的时候,错误æ示åˆæ˜¯å¦ä¸€ä¸ªæ ·å:“我们ä¸çŸ¥é“您为什么è¦è®¿é—®ä¸€ä¸ªä¸å˜åœ¨çš„页é¢ã€‚â€
很显然“/base/s2â€æ˜¯ä¸€ä¸ªç‰¹æ®Šçš„页é¢ï¼Œé‰´äºŽGoogle曾表示过今年的主è¦ç„¦ç‚¹æ˜¯æœç´¢å¼•æ“Žï¼Œæˆ‘们推测一下,所谓的“s2â€æ˜¯å¦è¡¨ç¤ºâ€œsearch2â€ï¼Œä¹Ÿå°±æ˜¯ä¼ 说ä¸çš„第二代æœç´¢å¼•æ“Žã€‚
出于好奇,å°è¯•äº†ä¸€ä¸‹ç™¾åº¦çš„robots.txt,比密密麻麻的Google简æ´äº†è®¸å¤šï¼Œåªæœ‰çŸçŸå‡ 行:
User-agent: Baiduspider
Disallow: /baidu
User-agent: *
Disallow: /shifen/dqzd.html
第一段就ä¸ç”¨è¯´äº†ï¼Œç¬¬äºŒæ®µä¹Ÿé‡åˆ°äº†åŒæ ·æ‰“ä¸å¼€çš„错误,ä¸è¿‡ï¼ŒæŒ‰ä»¥å‰çš„资料æ¥çœ‹ï¼Œè¿™æ˜¯ç™¾åº¦æ›¾ç»çš„竞价排åçš„åŒºåŸŸæ ¸å¿ƒä»£ç†ä¸€è§ˆè¡¨ä»¥åŠåœ°åŒºæ€»ä»£ç†ä¸€è§ˆè¡¨ï¼Œå‡ºäºŽæŸäº›å¯ä»¥ç†è§£çš„åŽŸå› åšäº†æ¨¡ç³Šå¤„ç†ã€‚
最后编辑: 郝聪 编辑于2008/02/19 16:25
有趣的是,这ç§ç‰¹æ€§å¾€å¾€ç”¨æ¥ä½œä¸ºå‚考资料,猜测网站åˆæœ‰ä»€ä¹ˆæ–°åŠ¨å‘上马,而ä¸æƒ³è®©åˆ«äººçŸ¥é“。例如通过分æžGoogleçš„robots.txtå˜åŒ–æ¥é¢„测Googleå°†è¦æŽ¨å‡ºä½•ç§æœåŠ¡ã€‚
有兴趣的读者å¯ä»¥çœ‹ä¸€ä¸‹Googleçš„robots.txt文件,注æ„到å‰å‡ 行就有“Disallow: /searchâ€ï¼Œè€Œç»“å°¾æ–°åŠ ä¸Šäº†â€œDisallow: /base/s2â€ã€‚
现在æ¥åšä¸ªæµ‹è¯•ï¼ŒæŒ‰ç…§è§„则它所éšè—的地å€æ˜¯http://www.Google.com/base/s2,打开之åŽå‘现Google给出了一个错误æ示:“æœåŠ¡å™¨é‡åˆ°ä¸€ä¸ªæš‚时性问题ä¸èƒ½å“应您的请求,请30秒åŽå†è¯•ã€‚â€
但是把s2最åŽçš„æ•°å—æ¢æˆ1ã€3或者别的什么数å—的时候,错误æ示åˆæ˜¯å¦ä¸€ä¸ªæ ·å:“我们ä¸çŸ¥é“您为什么è¦è®¿é—®ä¸€ä¸ªä¸å˜åœ¨çš„页é¢ã€‚â€
很显然“/base/s2â€æ˜¯ä¸€ä¸ªç‰¹æ®Šçš„页é¢ï¼Œé‰´äºŽGoogle曾表示过今年的主è¦ç„¦ç‚¹æ˜¯æœç´¢å¼•æ“Žï¼Œæˆ‘们推测一下,所谓的“s2â€æ˜¯å¦è¡¨ç¤ºâ€œsearch2â€ï¼Œä¹Ÿå°±æ˜¯ä¼ 说ä¸çš„第二代æœç´¢å¼•æ“Žã€‚
出于好奇,å°è¯•äº†ä¸€ä¸‹ç™¾åº¦çš„robots.txt,比密密麻麻的Google简æ´äº†è®¸å¤šï¼Œåªæœ‰çŸçŸå‡ 行:
User-agent: Baiduspider
Disallow: /baidu
User-agent: *
Disallow: /shifen/dqzd.html
第一段就ä¸ç”¨è¯´äº†ï¼Œç¬¬äºŒæ®µä¹Ÿé‡åˆ°äº†åŒæ ·æ‰“ä¸å¼€çš„错误,ä¸è¿‡ï¼ŒæŒ‰ä»¥å‰çš„资料æ¥çœ‹ï¼Œè¿™æ˜¯ç™¾åº¦æ›¾ç»çš„竞价排åçš„åŒºåŸŸæ ¸å¿ƒä»£ç†ä¸€è§ˆè¡¨ä»¥åŠåœ°åŒºæ€»ä»£ç†ä¸€è§ˆè¡¨ï¼Œå‡ºäºŽæŸäº›å¯ä»¥ç†è§£çš„åŽŸå› åšäº†æ¨¡ç³Šå¤„ç†ã€‚
相关日志
Dedecms编辑器CKeditoræ›´æ¢ä¸ºç™¾åº¦UEditor的方法
è°·æŒç©¿è¶Šæœç´¢-è°·æŒå®˜æ–¹æ„šäººèŠ‚玩笑
Google将在æœç´¢ç»“果排å算法ä¸è€ƒè™‘æ¥è‡ªTwitterã€Quoraç‰ç¤¾ä¼šåŒ–网络社区的内容
从12月百度算法å˜åŒ–预测2011å¹´SEOæ–¹å‘
百度上线图片竞价排å 图片显示推广å—æ ·(图)
桥页SEO:网站自我æ¯ç工具
《Google官方SEO入门指å—》å四: 对网站管ç†å‘˜æœ‰ç”¨çš„资æº(完)
《Google官方SEO入门指å—》å三:充分利用网站分æžå·¥å…·
《Google官方SEO入门指å—》å二:充分利用å…费的网站管ç†å‘˜å·¥å…·
《Google官方SEO入门指å—》å一:以æ°å½“çš„æ–¹å¼æŽ¨å¹¿ä½ 的网站
Dedecms编辑器CKeditoræ›´æ¢ä¸ºç™¾åº¦UEditor的方法
è°·æŒç©¿è¶Šæœç´¢-è°·æŒå®˜æ–¹æ„šäººèŠ‚玩笑
Google将在æœç´¢ç»“果排å算法ä¸è€ƒè™‘æ¥è‡ªTwitterã€Quoraç‰ç¤¾ä¼šåŒ–网络社区的内容
从12月百度算法å˜åŒ–预测2011å¹´SEOæ–¹å‘
百度上线图片竞价排å 图片显示推广å—æ ·(图)
桥页SEO:网站自我æ¯ç工具
《Google官方SEO入门指å—》å四: 对网站管ç†å‘˜æœ‰ç”¨çš„资æº(完)
《Google官方SEO入门指å—》å三:充分利用网站分æžå·¥å…·
《Google官方SEO入门指å—》å二:充分利用å…费的网站管ç†å‘˜å·¥å…·
《Google官方SEO入门指å—》å一:以æ°å½“çš„æ–¹å¼æŽ¨å¹¿ä½ 的网站
最后编辑: 郝聪 编辑于2008/02/19 16:25
æ–‡ç« å†…å®¹å¾ˆå……å®ž å¦ä¹ 了 支æŒä½