查看: 92|回覆: 4

[讨论] 搜索不遵守规则怎么办

[複製鏈接]

85

主題

267

回帖

0

積分

热心网友

金币
267
閲讀權限
220
精華
0
威望
0
贡献
0
在線時間
0 小時
註冊時間
2012-7-2
發表於 2021-12-30 11:51:06 | 顯示全部樓層 |閲讀模式
弄了一个备份站点不对外开放,放损友们的游戏截图游戏宏备份等,游戏友们内部使用(当然没有学习日语的视频,都是一群不正经的正经人)
并且在论坛根目录下的
robots.txt  规则只有两行
  1. #
  2. # robots.txt for Discuz! X3
  3. #

  4. User-agent: *
  5. Disallow:/

禁止所有搜索引擎抓取,可谷歌蜘蛛还是时常来,是规则有问题么?
规则, 备份, 正经, 一个, 站点
回覆

使用道具 舉報

30

主題

178

回帖

0

積分

热心网友

金币
178
閲讀權限
220
精華
0
威望
0
贡献
0
在線時間
0 小時
註冊時間
2008-1-20
發表於 2021-12-30 14:09:18 | 顯示全部樓層


如果你是想要我这种效果,那很容易。如果想要蜘蛛不来,很难,人家凭什么不来?就因为你一纸空文就不来?人家不做生意了吗?谷歌号称全球最大流氓,你指望人家不来?


回覆

使用道具 舉報

85

主題

267

回帖

0

積分

热心网友

金币
267
閲讀權限
220
精華
0
威望
0
贡献
0
在線時間
0 小時
註冊時間
2012-7-2
 樓主| 發表於 2021-12-30 14:54:28 | 顯示全部樓層
谷歌做为全球性大公司,不遵守robots君子协定,这倒有些意外
对了  你的robots能分享下么
回覆

使用道具 舉報

2

主題

185

回帖

0

積分

热心网友

金币
185
閲讀權限
220
精華
0
威望
0
贡献
0
在線時間
0 小時
註冊時間
2009-9-12
發表於 2021-12-30 21:18:24 | 顯示全部樓層
  1. User-Agent: *
  2. Disallow: /

好像您的版本少了空格

另外 robots.txt 也不会完全避免采集,他还是会定期爬一下 robots.txt 的。
另外有的软件防火墙会干掉 robots.txt 访问,如果干掉的话也不能终止爬取。
回覆

使用道具 舉報

85

主題

267

回帖

0

積分

热心网友

金币
267
閲讀權限
220
精華
0
威望
0
贡献
0
在線時間
0 小時
註冊時間
2012-7-2
 樓主| 發表於 2021-12-31 05:02:09 | 顯示全部樓層

改真是,少了个空格
回覆

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即注册

本版積分規則

相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

在本版发帖返回顶部