Googlebot 和其他 Google 抓取工具
Google 抓取工具分为三类:
类型 | 说明 | 反向 DNS 掩码 | IP 范围 |
---|---|---|---|
Googlebot | Google 搜索产品的主要抓取工具。始终遵循 robots.txt 规则。 | crawl-***-***-***-***. 或 geo-crawl-***-***-***-***. | googlebot.json |
特殊情况下的抓取工具 | 执行特定功能的抓取工具(例如 AdsBot),不一定遵循 robots.txt 规则。 | rate-limited-proxy-***-***-***-***. | special-crawlers.json |
用户触发的抓取器 | 最终用户触发抓取操作的工具和产品功能。例如,Google 网站验证工具会响应用户请求。由于是用户请求的抓取,因此这些抓取器会忽略 robots.txt 规则。 | ***-***-***-***. | user-triggered-fetchers.json |
默认给的是json文件,无法直接导入宝塔面板使用,这里给出的是已经整理好格式的纯IP列表,可以直接导入宝塔面板使用。
获取到谷歌爬虫的IP地址可以有以下几个用途:
- 识别爬虫行为:如果你是一个网站的管理员,你可能需要知道哪些访问是来自于谷歌的爬虫。这样可以帮助你更好地理解网站的流量来源,以及谷歌如何索引你的网站。
- 防止爬虫行为:有时,你可能不希望谷歌的爬虫访问你的网站,或者你希望限制它们访问网站的频率。在这种情况下,你可以使用谷歌爬虫的IP地址来识别并限制这些访问。
- 测试网站的可访问性:如果你想知道你的网站是否可以被谷歌的爬虫正确地访问和索引,你可以模拟谷歌爬虫的行为,使用它们的IP地址来访问你的网站。
- 网络安全:对于网络安全专家来说,了解谷歌爬虫的IP地址可以帮助分析网络流量,识别潜在的安全威胁。
数据来源:谷歌官方文档-抓取工具管理
评论