对于很多网站来说,新站百度爬虫不迭时,收录情景不好,咱们不妨本人积极提交链接给百度供它抓取
1、在百度站散工具中绑定你的网站
2、将获得到的积极提交js代码放到你的网页上
3、安置python情况
4、在cmd里运用pip install selenium 安置selenium包
5、载入与你电脑chrome本子对应的 webdriver 载入地方http://npm.taobao.org/mirrors/chromedriver/
6、将底下代码维持为submit.py
7、在cmd里运转 python submit.py
from selenium import webdriver
import time, re
browser = webdriver.Chrome()
id = 800
total = 1233200
while id <= total:
url = 'http://www.896198.com/news.show-%s.html' %(id)
browser.get(url)
browser.implicitly_wait(5)
id += 1
else:
print("网址提交实行")
browser.close
browser.quit
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。