目录

百度搜索API

百度搜索API

最近需要做一个爬取新闻网站的项目,但考虑到各个网站的搜索api都不同,且准确性较低,所以我想到了百度的高级搜索功能,于是就对其搜索api探索了一番。

以下就是我整理的百度api参数列表,可能不够全面,欢迎补充.

百度搜索API

https://i-blog.csdnimg.cn/blog_migrate/cf5115935b74f3feb8d3eae998c52bc1.png

基本链接1 http://www.baidu.com/s?wd=关键字&cl=类型&pn=页码&ie=gb2312&rn=显示条数&tn=原站点

基本链接2 https://www.baidu.com/s?q1=主关键词&q2=&q3=&q4=&gpc=stf&ft=&q5=&q6=news.sina.com.cn

cl
类型,3网页,2图片
pn
页码
ie
编码
rn
显示条数
q1
包含以下 全部 的关键词
q2
包含以下的完整关键词
q3
包含以下任意一个关键词
q4
不包括以下关键词
q5
查询关键词位于 : 0(默认)任意位置,1 标题中,2 URL中
q6
限定站点

gpcft 应该是限定时间和文档格式

tn :表示源站点,基本没什么用,但我发现了一个神奇的参数 baidurt ,貌似是简版页面(爬虫首选!!)