利用搜狗采集微信公众平台内容

Posted by he; tagged with none

1、首先进入到搜搜搜索微信内容的页面 http://weixin.sogou.com/

2、比如我要搜索“周杰伦中文网”这个公众号的文章
163624jwih5hx5zxhdizwx.jpg
出来的文章就是我们要采集的了。。

3、现在我们来分析一下分页。
16382051p1l1d11plvd1sp.jpg

当点击“查看更多”时,我们可以看到,页面发送一个ajax请求获取内容

比如类似的:
http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFt9W2ITJpAX4JHOSzU0X9ftA&page=2&t=1409646969352
看到地址中红色部分了吗?page=2.就是分页了。

4、如果不采集公众平台,直接根据关键词搜索微信文章采集,怎么办?其实都是大同小异的
170319um1hmhjhgjnrkkg6.jpg

- 本文完 -