Skip to content

760286098/wechat_sogou_crawl

 
 

Repository files navigation

项目使用

一、使用说明

1、在mysql数据库中创建数据库,然后导入wechatsogou.sql文件,创建对应的数据库表

2、修改config.py文件中对应的设置,打码平台配置相应账号密码

3、执行:pip install -r requirements.txt 安装所需要的第三方包

4、执行auto_add_mp.py文件,参数为要添加的公众号

5、执行updatemp.py文件,文件说明看后面。使用中可以给该文件设定定时任务30分钟或其它间隔,每隔一定时间,运行该 文件就会抓取已添加的公众号是否有新文章发出来。 第一次使用会抓取公众号的最近10条群发数据

二、文件说明

1、updatemp.py 该文件遍历待抓取列表(数据库表:mp_info),查询表中的公众号是否有新文章发布,如果有,就抓取新的文章信息并 放入数据库表wenzhang_info中

2、auto_add_mp.py 该文件将指定的公众号添加到待抓取列表中 将参数指定的公众号填入数据库表(mp_info)中

About

基于搜狗微信的公众号文章爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%