推广 热搜： 关键词跳转下载链接查询智能分析网站互联谷歌

python爬取搜狗微信的推文

日期：2024-12-20 作者：likty caijiyuan

核心提示：模块背景：项目评估中需要将所有发布在公众号的里的文章截图，然后放在文档中留档，比如：将CSDN公众

模块背景：项目评估中需要将所有发布在公众号的里的文章截图，然后放在文档中留档，比如：将CSDN公众号在2021中推送过所有包含"python"文章截图保存到本地

模块目的：将一定时间内，该公众号推送过的文章，截图保存，最后可以打包下载到本地

使用技术：python+flask+BeautifulSoup+selenium
python+flask 主要负责web 方面搭建
BeautifulSoup 负责解析html
selenium 负责执行自动化，操作浏览器实现截图

复制地址下来 page=2，就是代表第2页，只要不断递增page访问，就会跳到其他页，
这里要注意了，如果没有登录，最多只能访问10页，如果登录了，最多只能访问40次，搜狗为了防止爬虫，连续访问超过40次，就需要填写验证码！

这是实际打开的地址：
https://mp.weixin.qq.com/s?src=11&timestamp=1641978701&ver=3554&signature=qq3XrTiEvrtvKWGOEAxt95FveuErHjs-iAhTyFA4bhSE2LEEDLk81EGfzhfCFUbspjTt4ITcZKmyfo8jPL3tBPpN2F5aneIMXmdSoMvHe30Qumh0o133Ay33IGcayj&new=1

明显是做了重定向，而且如果用selenium操作weixin.sogou.com，搜狗会检测到的，会直接跳去验证码，但是如果用selenium执行mp.weixin.qq.com的地址，是无问题的，因为已经跳到微信，那就是说，我需要将所有搜狗的地址转换成微信地址。

解决办法：
我用postman 执行上面搜狗的地址：
返回这段JS

将所有url 拼接在一起的，就是微信的地址了！Postman可以生成requests方法

python爬取搜狗微信的推文

本文地址：https://sicmodule.kub2b.com/tnews/4762.html 企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

标签： 地址访问搜狗

更多>同类生活信息

文章列表

相关文章

先一步开启“年味”：鲸灵羽绒季&年货节刷新品牌战绩

最新动态

推荐图文

生活信息

点击排行

• 如何在Docker环境下安装Firefox浏览器并结合内	• 华山论鉴报名鉴宝在线鉴宝报名鉴定地址
• SpringBoot／SpringCloud开源项目，快速开发提	• android 开源项目众多Android 开源项目推荐，
• Linux使用C语言实现Socket编程	• 迅雷地址转换工具 3.0 官方版
• 园区网架构设计／升级--3--内外网络优化配置	• 助力企业SEO营销新起点的专业优化公司地址揭晓
• 免费的ai画画网站 ai画画生成器在线使用	• vultr日本ip美国（日本外网服务器地址）