推广 热搜: 查询  智能  关键词  跳转  分析  网站  下载  链接  互联  谷歌 

基于python开发的检测网站死链程序

   日期:2024-12-24     作者:o5hqu    caijiyuan  
核心提示:# deadurl_detector##要求:设计一个系统,自动完成对于手机搜狐(http://m.sohu.com/ )系统可靠性的检测。具体要求:1. 定时递归
# deadurl_detector ##要求: 设计一个系统,自动完成对于手机搜狐(http://m.sohu.com/ )系统可靠性的检测。具体要求: 1. 定时递归检测所有m.sohu.com域名的页面以及这些页面上的链接的可达性,即有没有出现不可访问情况。 2. m.sohu.com域名页面很多,从各个方面考虑性能优化。 3. 对于错误的链接记录到日志中,日志包括:连接,时间,错误状态等。 4. 考虑多线程的方式实现 ##解决方案: #### 获取链接 requests请求网页 re正则提取页面url #### url过滤 url去重 url是否含有特点域名 url是否相似 #### 定时运行 由crontab实现 ##目前测试结果: 在特定域名(如:m.sohu.com)过滤情况下 如果判断`url是否相似`,一共能检测87个非相似链接
本文地址:https://sicmodule.kub2b.com/tnews/4913.html     企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类生活信息

文章列表
相关文章
最新动态
推荐图文
生活信息
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号