17.04.17更新:关于SQL注入问题,请看:简单地避免SQL注入式攻击。
其实一开始是不想写自己的站内搜索的,想想“百度/360”提供的站内搜索用用就好了,但是自从强制开启https以后,这两个搜索引擎中我的站点收录量直线下滑,导致他们提供的站内搜索直接没内容了。。。但是作为一个网站开发的初学者,整个站点都是静态页面,都不需要数据库,这咋写站内搜索啊!各种查资料,花了两天时间,做了数据库表,同时利用PHP实现了站内搜索。
创建数据库表有很多种方法,一种是自己写,但是我很懒!虽然站点目前的文章不是很多,我还是不想自己写。还有就是利用爬虫生成一张数据库!这个是我喜欢的方法。虽然爬虫也不是这么好操作的。。。
本来我是想自己写一个爬虫的,但是后来发现好像难度有点大,毕竟是零基础。后来上网查的时候发现了一个好玩的东西,叫PySpider的东西。具体的安装方法请看:https://moshuqi.github.io/2016/08/12/Python爬虫-PySpider框架/。教程里面用的是Mac系统,我这里用的是Ubuntu系统,至于Windows能不能用,那就得你们自己去研究了。
安装完以后就可以开始运行了,完全按照上面那个教程来就好了,真的非常的方便。放几张图:
上面这张图是最后生成的results,右上角有三个选项,根据你们的数据库来,我下的是中间那个“URL-JSON”,因为这个保存的是txt文档,方便导入到excel中对数据进行删改,有些不需要的就直接可以删掉了,而且它这个保存下来是带引号的,这个实际上没有必要,所以就可以利用excel的替换功能直接删掉。最后另存为CSV格式,因为MySql可以直接上传CSV(UTF-8)格式的数据表。
至于数据库的操作什么的,大家根据自己服务器上的数据库自行研究啦~接下来着重讲一下利用php如何来实现数据库的检索。