今天在Ubuntu16.04上装XAMPP(LAMPP),装完以后发现apache死活启动不起来,虽然我已经改了默认访问端口和SSL端口,然而并不能解决问题。而且在图形界面里还没有报错信息,于是用命令行启动,看到提示:
1 | XAMPP: Another web server with SSL is already running. |
根据这句关键词搜到linux吧的一个坟贴,才拉我上了坑。
之前转载过一篇介绍定时执行Scrapy方法的博文:scrapy定时执行抓取任务,并且一直在使用这个方法做增量爬虫。
但是问题来了,假设如下情景:某一天,我要爬的网站更新了非常非常多的内容,以至于一天过去了,我的爬虫还没有停止工作。但是我的Ubuntu系统并不知道,于是它又定时的去crontab中执行了定时任务。于是就出现了如下尴尬的情景:
我的系统里同时运行着两只有同样功能的爬虫。
转自http://blog.csdn.net/a19860903/article/details/47146715
这4种代理,主要是在代理服务器端的配置不同,导致其向目标地址发送请求时,REMOTE_ADDR, HTTP_VIA,HTTP_X_FORWARDED_FOR三个变量不同。
看网络课程是假期充电的好方法,遇到一节短短的干货网络课,真是让人受益匪浅、回味无穷。但不知大家有没有类似的感受,当你在线上课程平台看到一个感兴趣的课程,并迫不及待的点进去一探究竟时,巨长的课程时长让你的热情瞬间下降了一半。就算仍然饶有兴致的开始了学习,中途可能就打哈哈流泪进而放弃了,下次再看到课程时间过长的,直接pass!是不是就我自己有这个毛病呢?闲来无事,用数据分析的方法来对这个问题一探究竟。我选择了个人比较青睐的线上教育平台——极客学院作为分析对象。
这篇文章只谈分析过程和分析结果,不想粘代码了,完整项目已扔至github->jkxy-data-analyse