今天也是雷金趴瓦不足的一天

金右主雷金号
开了关注一周可评论

私用转载随意 你说你画的也可以
封面@换日线

我竟然做了个lofter热度抽奖器……!_(:з」∠)_

【一股浓浓的B站标题风】

之前经常看到lo主让朋友随机报数字抽奖的,就想数据量大的话怎么办……辣就爬虫八!!

现在爬虫软件真的是越来越智能了_(:з」∠)_让我这种html文盲也能从下载开始三个小时内上手……(如果懂html会方便更多)


基本思路就是抓取我那个lof抽奖的页面,定位按钮并循环点击“查看更多”,循环到底之后抓取全部相关于热度的文字条~


我这种懒得看教程的Orz的确遇到N多障碍,比如琢磨半天发现lofter是Ajax加载的页面,提取文本的时候Xpath定位总是不准确,最后在chrome上加了一个Xpath插件直接从页面提取和修改Xpath路径,最后导入成xlsx,要知道lofter如果你点了再取消再点会有很多重复项这样导出来的文件可以直接在Excel里查重并删去!(有趣的是我发现的确有人点了很多次XD)



 导出效果如图上↑然后就可以公平公正愉快地抽奖啦!!

(目前唯一的BUG是如果有重复的lofter id可能会有些问题,但这次我是人工查过了,如果之后要泛用的话,可以抓取号主主页URL一同查重)


终于到重点了,一共有效热度是867,这次程序随机抽取到的是号码是775 663

 也就是 @巧克力蛋糕和金我全都要 

 和  @群群要安现 

 恭喜!!!!(啪啪啪啪O(≧∇≦)O

 记得私信我地址、姓名和联系号码哦!

评论(4)
热度(59)

© 今天也是雷金趴瓦不足的一天 | Powered by LOFTER