友情提示:

首页 玩法技巧 2018年俄罗斯世界杯之Java数据爬虫(一)
2018年俄罗斯世界杯之Java数据爬虫(一)

一、    数据来源

既然要爬虫,首先我们需要找到上哪里去找俄罗斯世界杯相关的数据,目前很多的门户网站都提供了相关的世界杯的数据展示页面,我们可以从一些新浪、网易等去爬取我们需要的数据,目前我选中了新浪体育中的页面,来爬取俄罗斯世界杯的数据。

二、    数据页面

1、首先登录新浪体育的世界杯的专题首页面(http://2018.sina.com.cn/),如下所示:

2、接下来我们主要从【积分】、【射手】、【数据】等页签,进行数据的抓取,其中各个界面的效果图如下:
【积分】地址: http://2018.sina.com.cn/scoreboard/page.shtml,界面效果图:


【射手】界面地址:http://2018.sina.com.cn/scorer/page.shtml,效果图如下:


【数据】界面地址:http://2018.sina.com.cn/data/data.shtml,效果图如下:


这三个界面其实都是很不错的数据:
其中【积分】页面,可以知道俄罗斯世界杯32强的基本情况,比如分组、球队名、比赛场次、胜平负、积分等内容。
其中【射手】页面,可以知道俄罗斯世界杯进球的球员的基本信息,比如球员名、球队、进球、助攻等内容。
其中【数据】页面,可以知道俄罗斯世界球队与球员的基本信息,比如球队的射门次数、球队的传球次数,球员的射门次数,球员的助攻次数等内容


Copyright© 2024
友情链接: 开28预测站 | PC蛋蛋预测 | pc蛋蛋走势图 | 幸运28预测网站 |
本站数据来源于互联网,仅供个人学习、研究之用,禁止非法传播或用于商业用途