python爬取nba今天的信息

发布时间:2019-06-23 08:44:19编辑:auto阅读(1182)

    最近无聊在写python爬虫,分享一个爬去nba今天信息的python脚本,可能没写的美观,有优化的请大神指点!


    ➜  /test sudo vim nba.py
    #!/usr/bin/python
    #-*- coding:utf-8 -*-
    class url:
            def __init__(self,url):
                    self.url = url
            def nba(self):
                    import re
                    import urllib2
                    hearders = "User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36"
                    url = "%s" %(self.url)
                    par = '2018-01-25.*htm\">(.*?)</a></li>'
                    opener = urllib2.build_opener()
                    opener.addheaders = [hearders]
                    urllib2.install_opener(opener)
                    html = urllib2.urlopen(url).read().decode("utf-8")
                    data = re.findall(par,html)
                    print type(data)
                    for i in data:
                            print i
    u = url('https://news.zhibo8.cc/nba/')
    u.nba()


    ➜  /test sudo python nba.py
    <type 'list'>
    【翻译组】本赛季勇士的“死亡五小”为何统治力大减?
    吉米-巴特勒晒与韦德合照:祝大哥生日快乐
    ‘坏篮框之树’!奥尼尔晒被自己扣碎过的篮框
    杜兰特:火箭打的非常强硬 他们的变化不仅仅是CP3
    安东尼27分 亚当斯21+10 雷霆大胜湖人迎3连胜
    海沃德发推:很喜爱我们球队的斗志
    莱昂纳德复出19+8约基奇23+9+7 马刺主场大胜掘金
    铂金压哨劈扣为尼克斯续命 两队进入第二个加时
    27分20板!字母哥爆发客场双杀奇才
    宝刀未老!诺维茨基20分率队迎独行侠“首胜”
    乔治缺阵 威少31+8+6甜瓜11+11 雷霆遭篮网逆转
    库里当选全明星西部票王!将成为西部队长!
    巴特勒赛后:我们需要变得谦逊 很高兴我们输球了
    前瞻-开拓者vs步行者:两者相争,勇者胜
    恩比德发推:美妙的一天!伟大的胜利+成为全明星
    格里芬:利拉德值得入选全明星 而不是仅在讨论范围中
    绝命中投!沃尔拿下赛季新高16助攻
    前瞻-马刺VS步行者:五连客终遇银发魔鬼


关键字