Python feedparser 模块，parse() 实例源码

我们从Python开源项目中，提取了以下50个代码示例，用于说明如何使用feedparser.parse()。

项目：pandachaika 作者：pandabuilder | 项目源码 | 文件源码

def crawl_feed(self, feed_url: str=None) -> List[str]:

        urls = []

        if not feed_url:
            feed_url = constants.rss_url
        feed = feedparser.parse(
            feed_url,
            handlers=ProxyHandler,
            request_headers=self.settings.requests_headers
        )

        for item in feed['items']:
            if any([item['title'].startswith(category) for category in self.own_settings.accepted_rss_categories]):
                urls.append(item['link'])
        return urls

项目：Programming-Collective-Intelligence 作者：clyyuanzi | 项目源码 | 文件源码

def getwordcounts(url):
    d = feedparser.parse(url)
    wc ={}


    #???????? d.entries
    for e in d.entries:
        if 'summary' in e:
            summary = e.summary
        else: 
            summary = e.description

        #??????
        words = getwords(e.title+' '+summary) 
        for word in words:
            wc.setdefault(word,0)
            wc[word]+=1
    print d.feed.title
    return d.feed.title,wc

项目：FRG-Crowdsourcing 作者：97amarnathk | 项目源码 | 文件源码

def news():
    """Get news from different ATOM RSS feeds."""
    import feedparser
    from pybossa.core import sentinel
    from pybossa.news import get_news, notify_news_admins, FEED_KEY
    try:
        import cPickle as pickle
    except ImportError:  # pragma: no cover
        import pickle
    urls = ['https://github.com/pybossa/pybossa/releases.atom',
            'http://scifabric.com/blog/all.atom.xml']
    score = 0
    notify = False
    if current_app.config.get('NEWS_URL'):
        urls += current_app.config.get('NEWS_URL')
    for url in urls:
        d = feedparser.parse(url)
        tmp = get_news(score)
        if (len(tmp) == 0) or (tmp[0]['updated'] != d.entries[0]['updated']):
            sentinel.master.zadd(FEED_KEY, float(score),
                                 pickle.dumps(d.entries[0]))
            notify = True
        score += 1
    if notify:
        notify_news_admins()

项目：Freya 作者：areebbeigh | 项目源码 | 文件源码

def newscaster(p, l):
    """ Dictate the latest news (which are essentially entries in the RSS feed) """
    respond("fetching news", prepend_positive_response=True)
    feeds = [feedparser.parse(url) for url in preferences.get_news_feed_urls()]
    counter = 1

    for feed in feeds:
        for entry in feed.entries:
            data = []
            parser = NewsFeedParser(data)
            try:
                description = entry.description
            except AttributeError:
                description = "None given"
            parser.feed(description)
            news = "News #" + str(counter) + ": title: " + entry.title + ". description: " + " ".join(data)
            respond(news, override_subtitle=True)
            counter += 1

项目：crawlers 作者：pyjobs | 项目源码 | 文件源码

def parse_job_list_page(self, response):
        self.get_connector().log(self.name, self.ACTION_CRAWL_LIST, response.url)

        feed_parser = feedparser.parse(response.body)
        for job_entry in feed_parser.entries:
            job_url = job_entry.link
            job_publication_date = datetime.fromtimestamp(mktime(job_entry.published_parsed))

            job_publication_time = mktime(job_publication_date.timetuple())
            last_job_publication_time = mktime(self._last_job_date.timetuple())
            if job_publication_time <= last_job_publication_time:
                self.get_connector().log(self.name,
                                         self.ACTION_MARKER_FOUND,
                                         "%s <= %s" % (job_publication_time, last_job_publication_time))
                return

            prepared_job = JobItem()
            request = Request(job_url, self.parse_job_page)
            request.meta['item'] = prepared_job

            prepared_job['title'] = job_entry.title
            prepared_job['description'] = job_entry.description
            prepared_job['publication_datetime'] = job_publication_date

            yield request