Merge pull request rmax#15 from nside/master

avoid waiting for the spider to be idle before popping the redis queue
houyf · Dec 2, 2013 · a295b18 · a295b18
2 parents 48e22c2 + fef6b3c
commit a295b18
Showing 1 changed file with 11 additions and 2 deletions.
diff --git a/scrapy_redis/spiders.py b/scrapy_redis/spiders.py
@@ -21,6 +21,7 @@ def setup_redis(self):
         # idle signal is called when the spider has no requests left,
         # that's when we will schedule new requests from redis queue
         self.crawler.signals.connect(self.spider_idle, signal=signals.spider_idle)
+        self.crawler.signals.connect(self.item_scraped, signal=signals.item_scraped)
         self.log("Reading URLs from redis list '%s'" % self.redis_key)
 
     def next_request(self):
@@ -29,13 +30,21 @@ def next_request(self):
         if url:
             return self.make_requests_from_url(url)
 
-    def spider_idle(self):
-        """Schedules a request if available, otherwise waits."""
+    def schedule_next_request(self):
+        """Schedules a request if available"""
         req = self.next_request()
         if req:
             self.crawler.engine.crawl(req, spider=self)
+
+    def spider_idle(self):
+        """Schedules a request if available, otherwise waits."""
+        self.schedule_next_request()
         raise DontCloseSpider
 
+    def item_scraped(self, *args, **kwargs):
+        """Avoids waiting for the spider to  idle before scheduling the next request"""
+        self.schedule_next_request()
+
 
 class RedisSpider(RedisMixin, BaseSpider):
     """Spider that reads urls from redis queue when idle."""