爬蟲初學者的疑問
看了scarpy框架圖,有個疑問。
如果在DownloadMiddleware中添加selenium+PhantomJS抓取動態(tài)內容的話,事實上等于發(fā)了兩次請求,一次請求由Scrapy發(fā),另一次請求由selenium發(fā)出,這樣第一個是不是有點多余,而且還降低了效率,我這個說法對嗎?
麻煩請各位大神解答。如果,的確冗余,除了多帶帶用selenium和PhantomJS來抓取以外,結合scrapy有什么方法能通過代碼的方式,讓Scrapy不發(fā)請求?