文章詳情頁
如何提高python查詢速度?
瀏覽:257日期:2022-06-29 18:39:57
問題描述
最近在爬股票的相關(guān)新聞,一開始設(shè)想的是,當(dāng)有新的新聞動態(tài)發(fā)布,程序通過郵件發(fā)送最新內(nèi)容到郵箱。
所以我想把新聞標(biāo)題,內(nèi)容存到數(shù)據(jù)庫里,當(dāng)內(nèi)容更新時,把新的內(nèi)容和數(shù)據(jù)庫的標(biāo)題列表對比,看是不是已存在的,如果已存在,那就不發(fā)送,如果沒有,那發(fā)送到郵箱。
但數(shù)量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?
問題解答
回答1:爬蟲任務(wù)去重
抓過的鏈接存到一個set中,檢查新鏈接是否在集合中即可。
回答2:去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內(nèi)存,提升效率
上一條:python - 如何使用requests模塊在一個post中提交含有多個相同名稱的數(shù)據(jù)?下一條:python - scrapy獲取網(wǎng)頁指定內(nèi)容,后翻到下一頁繼續(xù),固定循環(huán)次數(shù)。。問題
相關(guān)文章:
1. docker api 開發(fā)的端口怎么獲取?2. docker gitlab 如何git clone?3. debian - docker依賴的aufs-tools源碼哪里可以找到啊?4. macos - mac下docker如何設(shè)置代理5. angular.js使用$resource服務(wù)把數(shù)據(jù)存入mongodb的問題。6. docker網(wǎng)絡(luò)端口映射,沒有方便點的操作方法么?7. docker 下面創(chuàng)建的IMAGE 他們的 ID 一樣?這個是怎么回事????8. docker - 如何修改運行中容器的配置9. dockerfile - 我用docker build的時候出現(xiàn)下邊問題 麻煩幫我看一下10. docker start -a dockername 老是卡住,什么情況?
排行榜

熱門標(biāo)簽
網(wǎng)公網(wǎng)安備