Python網絡編程之BeautifulSoup庫的使用（三）頭條網

Python網絡編程之BeautifulSoup庫的使用（三）

2020-12-13 00:22:05 佚名

接上篇：

6. 搜索文檔數

（1） find_all(name, attrs, recursive, text, **kwargs)

Find_all()方法搜索當前tag的所有tag子節點，並判斷是否符合過濾器條件。

1） name參數

name參數可以搜索所有名字為name的tag，字符串對象將被自動忽略。

A. 傳字符串

最簡單的過濾器是字符串.在搜索方法中傳入一個字符串參數,Beautiful Soup會查找與字符串完整匹配的內容,下面的例子用於查找文檔中所有的標籤：

輸出：

B. 傳正則表達式

如果傳入正則表達式作為參數,Beautiful Soup會通過正則表達式的 match() 來匹配內容.下面例子中找出所有以b開頭的標籤,這表示

和標籤都應該被找到：

輸出：

C. 傳列表

如果傳入列表參數,Beautiful Soup會將與列表中任一元素匹配的內容返回.下面代碼找到文檔中所有標籤和標籤：

輸出：

D. 傳True

True 可以匹配任何值,下面代碼查找到所有的tag，但是不會返回字符串節點：

輸出：

E. 傳方法

如果沒有合適過濾器,那麼還可以定義一個方法，方法只接受一個元素參數，如果這個方法返回 True 表示當前元素匹配並且被找到，如果不是則反回 False。

下面方法校驗了當前元素，如果包含 class 屬性卻不包含 id 屬性，那麼將返回 True:

將這個方法作為參數傳入 find_all() 方法,將得到所有

標籤:

輸出：

2） keyword參數

如果一個指定名字的參數不是搜索內置的參數名,搜索時會把該參數當作指定名字tag的屬性來搜索,如果包含一個名字為 id 的參數,Beautiful Soup會搜索每個tag的"id"屬性，用例：

輸出：

使用多個指定名字的參數可以同時過濾tag的多個屬性，用例：

輸出：

在這裡我們想用 class 過濾，不過 class 是 python 的關鍵詞，這怎麼辦？加個下劃線就可以，用例：

輸出：

3） text參數

通過 text 參數可以搜搜文檔中的字符串內容.與 name 參數的可選值一樣, text 參數接受字符串 , 正則表達式 , 列表, True，用例：

輸出：

4） limit參數

find_all() 方法返回全部的搜索結構,如果文檔樹很大那麼搜索會很慢.如果我們不需要全部結果,可以使用 limit 參數限制返回結果的數量.效果與SQL中的limit關鍵字類似,當搜索到的結果數量達到 limit 的限制時,就停止搜索返回結果.

文檔樹中有3個tag符合搜索條件,但結果只返回了2個,因為我們限制了返回數量，用例：

輸出：

5） Recursive參數

調用tag的 find_all() 方法時,Beautiful Soup會檢索當前tag的所有子孫節點,如果只想搜索tag的直接子節點,可以使用參數 recursive=False .

（2）find( name , attrs , recursive , text , **kwargs )

它與 find_all() 方法唯一的區別是 find_all() 方法的返回結果是值包含一個元素的列表，而 find() 方法直接返回結果

（3）find_parents() find_parent()

find_all() 和 find() 只搜索當前節點的所有子節點,孫子節等.。find_parents() 和 find_parent() 用來搜索當前節點的父輩節點，搜索方法與普通tag的搜索方法相同，搜索文檔搜索文檔包含的內容。

（4）find_next_siblings() find_next_sibling()

這2個方法通過 .next_siblings 屬性對當 tag 的所有後面解析的兄弟 tag 節點進行迭代,，find_next_siblings() 方法返回所有符合條件的後面的兄弟節點，find_next_sibling() 只返回符合條件的後面的第一個tag節點

（5）find_previous_siblings() find_previous_sibling()

這2個方法通過 .previous_siblings 屬性對當前 tag 的前面解析的兄弟 tag 節點進行迭代,，find_previous_siblings() 方法返回所有符合條件的前面的兄弟點,，find_previous_sibling() 方法返回第一個符合條件的前面的兄弟節點。

（6）find_all_next() find_next()

這2個方法通過 .next_elements 屬性對當前 tag 的之後的 tag 和字符串進行迭代,，find_all_next() 方法返回所有符合條件的節點, find_next() 方法返回第一個符合條件的節點。

（7）find_all_previous() 和 find_previous()

這2個方法通過 .previous_elements 屬性對當前節點前面的 tag 和字符串進行迭代,，find_all_previous() 方法返回所有符合條件的節點, find_previous()方法返回第一個符合條件的節點。

分享到:

關鍵字: previous 方法字符串

Python網絡編程之BeautifulSoup庫的使用（三）

6. 搜索文檔數

相關文章:

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

你學生時代最喜歡的NBA球員是誰？

在米蘭和利物浦元老賽上，39歲的皮爾洛踢出一記風騷的任意球，如何評價他的任意球？

南方過去普遍的茶油，現在為何很少人吃？

朱元璋曾經給地主劉德放過牛，朱元璋當上皇帝以後，地主劉德怎麼樣了？

現在指數基金盈利18%，留還是拋？

明朝世代鎮守雲南的沐王府，為何因為巡撫的一道奏摺被滅族了？

5G大規模普及後，有線寬帶會逐步消亡嗎？

科創板開始“迎客”，11家企業公告申請上市！科創板登陸，對股市有何影響？

NBA29支球隊教練都在研究哈登比賽錄像，為何還是不能有效限制哈登？

在高速公路上行駛，轎車最安全的速度是多少？時速120公里剎車距離是多少米？

如何看待巴西前總統特梅爾因貪腐被捕事件？

泰國王發表聲明，呼籲選民支持好人來治理國家，防止壞人篡權。這“壞人”指誰？

為了不失去而永遠得不到，你怎麼理解？

可否分享一句你最喜歡的話？

曾經的兩對冤家美國，伊朗為啥支持印度對巴基斯坦開戰？

泰國軍方為什麼不直接管理泰國？

如果美軍真的對委內瑞拉開戰，委軍會不會第一時間抓捕瓜伊多？

諾曼底5個登陸點為何奧馬哈美軍損失慘重？艦炮為何不支援步兵？

準備入手第一臺座駕，預算關係，目光放在新捷達和威馳，兩款車品質都不錯，該如何選擇？

沒有手機電腦,清朝王爺如何消遣時間?網友:貧窮限制了我的想象力？

火箭的防守教練何許人也，如今火箭的復甦他有多大的功勞？

世界首富貝索斯身價9000億，這麼多人民幣是個什麼概念？

身高163的女生，體重多少斤最好看？

東漢末年漢室諸侯真的實力不行？為何復興漢室只能依靠劉備？

介紹一下夏商周斷代史？

李鴻章為何在《辛丑條約》上籤“肅”而不籤本名？

開十萬以下的合資車的人是什麼心態？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？