Python爬蟲數據去空格‘\xa0’

最近在處理爬蟲數據的時候,發現用replace(' ', '')這個方法去空格無效,繼續加.replace('\\\\xa0', '')就可以去掉了。

也就是這樣用就沒問題了: html_str = html_str.replace(' ', '').replace('\\\\xa0', '')

\\\\xa0 是不間斷空白符
我們通常所用的空格是 \\\\x20 ,是在標準ASCII可見字符 0x20~0x7e 範圍內。
而 \\\\xa0 屬於 latin1 (ISO/IEC_8859-1)中的擴展字符集字符,代表空白符nbsp(non-breaking space)。

↓ 點擊下面的“瞭解更多”鏈接查看詳細。有問題請給我留言。


分享到:


相關文章: