一日一技:難以置信,還有人不知道反斜杠和引號(hào)的關(guān)系
在公眾號(hào)粉絲群里面,經(jīng)常有同學(xué)問類似下面這樣的問題:
而當(dāng)他發(fā)出來(lái)這個(gè)圖,我就知道他想問什么問題了,所以直接給出了答案:把反斜杠刪了。
為什么有人會(huì)問出這樣的問題?為什么我可以毫不猶豫的知道 刪除反斜杠沒有任何不良影響?這就要從 Python 的單引號(hào)、雙引號(hào)、三引號(hào)說(shuō)起了。
在 Python 里面,單引號(hào)和雙引號(hào)的作用是完全一樣的。當(dāng)我們要定義一個(gè)字符串的時(shí)候,使用單引號(hào)和雙引號(hào)沒有任何區(qū)別:
- # 下面兩種寫法完全相同
- a = 'kingname'
- b = "kingname"
那在什么情況下應(yīng)該用單引號(hào),什么情況下應(yīng)該用雙引號(hào)呢?那就是在字符串里面本來(lái)就有單引號(hào)的時(shí)候,最外面就用雙引號(hào);字符串里面本來(lái)就有雙引號(hào)的時(shí)候,最外面就有單引號(hào):
- a = 'kingname says: "yes".'
- b = "kingname syas: 'yes'."
那么如果我想定義的字符串里面本來(lái)就既有單引號(hào)又有雙引號(hào)怎么辦呢?那么我們可以用三單引號(hào)。
- a = '''青南說(shuō): '單引號(hào)'比"雙引號(hào)"更好看'''
當(dāng)然,還有三雙引號(hào),它的功能跟三單引號(hào)完全相同,但是在 PEP8規(guī)范里面,三雙引號(hào)一般用來(lái)寫函數(shù)文檔型注釋,所以一般多行字符串我們不會(huì)使用三雙引號(hào)。如下圖所示:
requests 源代碼
順帶一提,Requests的代碼寫得非常規(guī)范,當(dāng)你不知道怎么寫代碼才優(yōu)雅的時(shí)候,你就去參考 Requests 的源代碼。它怎么寫,你就怎么寫。
但我們知道,三單引號(hào)是給多行字符串使用的,如果你覺得短短幾個(gè)字符的字符串,就因?yàn)楹须p引號(hào)或者單引號(hào),你就要搬出三單引號(hào),未免殺雞用牛刀,那么,你還可以使用反斜杠。例如:
- a = 'kingname says: \'yes\'.'
- b = "kingname says: \"yes\"."
- c = '青南說(shuō): \'單引號(hào)\'比"雙引號(hào)"更好看'
- d = "青南說(shuō): '單引號(hào)'比\"雙引號(hào)\"更好看"
也就是說(shuō),如果你字符串最外面使用的是單引號(hào),那么你可以在字符串里面自帶的單引號(hào)前面加上反斜杠;如果你字符串最外面使用的是雙引號(hào),那么你可以在字符串里面自帶的雙引號(hào)前面加上反斜杠。
本文開頭的這個(gè)同學(xué),他發(fā)的截圖是這樣的:
可以看到,它的字典中,content的值是使用三雙引號(hào)包起來(lái)的,所以,值里面的單引號(hào)沒有必要加上反斜杠。
大家可能會(huì)覺得非常奇怪,上面這些規(guī)則,看起來(lái)都是顯而易見的,怎么可能有人會(huì)搞混呢?實(shí)際上,事情真的沒有你想的那么簡(jiǎn)單。有兩個(gè)場(chǎng)景會(huì)讓你出問題。
場(chǎng)景1,在 PyCharm 的調(diào)試模式中。當(dāng)我們定義一個(gè)字符串的時(shí)候,調(diào)試窗口里面顯示的字符串變量總是使用單引號(hào)包裹的,如下圖所示:
無(wú)論在代碼里面,我定義字符的時(shí)候使用的是單引號(hào)還是雙引號(hào),在調(diào)試窗口里面始終都是單引號(hào)。那么,如果我定義的字符串包含了單引號(hào),此時(shí)在調(diào)試窗口里面一定會(huì)出現(xiàn)反斜杠:
圖中只有兩行代碼,你可以很好鑒別。但是如果你是在調(diào)試別人的代碼,看到了一個(gè)字符串里面出現(xiàn)了反斜杠,你不一定能反應(yīng)過(guò)來(lái)單引號(hào)前面的反斜杠是這樣來(lái)的。當(dāng)你自己使用三引號(hào)或者雙引號(hào)包裹這樣一段字符串的時(shí)候,你是可以直接刪除這個(gè)反斜杠的。
場(chǎng)景2,在 JSON 中。JSON 的Key 和 Value 都是使用雙引號(hào)包裹的,如下圖所示:
如果你的字符串里面原本就有雙引號(hào),那么,無(wú)論你在代碼里面定義的時(shí)候怎么寫,最終打印出來(lái)的 JSON 字符串中一定有反斜杠:
有些同學(xué)在寫爬蟲的時(shí)候,抓目標(biāo)網(wǎng)站的 API 接口,看到返回的 JSON 字符串里面有反斜杠,想都不想,反手一個(gè).replace把所有反斜杠全部替換成空。這種做法顯然是錯(cuò)誤的。
當(dāng)你發(fā)現(xiàn)網(wǎng)站返回的數(shù)據(jù)是 JSON 字符串的時(shí)候,你應(yīng)該首先傳入json.loads把它解析一遍,然后再來(lái)看數(shù)據(jù)內(nèi)容長(zhǎng)什么樣。并且,解析了以后,如果你使用 PyCharm 的調(diào)試模式來(lái)看,那么你還需要注意上面場(chǎng)景1的情況。例如下面這個(gè) JSON 字符串,就是兩種情況的結(jié)合。
- {
- "sentence": "\u4eca\u5929\u6211\u4eec\u5b66\u4e60\u82f1\u6587\u53cc\u5f15\u53f7\\"\u548c\u82f1\u6587\u5355\u5f15\u53f7'\u7684\u4f7f\u7528",
- "address": "\u4e0a\u6d77"
- }
這個(gè) JSON 字符串里面有非常多的反斜杠,很多人看到這個(gè)就很想去把這些反斜杠全部轉(zhuǎn)成空字符串。但實(shí)際上,你只需要使用json.loads處理一下,信息馬上就正常了,如下圖所示:
但即便如此,如果你試圖用調(diào)試模式去查看解析以后的值,你會(huì)發(fā)現(xiàn)里面還是有反斜杠,因?yàn)槔锩嬗袉我?hào)。
最后,考大家兩個(gè)個(gè)問題:圖片
上面這段代碼,已知b['sentence'][17]對(duì)應(yīng)了單引號(hào)的號(hào)字。那么這段代碼最后會(huì)打印出什么字符?
如果我們?cè)谡{(diào)試模式,在第10行打一個(gè)斷點(diǎn),然后通過(guò)Evaluate功能執(zhí)行代碼片段b['sentence'][18],下面的 result又是什么?
本文轉(zhuǎn)載自微信公眾號(hào)「未聞Code」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系未聞Code公眾號(hào)。