字符串離奇消失之謎
今天在交流群里,有人問了這樣一個(gè)問題:
截圖中涉及到的圖片為:
一開始,我以為這是一個(gè)簡單的問題,但后來發(fā)現(xiàn)事情并沒有這么簡單。
我要來了這個(gè)同學(xué)的代碼,并在 PyCharm 里面使用調(diào)試模式運(yùn)行,效果如下圖所示:
截至到倒數(shù)第二行,con 字符串里面的數(shù)據(jù)還是正常的。但是一旦使用 print函數(shù)打印出來,數(shù)據(jù)又不對(duì)了。
為了說明這個(gè)問題,我寫一段代碼簡單復(fù)現(xiàn)一下這個(gè)問題。
從截圖中可以看到,a就是一個(gè)普通的列表,它并不是什么生成器。當(dāng)我們直接 for 循環(huán)展開 a 列表,然后打印里面的數(shù)據(jù)的時(shí)候,都可以正常顯示。但是當(dāng)我提前使用''.join(a)想把 a 列表里面的字符串拼接成一個(gè)字符串的時(shí)候,卻發(fā)現(xiàn)只能顯示 a 列表里面最后一個(gè)字符串。前兩個(gè)字符串離奇消失了。
為了解釋這個(gè)問題為什么會(huì)發(fā)生,我們來看看a列表長什么樣:
可以看到,a列表里面,前兩個(gè)元素的末尾都有一個(gè)\r。我們?cè)賮砜纯词褂?'.join(a)生成的 b 字符串長什么樣:
注意,這里需要直接輸入字符串的名字來顯示它真實(shí)的樣子,不能使用 print函數(shù)打印。這兩者的區(qū)別,大家可以看我的這篇文章:【一日一技】揭秘字符串的兩副“面孔”。
大家看出來了嗎?實(shí)際上,當(dāng)我們執(zhí)行''.join(a)的時(shí)候,它是正確拼接了 a 列表里面的三個(gè)字符串的,得到的結(jié)果就是abc\rdef\rxyz\r。但壞就壞在這里出現(xiàn)了\r。這個(gè)符號(hào)在這里不是制表符,而是告訴輸出的游標(biāo),現(xiàn)在移動(dòng)到行首。
怎么理解這個(gè)現(xiàn)象呢,我們假設(shè)現(xiàn)在有編號(hào)為1-9的9個(gè)桶和編號(hào)為1-9的9個(gè)小球。正常情況下,把1號(hào)球放進(jìn)1號(hào)桶,2號(hào)球放進(jìn)2號(hào)桶,3號(hào)球放進(jìn)3號(hào)桶……9號(hào)球放進(jìn)9號(hào)桶。這是我們正常打印的流程。
但現(xiàn)在,我們?cè)?-4號(hào)球之間加入一個(gè)特殊球,上面寫著\r。在6-7號(hào)之間也加入一個(gè)\r球。首先把1號(hào)球放進(jìn)1號(hào)桶,2號(hào)球放進(jìn)2號(hào)桶,3號(hào)球放進(jìn)3號(hào)。然后,你看到了\r球,這個(gè)球不放進(jìn)桶里面,但是需要你回到了1號(hào)桶,把4號(hào)球放進(jìn)1號(hào)桶,5號(hào)球放進(jìn)2號(hào)桶,6號(hào)球放進(jìn)3號(hào)。接下來,你又遇到了\r球,你又回到了1號(hào)桶旁邊,把7號(hào)球放進(jìn)1號(hào)桶,8號(hào)球放進(jìn)2號(hào)桶,9號(hào)球放進(jìn)3號(hào)。一番操作下來,所有桶里面,最上面的球只有7,8,9號(hào)。其他的1-6號(hào)球都被覆蓋了。
注意,這里我用桶里面放球來舉例,而不用 Word 打字來舉例,是因?yàn)楫?dāng)我們使用 Word 的時(shí)候,如果你把光標(biāo)重新移動(dòng)到行首輸入新的字符,已有的字符會(huì)按順序往后退。但今天我們遇到的情況,是按順序覆蓋。所以不要搞混這兩種情況。
為了證明這個(gè)按順序覆蓋,我們來看下面這個(gè)例子:
請(qǐng)大家記住上面桶里面放球的例子,\r球是不放進(jìn)桶里面的,它是告訴你要回到行首。所以,我們的第一個(gè)字符串是11111111111,由于它后面有一個(gè)\r,所以現(xiàn)在重新回到行首,繼續(xù)輸出22222。這里有5個(gè)2,所以此時(shí)字符串變成了22222111111。這時(shí)又遇到了一個(gè)\r,所以又回到了行首,輸出333。所以最終的結(jié)果是33322111111。
這個(gè)問題的關(guān)鍵就是\r,而不是''.join()有什么問題,你甚至可以直接手動(dòng)輸入帶有\(zhòng)r的字符串,效果是一樣的:
另外還需要注意的是,這個(gè)\r只會(huì)影響print函數(shù)的打印輸出。但這個(gè)字符串本身不會(huì)出現(xiàn)\r后面的字符覆蓋前面的字符。所以,對(duì)于一個(gè)字符串a(chǎn)aaaa\rbb,我們可以看到雖然 print打印出來只有bbaaa5個(gè)字符,但是它實(shí)際上有8個(gè)字符:
本文轉(zhuǎn)載自微信公眾號(hào)「未聞Code」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系未聞Code公眾號(hào)。