偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<blockquote id="o95xb"></blockquote>

<pre id="o95xb"><samp id="o95xb"></samp></pre>

<rt id="o95xb"></rt>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Python編碼對(duì)解決疑難問(wèn)題的具體方法

作者：佚名 2010-03-09 12:23:30

開(kāi)發(fā) 后端

針對(duì)一些難記的編碼，Python編碼會(huì)提供一些比較實(shí)用的方法，有針對(duì)性的進(jìn)行解答，或提供相關(guān)的方案對(duì)計(jì)算機(jī)編碼進(jìn)行規(guī)范。

初學(xué)Python編碼的相關(guān)人員經(jīng)常會(huì)遇到很多的編碼問(wèn)題，常常會(huì)遇到很多的不解的編碼問(wèn)題,即使記下因?yàn)榉爆?，也?huì)忘記，以下介紹的是如何避免相關(guān)的情況。是我們?cè)谟?jì)算機(jī)的相關(guān)的應(yīng)用中變得更為流暢。

UNICODE:

使用2個(gè)甚至4個(gè)字節(jié)來(lái)編碼一個(gè)字符，因此可以將世界上所有的字符進(jìn)行統(tǒng)一.

Python:

標(biāo)準(zhǔn)的Python編碼只使用7個(gè)比特來(lái)表示一個(gè)字符，因此最多編碼128個(gè)字符。擴(kuò)充的 ANSCII 使用8個(gè)比特來(lái)表示一個(gè)字符，最多也只能編碼 256 個(gè)字符。

UNICODE:

使用2個(gè)甚至4個(gè)字節(jié)來(lái)編碼一個(gè)字符，因此可以將世界上所有的字符進(jìn)行統(tǒng)一編碼。

UTF:

UNICODE編碼轉(zhuǎn)換格式，就是用來(lái)指導(dǎo)如何將 unicode 編碼成適合文件存儲(chǔ)和網(wǎng)絡(luò)傳輸?shù)淖止?jié)序列的形式 (unicode -> str)。像其他的一些編碼方式 gb2312, gb18030, big5 和 UTF 的作用是一樣的，只是編碼方式不同。

這里面是這么幾句：

"The items of a string are characters", "The items of a Unicode 
object are Unicode code units", "The string data type is also 
used to represent arrays of bytes, e.g., to hold data read from a file."

一二句說(shuō)明 str 和 unicode 的組成單元(item)是什么（因?yàn)樗鼈兺?sequence ) 。sequence 默認(rèn)的 __len__ 函數(shù)的返回值正是該序列組成單元的個(gè)數(shù)。這樣的話，len('abcd') == 4 和 len(u'我是中文') == 4 就很容易理解了。

第三句告訴我們像從文件輸入輸出的時(shí)候是用 str 來(lái)表示數(shù)據(jù)的數(shù)組。不止是文件操作，我想在網(wǎng)絡(luò)傳輸?shù)臅r(shí)候應(yīng)該也是這樣的。這就是為什么一個(gè)unicode 字符串在寫(xiě)入文件或者在網(wǎng)絡(luò)上傳輸?shù)臅r(shí)候要進(jìn)行Python編碼的原因了。#t#

Python 編碼和解碼也就是 unicode 和 str 這兩種v形式的相互轉(zhuǎn)化。編碼是 unicode -> str，相反的，解碼就是 str -> unicode。下面剩下的問(wèn)題就是確定何時(shí)需要進(jìn)行編碼或者解碼了，像一些庫(kù)是 unicode 版的，這樣我們?cè)趯⑦@些庫(kù)函數(shù)的返回值進(jìn)行傳輸或者寫(xiě)入文件的時(shí)候就要考慮將它編碼成合適的類型。

關(guān)于文件開(kāi)頭的"Python編碼v指示"，也就是 # -*- coding: -*- 這個(gè)語(yǔ)句。Python 默認(rèn)腳本文件都是 ANSCII 編碼的，當(dāng)文件中有非 ANSCII 編碼范圍內(nèi)的字符的時(shí)候就要使用"編碼指示"來(lái)修正。關(guān)于 sys.defaultencoding，這個(gè)在解碼沒(méi)有明確指明解碼方式的時(shí)候使用。比如我有如下代碼：

#! /usr/bin/env python     
# -*- coding: utf-8 -*-

s = '中文' # 注意這里的 str 是 str 類型的，而不是 unicode s.encode('gb18030') 這句代碼將 s 重新編碼為 gb18030 的格式，即進(jìn)行 unicode -> str 的轉(zhuǎn)換。因?yàn)?s 本身就是 str 類型的，因此 Python 會(huì)自動(dòng)的先將 s 解碼為 unicode ，然后再編碼成 gb18030。

因?yàn)榻獯a是python自動(dòng)進(jìn)行的，我們沒(méi)有指明解碼方式，python 就會(huì)使用 sys.defaultencoding 指明的方式來(lái)解碼。很多情況下 sys.defaultencoding 是 ANSCII，如果 s 不是這個(gè)類型就會(huì)出錯(cuò)。拿上面的情況來(lái)說(shuō)，我的 sys.defaultencoding 是 anscii，而 s 的編碼方式和文件的編碼方式一致，是 utf8 的，所以出錯(cuò)了:

UNICODE編碼轉(zhuǎn)換格式，就是用來(lái)指導(dǎo)如何將 unicode 編碼成適合文件存儲(chǔ)和網(wǎng)絡(luò)傳輸?shù)淖止?jié)序列的形式 (unicode -> str)。像其他的一些Python編碼b2312, gb18030, big5 和 UTF 的作用是一樣的，只是編碼方式不同。#p#

Python編碼有兩種數(shù)據(jù)模型來(lái)支持字符串這種數(shù)據(jù)類型，一種是 str，另外一種是 unicode ，它們都是 sequence 的派生類型，這個(gè)可以參考 Python Language Ref 中的描述：

這里面是這么幾句:

UnicodeDecodeError: 'ascii' codec   
can't decode byte 0xe4 in position  
   0: ordinal not in range(128)   
 對(duì)于這種情況，我們有兩種方法來(lái)改正錯(cuò)誤：  
一是明確的指示出 s 的編碼方式#!  
 /usr/bin/env python    
 # -*- coding: utf-8 -*-   s =  
 '中文'   s.decode('utf-8').  
encode('gb18030') 最后更改   
sys.defaultencoding 為文件的  
Python編碼即可。

UTF:

一二句說(shuō)明 str 和 unicode 的組成單元(item)是什么（因?yàn)樗鼈兺?sequence ) 。sequence 默認(rèn)的 __len__ 函數(shù)的返回值正是該序列組成單元的個(gè)數(shù)。這樣的話，len('abcd') == 4 和 len(u'我是中文') == 4 就很容易理解了。

第三句告訴我們像從文件輸入輸出的時(shí)候是用 str 來(lái)表示數(shù)據(jù)的數(shù)組。不止是文件操作，我想在網(wǎng)絡(luò)傳輸?shù)臅r(shí)候應(yīng)該也是這樣的。這就是為什么一個(gè)unicode 字符串在寫(xiě)入文件或者在網(wǎng)絡(luò)上傳輸?shù)臅r(shí)候要進(jìn)行編碼的原因了。

Python編碼和解碼也就是 unicode 和 str 這兩種形式的相互轉(zhuǎn)化。編碼是 unicode -> str，相反的，解碼就是 str -> unicode。下面剩下的問(wèn)題就是確定何時(shí)需要進(jìn)行編碼或者解碼了，像一些庫(kù)是 unicode 版的，這樣我們?cè)趯⑦@些庫(kù)函數(shù)的返回值進(jìn)行傳輸或者寫(xiě)入文件的時(shí)候就要考慮Python編碼成合適的類型。

關(guān)于文件開(kāi)頭的"編碼指示"，也就是 # -*- coding: -*- 這個(gè)語(yǔ)句。Python 默認(rèn)腳本文件都是 ANSCII 編碼的，當(dāng)文件中有非 ANSCII 編碼范圍內(nèi)的字符的時(shí)候就要使用"編碼指示"來(lái)修正。關(guān)于 sys.defaultencoding，這個(gè)在解碼沒(méi)有明確指明解碼方式的時(shí)候使用。比如我有如下代碼：

#! /usr/bin/env python   
# -*- coding: utf-8 -*-

s = '中文' # 注意這里的 str 是 str 類型的，而不是 unicode s.encode('gb18030') 這句代碼將 s 重新編碼為 gb18030 的格式，即進(jìn)行 unicode -> str 的轉(zhuǎn)換。因?yàn)?s 本身就是 str 類型的，因此 Python 會(huì)自動(dòng)的先將 s 解碼為 unicode ，然后再編碼成 gb18030。

因?yàn)榻獯a是python自動(dòng)進(jìn)行的，我們沒(méi)有指明解碼方式，Python編碼就會(huì)使用 sys.defaultencoding 指明的方式來(lái)解碼。很多情況下 sys.defaultencoding 是 ANSCII，如果 s 不是這個(gè)類型就會(huì)出錯(cuò)。拿上面的情況來(lái)說(shuō)，我的 sys.defaultencoding 是 anscii，而 s 的編碼方式和文件的編碼方式一致，是 utf8 的，所以出錯(cuò)了: UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)

對(duì)于這種情況，我們有兩種方法來(lái)改正錯(cuò)誤：一是明確的指示出 s 的編碼方式

#! /usr/bin/env python     
# -*- coding: utf-8 -*-     
s = '中文'    
s.decode('utf-8').encode('gb18030')

最后更改 sys.defaultencoding 為文件的Python編碼即可。

責(zé)任編輯：佚名來(lái)源： IT168

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)