MD5 到底是不是加密?
今天想跟大家談?wù)劊骸窶D5 到底是加密的嗎?」
MD5 是程序開發(fā)中非常常用的一種算法,很多人都用過。提到 MD5,大多數(shù)人的反應(yīng)都是「這是一種加密算法」,懂得多點的人還會說「可以用于給密碼加密」,再懂點的還知道「MD5 已經(jīng)有被破解的可能性了」。但 MD5 到底是加密嗎?所謂的加密到底是什么意思?MD5 的破解又是指的什么?
MD5:一種哈希算法
實質(zhì)上,MD5 只是一種哈希算法。
哈希算法,即 hash,又叫散列算法,是一類把任意數(shù)據(jù)轉(zhuǎn)換為定長(或限制長度)數(shù)據(jù)的算法統(tǒng)稱。例如我叫張三,你叫李四,那么「人 -> 人名」的算法就叫屬于一種哈希算法。哈希算法通常用于制作數(shù)字指紋,數(shù)字指紋的意思就是「你看到這個東西就像看到原數(shù)據(jù)一樣」,例如我們在一些網(wǎng)站下載大文件的時候,網(wǎng)站提供給我們驗證文件完整性的 MD5 或者 SHA1 碼,就是原文件的哈希值。哈希算法有很多種,MD5 是其中的一種,這就是 MD5。所以,優(yōu)秀的哈希算法通常需要具有低碰撞概率(即不同數(shù)據(jù)的哈希值通常也不一樣)。
加密是什么?
加密,指的是對數(shù)據(jù)進行轉(zhuǎn)換以后,數(shù)據(jù)變成了另一種格式,并且除了拿到解密方法的人,沒人能把數(shù)據(jù)轉(zhuǎn)換回來。因此,加密通常用于網(wǎng)絡(luò)通信。因為網(wǎng)絡(luò)上的通信數(shù)據(jù),任何人都有可能會拿到,把數(shù)據(jù)加密后再傳送,送達以后由對方解密后再查看,就可以防止網(wǎng)絡(luò)上的偷窺。例如大家都知道「安全」但很少人知道「為什么安全」的 HTTPS,就是通過加密算法來保障的網(wǎng)絡(luò)安全性。
所以,MD5 是加密嗎?
加密算法的目的,在于別人無法成功查看加密后的數(shù)據(jù),并且在需要的時候還可以對數(shù)據(jù)進行解密來重新查看數(shù)據(jù)。而 MD5 算法是一種哈希算法,哈希算法的設(shè)計目標(biāo)本身就決定了,它在大多數(shù)時候都是不可逆的,即你經(jīng)過哈希算法得出的數(shù)據(jù),無法再經(jīng)過任何算法還原回去。所以,既然不能將數(shù)據(jù)還原,也就不能稱之為可以解密;既然不能解密,那么哈希的過程自然也就不能稱作是「加密」了。
「不可逆加密」?
你如果試試去查詢百度百科,會發(fā)現(xiàn)有一個「MD5 加密」的詞條:
甚至還有一個詞條叫做「不可逆加密算法」:
在「不可逆加密算法」詞條下,MD5 赫然在列。
然而,他們都是錯的。甚至,「不可逆加密算法」這個詞,也是人造的。你甚至可以在網(wǎng)上搜索到一些博客,將加密算法歸類為「可逆加密」和「不可逆加密」兩類。這其實不能怪百度百科,也不能怪這些歸類的人,要怪只能怪,關(guān)于數(shù)據(jù)轉(zhuǎn)換相關(guān)的內(nèi)容太多、太雜,導(dǎo)致大家用著用著就混淆了。
這些小知識有什么用?
在開發(fā)中,經(jīng)常會遇到 RSA、AES、BASE64、MD5、SHA1、SHA256、GZIP 這些詞,他們的意義和使用場景都是各不相同的。在剛?cè)胄械臅r候,作為一個底層小碼農(nóng),只要按照同事的指示,讓我 BASE64 我就 BASE64,讓我 MD5 我就 MD5,不用問為什么。但是當(dāng)你有了一定工作經(jīng)驗之后,就應(yīng)該慢慢開始對這些內(nèi)容有所了解了,不然不僅在開發(fā)中會遇到各種障礙,而且在項目出了相關(guān)問題的時候,你甚至不知道是你的問題還是同事的問題。做開發(fā),誰都想往高處走,但你在往高處走之前,需要先建立起自己的優(yōu)勢。
所以如果你只是把這當(dāng)做一個「小知識」,用「MD5 是不是加密」來跟朋友炫技或者用來在面試時提問求職者,這可能確實沒有什么用。要知道,有用的不是小知識,而是在你能夠?qū)@些小知識輕松回答時,所體現(xiàn)出的完整知識體系。如果把它的本質(zhì)了解清楚,它到底是什么、有什么用、怎么用,以及它的相關(guān)知識都有哪些,它們各自的含義、用法和區(qū)別是什么,這樣的體系化的知識,以及這種不斷把自己的知識向體系化轉(zhuǎn)換的意識,將會對你非常有用。