一、hash
簡(jiǎn)單來(lái)說(shuō)就是把任意輸入 通過(guò)特定方式(hash函數(shù)) 處理后 生成一個(gè)值。這個(gè)值等同于存放數(shù)據(jù)的地址,這個(gè)地址里面再吧輸入的數(shù)據(jù)進(jìn)行存儲(chǔ)。
這個(gè)hash函數(shù)又叫散列函數(shù),會(huì)有一些常用的構(gòu)造散列函數(shù)的方法,但是處理結(jié)果值可能相同,那就叫沖突,沖突也有常用的沖突常用的沖突解決方法。
散列算法(Hash Algorithm),又稱哈希算法,雜湊算法,是一種從任意文件中創(chuàng)造小的數(shù)字「指紋」的方法。與指紋一樣,散列算法就是一種以較短的信息來(lái)保證文件少數(shù)性的標(biāo)志,這種標(biāo)志與文件的每一個(gè)字節(jié)都相關(guān),而且難以找到逆向規(guī)律。因此,當(dāng)原有文件發(fā)生改變時(shí),其標(biāo)志值也會(huì)發(fā)生改變,從而告訴文件使用者當(dāng)前的文件已經(jīng)不是你所需求的文件。
Hash 算法能將將任意長(zhǎng)度的二進(jìn)制明文映射為較短的二進(jìn)制串的算法,并且不同的明文很難映射為相同的 Hash 值。
也可以理解為空間映射函數(shù),是從一個(gè)非常大的取值空間映射到一個(gè)非常小的取值空間,由于不是一對(duì)一的映射,Hash 函數(shù)轉(zhuǎn)換后不可逆,意思是不可能通過(guò)逆操作和 Hash 值還原出原始的值。
散列方法的主要思想是根據(jù)結(jié)點(diǎn)的關(guān)鍵碼值來(lái)確定其存儲(chǔ)地址:以關(guān)鍵碼值K為自變量,通過(guò)一定的函數(shù)關(guān)系h(K)(稱為散列函數(shù)),計(jì)算出對(duì)應(yīng)的函數(shù)值來(lái),把這個(gè)值解釋為結(jié)點(diǎn)的存儲(chǔ)地址,將結(jié)點(diǎn)存入到此存儲(chǔ)單元中。檢索時(shí),用同樣的方法計(jì)算地址,然后到相應(yīng)的單元里去取要找的結(jié)點(diǎn)。通過(guò)散列方法可以對(duì)結(jié)點(diǎn)進(jìn)行快速檢索。散列(hash,也稱“哈?!保┦且环N重要的存儲(chǔ)方式,也是一種常見(jiàn)的檢索方法。
Hash 算法有什么特點(diǎn)
Hash 值又稱為指紋或者摘要,具有以下特點(diǎn):
正向快速:給定明文和 Hash 算法,在有限時(shí)間和有限資源內(nèi)能計(jì)算得到 Hash 值。
逆向困難:給定 Hash 值,在有限時(shí)間內(nèi)很難逆推出明文。
輸入敏感:原始輸入信息發(fā)生任何變化,新的 Hash 值都應(yīng)該出現(xiàn)很大變化。
沖突避免:很難找到兩段內(nèi)容不同的明文,使得它們的 Hash 值一致。
Hash 算法有哪些
常見(jiàn) Hash 算法有 MD5 和 SHA 系列,目前 MD5 和 SHA1 已經(jīng)被破解,一般推薦至少使用 SHA2-256 算法。
彩虹表。用來(lái)存放所有hash值的部分hash值字典。然后通過(guò)碰撞破解密碼
下面我們來(lái)看具體寫一個(gè) Hash 函數(shù)需要注意些什么,首先要明白 Hash 函數(shù)是把一個(gè)大范圍映射到一個(gè)小范圍,目的往往是為了節(jié)省空間,使得數(shù)據(jù)容易保存,另外 Hash 函數(shù)也會(huì)應(yīng)用于查找上。
延伸閱讀:
二、Hash 算法碰撞
稍微想一下就可以發(fā)現(xiàn),既然輸入數(shù)據(jù)長(zhǎng)度不固定,而輸出的哈希值卻是固定長(zhǎng)度的,這意味著哈希值是一個(gè)有限集合,而輸入數(shù)據(jù)則可以是無(wú)窮多個(gè),那么建立一對(duì)一關(guān)系明顯是不現(xiàn)實(shí)的。所以“碰撞”是必然會(huì)發(fā)生的,所以一個(gè)成熟的哈希算法會(huì)有較好的抗沖突性,同時(shí)在實(shí)現(xiàn)哈希表的結(jié)構(gòu)時(shí)也要考慮到哈希沖突的問(wèn)題。
比如“666”經(jīng)過(guò) Hash 后是“fae0b27c451c728867a567e8c1bb4e53”,相同 Hash 算法得到的值是一樣的。比如 WiFi 密碼如果是 8 位純數(shù)字的話,頂多就是 99999999 種可能性,破解這個(gè)密碼需要做的就是提前生成好 0 到 1 億數(shù)字的 Hash 值,然后做 1 億次布爾運(yùn)算(就是 Bool 值判斷,0 或者 1),而現(xiàn)在普通 I5 四核 CPU 每秒能到達(dá) 200 億次浮點(diǎn)數(shù)計(jì)算,做 1 億次布爾運(yùn)算也就是秒級(jí)別的時(shí)間就破解了。
8位大小寫字母、數(shù)字、特殊符號(hào)組成的密碼,若按照MD5加密,則hash值大概10000千億,i9算力每秒1千億。也需要至少24h。這只是極端情況下,如果加上加密算法不確定(比如3),請(qǐng)求時(shí)間(比如3),查詢時(shí)間(比如3),這就已經(jīng)需要半年左右,倘若再加上錯(cuò)誤等待時(shí)間(比如輸入5次錯(cuò)誤等待24小時(shí)),那就已經(jīng)需要50年。。。
當(dāng)然,如果有三萬(wàn)臺(tái)電腦同時(shí)破解,也還是一天 -_-|||。
不過(guò)道高一尺,魔高一丈。誰(shuí)又會(huì)傻乎乎的一個(gè)站著打一個(gè)等著挨。都是相對(duì)的。
所以密碼盡量不要用純數(shù)字,因?yàn)楦緵](méi)有任何安全性。