1.11 Message Digest & Hash Function

Message Digest

所謂的Message Digest(訊息摘要), 即一段訊息, 或是某個特定資源/檔案的摘要, 這是一種類似於指紋(fingerprint)的概念; 理論上, 不同的訊息所產生出來的摘要基本上是不會相同的(機率低到可以忽略), 故可以用來驗證訊息在傳輸的過程中是否有被竄改過. 在當前的技術應用上, message digest通常是使用複雜的hash function去計算出來的.

Hash Function

在CS領域, 你應該可以常常看見hash function的蹤影, 像大家常提到的MD5(Message Digest Algorithm 5), SHA(Secure Hash Algorithm), MAC(Message Authentication Code), HMAC(Hash-based Message Authentication Code)... 等等.

基本上不論是何種Hash, 都具備以下幾點特性:

  • 針對相同訊息去做計算, 都會產生出相同的結果

  • 只有message digest, 是不能還原成原來的訊息的, 因此在演算法的設計上必須是不可逆的(Irreversible)

  • 很難找到具有相同hash value的任一組不同訊息, 此種特性稱為強碰撞抵抗力(Strong collision resistance)

  • 不同的訊息所算出來的摘要必須是不同的

  • Hash function又稱為單向函數(One-way function)

儘管上面提到的所有演算法都具備這些特性, 但這邊還是提一下一些要注意的點:

  • MD5所計算出來的digest長度為128bits, 這個意思是說不同的訊息還是有1/(2^128)的可能性是會重複的

  • SHA的強度比MD5更高, 其所計算出來的digest長度為160bits, 所以不同的訊息還是有1/(2^160)的可能性會重複

  • 雖然以上兩種演算法都有一定機率重複, 但其機率已經低到可以忽略了, 所以實際應用上還是會看得到這兩種演算法. 此外, 此兩種演算法計算摘要時, 只需要原訊息即可, 不需要額外的資訊

  • 相較於MD5與SHA, MAC/HMAC的差異是需要多一支加密用的金鑰(因為屬於對稱式加密, 所以金鑰皆為同一把), 故其演算法還是要以密碼學演算法為基礎, 只不過是可以不考慮可逆性的

  • 若使用MAC/HMAC, 則永遠都會存在要考慮通訊雙方交換金鑰的問題

Last updated