Jak uzyskać sumę kontrolną MD5 dla dowolnego pliku w Javie? Jak korzystać z narzędzia DigestUtils.md5Hex Apache Common?
Opublikowany: 2021-08-28
Zwiększenie bezpieczeństwa aplikacji korporacyjnych to największe wyzwanie każdej organizacji.
Rozważ ten rzeczywisty scenariusz produkcji:
- Masz aplikację, która
reads the value
z pliku - Na podstawie wartości pliku
performs some operations
takie jak dodaj/usuń/wykonaj - Wdrożyłeś tę aplikację w środowisku produkcyjnym
- Co się stanie, jeśli jakaś
unauthorized person
changes the value
tego pliku bez Twojej wiedzy? - Twoja aplikacja
simply gets new value
z pliku i uruchamia logikę, która może spowodowaćunexpected outcome
- Jeśli masz włączoną sumę kontrolną MD5 dla tego pliku -
could have created an exception
z wyraźnym komunikatem o błędzie iyou could have prevented disaster
lub nieoczekiwanemu wynikowi
Co to jest suma kontrolna MD5?
Suma kontrolna MD5 dla pliku to wartość 128-bit value
, coś w rodzaju odcisku palca pliku. Może być przydatny zarówno do porównywania plików, jak i kontroli ich integralności.
Uzyskanie tej samej wartości dla innego pliku jest prawie niemożliwe. W tym tutorialu stworzymy prosty program w Javie, który tworzy i zwraca wartości MD5 dla danego pliku. W naszym przypadku jest to plik index.php
.
Zacznijmy:
Krok 1
Utwórz klasę publiczną CrunchifyGetMD5ForFile.java
Krok 2
Zaimportuj poniższe dwie zależności maven do pliku pom.xml
projektu. Samouczek konwersji projektu na projekt maven.
1 2 3 4 5 6 7 8 9 10 |
< dependency > < groupId > commons - codec < / groupId > < artifactId > commons - codec < / artifactId > < version > 1.10 < / version > < / dependency > < dependency > < groupId > commons - io < / groupId > < artifactId > commons - io < / artifactId > < version > 2.4 < / version > < / dependency > |
Używamy bibliotek commons-codec
i commons-io
.
Krok 3
Utwórz sumę kontrolną MD5 za pomocą narzędzia DigestUtils.md5Hex
i wydrukuj wynik na konsoli.
DigestUtils.md5Hex => implementacja encodeHex
1 2 3 4 5 6 7 8 9 10 |
protected static char [ ] encodeHex ( final byte [ ] data , final char [ ] toDigits ) { final int l = data . length ; final char [ ] out = new char [ l < < 1 ] ; // two characters form the hex value. for ( int i = 0 , j = 0 ; i < l ; i ++ ) { out [ j ++ ] = toDigits [ ( 0xF0 & data[i]) >>> 4]; out [ j ++ ] = toDigits [ 0x0F & data[i]]; } return out ; } |
Oto pełny program.
Utwórz klasę crunchifyGetMd5ForFile.java
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 |
package crunchify . com . tutorials ; import org . apache . commons . codec . digest . DigestUtils ; import org . apache . commons . io . IOUtils ; import java . io . File ; import java . io . FileInputStream ; import java . io . IOException ; /** * @author Crunchify.com * How to get MD5 checksum for any given file in Java? Use commons-codec's DigestUtils.md5Hex. */ public class CrunchifyGetMD5ForFile { public static String crunchifyGetMd5ForFile ( String crunchifyFile ) { // File(): Creates a new File instance by converting the given pathname string into an abstract pathname. // If the given string is the empty string, then the result is the empty abstract pathname. File myFile = new File ( crunchifyFile ) ; return crunchifyGetMd5ForFile ( myFile ) ; } public static String crunchifyGetMd5ForFile ( File crunchifyFile ) { String crunchifyValue = null ; // FileInputStream: A FileInputStream obtains input bytes from a file in a file system. What files are available depends on the host environment. // FileInputStream is meant for reading streams of raw bytes such as image data. For reading streams of characters, consider using FileReader. FileInputStream crunchifyInputStream = null ; try { crunchifyInputStream = new FileInputStream ( crunchifyFile ) ; // md5Hex converts an array of bytes into an array of characters representing the hexadecimal values of each byte in order. // The returned array will be double the length of the passed array, as it takes two characters to represent any given byte. // DigestUtils(): Operations to simplify common MessageDigest tasks. This class is immutable and thread-safe. // However the MessageDigest instances it creates generally won't be. // The MessageDigestAlgorithms class provides constants for standard digest algorithms that can be // used with the getDigest(String) method and other methods that require the Digest algorithm name. // toByteArray(): Get the contents of an InputStream as a byte[]. // This method buffers the input internally, so there is no need to use a BufferedInputStream. crunchifyValue = DigestUtils . md5Hex ( IOUtils . toByteArray ( crunchifyInputStream ) ) ; // md5Hex(): Calculates the MD5 digest and returns the value as a 32 character hex string. } catch ( IOException e ) { log ( "Hey there is an error: " + e ) ; } finally { // closeQuietly(): Unconditionally close an InputStream. // Equivalent to InputStream.close(), except any exceptions will be ignored. // This is typically used in finally blocks. IOUtils . closeQuietly ( crunchifyInputStream ) ; } return crunchifyValue ; } // Simple log util private static void log ( String string ) { System . out . println ( string ) ; } public static void main ( String [ ] agrs ) { // Let's get MD5 for File index.php located at /Users/app/Download/ String file = "//cdn.crunchify.com/Users/app/Download/crunchify.png" ; String md5Value = crunchifyGetMd5ForFile ( file ) ; log ( "File: " + file + " \nValue: " + md5Value ) ; } } |
Po prostu uruchom powyższy program jako aplikację Java, a zobaczysz wynik podobny do tego.

Wynik konsoli IntelliJ IDEA:
1 2 3 4 |
File : / Users / app / Download / crunchify . png Value : 103e7ae51e641d674780f7a03b491321 Process finished with exit code 0 |
Jak zamierzasz używać tej sumy kontrolnej MD5 w czasie wykonywania do weryfikacji integralności plików?
Możesz porównać tę sumę kontrolną MD5 w czasie wykonywania z wartością przechowywaną w Twojej bazie danych, np. MySQL, Oracle itp.
Istnieje wiele innych sposobów na osiągnięcie tego samego, ale omówimy to w przyszłych samouczkach.