Como obter a soma de verificação MD5 para qualquer arquivo em Java? Como usar o utilitário DigestUtils.md5Hex do Apache Common?
Publicados: 2021-08-28
Reforçar a segurança do seu aplicativo corporativo é o maior desafio de qualquer organização.
Considere este cenário de produção real:
- Você tem um aplicativo que
reads the value
de um arquivo - Com base no valor do arquivo, ele
performs some operations
como adicionar/excluir/executar - Você implantou este aplicativo no ambiente de produção
- E se alguma
unauthorized person
changes the value
desse arquivo sem o seu conhecimento? - Seu aplicativo
simply gets new value
de um arquivo e executa a lógica que pode causarunexpected outcome
- Se você tiver a soma de verificação MD5 habilitada para esse arquivo - você
could have created an exception
com uma mensagem de erro clara eyou could have prevented disaster
ou resultados inesperados
O que é soma de verificação MD5?
A soma de verificação MD5 para um arquivo é um 128-bit value
, algo como uma impressão digital do arquivo. Pode ser útil tanto para comparar os arquivos quanto para seu controle de integridade.
Obter o mesmo valor para arquivos diferentes é quase impossível. Neste tutorial vamos criar um programa Java simples que cria e retorna valores MD5 para um determinado arquivo. No nosso caso é o arquivo index.php
.
Vamos começar:
Passo 1
Criar classe pública CrunchifyGetMD5ForFile.java
Passo 2
Importe abaixo duas dependências do maven para o arquivo pom.xml
do seu projeto. Tutorial para converter projeto em projeto maven.
1 2 3 4 5 6 7 8 9 10 |
< dependency > < groupId > commons - codec < / groupId > < artifactId > commons - codec < / artifactId > < version > 1.10 < / version > < / dependency > < dependency > < groupId > commons - io < / groupId > < artifactId > commons - io < / artifactId > < version > 2.4 < / version > < / dependency > |
Estamos usando bibliotecas commons-codec
e commons-io
.
Etapa 3
Crie a soma de verificação MD5 usando o utilitário DigestUtils.md5Hex
e imprima o resultado no console.
DigestUtils.md5Hex => Implementação encodeHex
1 2 3 4 5 6 7 8 9 10 |
protected static char [ ] encodeHex ( final byte [ ] data , final char [ ] toDigits ) { final int l = data . length ; final char [ ] out = new char [ l < < 1 ] ; // two characters form the hex value. for ( int i = 0 , j = 0 ; i < l ; i ++ ) { out [ j ++ ] = toDigits [ ( 0xF0 & data[i]) >>> 4]; out [ j ++ ] = toDigits [ 0x0F & data[i]]; } return out ; } |
Aqui está um programa completo.
Crie a classe crunchifyGetMd5ForFile.java
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 |
package crunchify . com . tutorials ; import org . apache . commons . codec . digest . DigestUtils ; import org . apache . commons . io . IOUtils ; import java . io . File ; import java . io . FileInputStream ; import java . io . IOException ; /** * @author Crunchify.com * How to get MD5 checksum for any given file in Java? Use commons-codec's DigestUtils.md5Hex. */ public class CrunchifyGetMD5ForFile { public static String crunchifyGetMd5ForFile ( String crunchifyFile ) { // File(): Creates a new File instance by converting the given pathname string into an abstract pathname. // If the given string is the empty string, then the result is the empty abstract pathname. File myFile = new File ( crunchifyFile ) ; return crunchifyGetMd5ForFile ( myFile ) ; } public static String crunchifyGetMd5ForFile ( File crunchifyFile ) { String crunchifyValue = null ; // FileInputStream: A FileInputStream obtains input bytes from a file in a file system. What files are available depends on the host environment. // FileInputStream is meant for reading streams of raw bytes such as image data. For reading streams of characters, consider using FileReader. FileInputStream crunchifyInputStream = null ; try { crunchifyInputStream = new FileInputStream ( crunchifyFile ) ; // md5Hex converts an array of bytes into an array of characters representing the hexadecimal values of each byte in order. // The returned array will be double the length of the passed array, as it takes two characters to represent any given byte. // DigestUtils(): Operations to simplify common MessageDigest tasks. This class is immutable and thread-safe. // However the MessageDigest instances it creates generally won't be. // The MessageDigestAlgorithms class provides constants for standard digest algorithms that can be // used with the getDigest(String) method and other methods that require the Digest algorithm name. // toByteArray(): Get the contents of an InputStream as a byte[]. // This method buffers the input internally, so there is no need to use a BufferedInputStream. crunchifyValue = DigestUtils . md5Hex ( IOUtils . toByteArray ( crunchifyInputStream ) ) ; // md5Hex(): Calculates the MD5 digest and returns the value as a 32 character hex string. } catch ( IOException e ) { log ( "Hey there is an error: " + e ) ; } finally { // closeQuietly(): Unconditionally close an InputStream. // Equivalent to InputStream.close(), except any exceptions will be ignored. // This is typically used in finally blocks. IOUtils . closeQuietly ( crunchifyInputStream ) ; } return crunchifyValue ; } // Simple log util private static void log ( String string ) { System . out . println ( string ) ; } public static void main ( String [ ] agrs ) { // Let's get MD5 for File index.php located at /Users/app/Download/ String file = "//cdn.crunchify.com/Users/app/Download/crunchify.png" ; String md5Value = crunchifyGetMd5ForFile ( file ) ; log ( "File: " + file + " \nValue: " + md5Value ) ; } } |
Basta executar o programa acima como um aplicativo Java e você verá um resultado semelhante a este.

Resultado do console do IntelliJ IDEA:
1 2 3 4 |
File : / Users / app / Download / crunchify . png Value : 103e7ae51e641d674780f7a03b491321 Process finished with exit code 0 |
Como você vai usar esta soma de verificação MD5 em tempo de execução para verificar a integridade do arquivo?
Você pode comparar essa soma de verificação MD5 em tempo de execução com o valor armazenado em seu banco de dados, como MySQL, Oracle, etc.
Existem várias outras maneiras de conseguir o mesmo, mas discutiremos isso em tutoriais futuros.