A qualidade de dados refere-se ao grau em que os dados são adequados para o uso pretendido, sendo fiáveis, completos e corretos o suficiente para suportar decisões, análises ou operações.
Para avaliar a qualidade de dados, usa-se um conjunto de dimensões (critérios que ajudam a medir e melhorar os dados).
As principais dimensões de qualidade de dados (as mais reconhecidas em padrões como ISO 8000, DAMA-DMBOK e Gartner) são:
Principais dimensões da qualidade de dados
Precisão (Accuracy)
- Os dados representam corretamente a realidade ou o valor real.
- Ex.: O endereço de um cliente está escrito corretamente e corresponde ao local verdadeiro.
Completude (Completeness)
- Todos os dados necessários estão presentes.
- Ex.: Um registo de cliente contém nome, morada, telefone e NIF — sem campos em branco.
Consistência (Consistency)
- Os dados são coerentes entre diferentes sistemas, bases ou fontes.
- Ex.: A data de nascimento de um cliente é igual na base de dados de CRM e no sistema de faturação.
Atualidade / Atualização (Timeliness)
- Os dados estão atualizados e refletem o estado mais recente.
- Ex.: O número de telefone do cliente está atualizado após uma mudança.
Validade / Conformidade (Validity / Conformance)
- Os dados respeitam regras, formatos e domínios pré-definidos.
- Ex.: Um código postal tem o formato “0000-000” em Portugal.
Unicidade (Uniqueness)
- Não existem registos duplicados para a mesma entidade.
- Ex.: Cada cliente tem apenas um ID único no sistema.
Integridade (Integrity)
- As relações entre dados estão corretas e preservadas.
- Ex.: Uma encomenda está sempre associada a um cliente existente.
Relevância (Relevance) (opcional, mas cada vez mais usada)
- Os dados são úteis e adequados para a finalidade a que se destinam.
- Ex.: Não é relevante armazenar dados sobre o estado civil se não forem usados em nenhum processo.
Acessibilidade / Disponibilidade (Accessibility)
- Os dados estão disponíveis e facilmente acessíveis quando necessário.
- Ex.: Os utilizadores autorizados conseguem aceder aos dados sem obstáculos técnicos.
Auditabilidade / Rastreabilidade (Traceability) (opcional)
- É possível rastrear a origem e as alterações dos dados.
- Ex.: Saber quem modificou um registo e quando isso ocorreu.
As seis dimensões mais usadas no dia a dia são: Precisão, Completude, Consistência, Atualidade, Validade, e Unicidade.
A qualidade dos dados é essencial para garantir decisões corretas, processos eficientes e análises fiáveis. Avaliá-la através de dimensões permite identificar falhas e implementar melhorias contínuas. Quando os dados são exatos, completos, coerentes, atualizados e relevantes, tornam-se um ativo estratégico, reduzindo riscos e aumentando o valor da informação para a organização.