Calibração de instrumentos e validação de dados

Existem muitos fatores que influenciam as medidas realizadas por sensores e instrumentos de medida em campo e nos testes em laboratório, sendo praticamente impossível efetuar uma medição que seja totalmente isenta de erros ou incertezas. Assim, torna-se necessário conhecer esses fatores para avaliar a qualidade dos dados de modo qualitativo e quantitativo. Por exemplo, há desgaste em todos os materiais que compõem um instrumento, sendo necessário quantificar a influência desta deterioração para efetuar a correção dos valores obtidos e assegurar a confiabilidade das medidas.

A calibração é o conjunto de operações que estabelecem a relação entre os valores indicados por um instrumento ou um sistema de medição e os valores representados por um conjunto de medidas de referência, sob condições previamente especificadas. Ela tem o objetivo de assegurar a confiabilidade de um valor obtido por uma determinada fonte, como um instrumento meteorológico.

A calibração de instrumentos pode ser feita por um laboratório, emitindo-se um certificado de suas condições, sempre seguindo um conjunto de normas definidos para cada tipo de equipamento, definidas por órgãos reguladores. Em uma primeira etapa, busca-se uma relação entre os valores indicados e as incertezas de medição; em uma segunda etapa, utiliza-se esta informação para estabelecer uma relação visando a obtenção de um resultado de medição a partir de uma indicação.

Cada tipo de instrumento meteorológico possui um ambiente específico para testes, de modo a reduzir o número de variáveis que influenciem de modo considerável os resultados das medidas. No caso de instrumentos instalados em campo, pode-se fazer uma seleção de dados que estejam fora dessas condições. Por exemplo, desconsiderar valores medidos de radiância próximos ao nascer e pôr do sol ou com ocorrência de nuvens, períodos que a resposta eletrônica do equipamento pode não representar valores verossímeis da grandeza estudada.

Um dos métodos de calibração mais utilizados é o ajuste linear do tipo “y = ax + b” onde “a” é o coeficiente angular e “b” o linear. A aferição periódica da calibração permite estimar um ajuste linear que possa representar a degradação da calibração do instrumento ao longo tempo. Os parâmetros do ajuste linear correspondem aos termos da equação típica para cada conjunto de variáveis envolvidas com cada equipamento.

Nesse método, os valores medidos pelo instrumento são plotados no gráfico em função de outra variável que influencie no comportamento da primeira. Através de um ajuste linear, como o Método dos Mínimos Quadrados, obtém-se os coeficientes. Com a reta resultante desse ajuste, é possível estimar novos valores da variável medida pelo instrumento e compará-las com as realmente obtidas ao longo do tempo.

A incerteza no valor da variável final estimada é obtida propagando-se a contribuição da incerteza de cada grandeza envolvida na sua estimativa, segundo a Teoria dos Erros.

Validação

Da mesma forma que erros e incertezas são inerentes às medidas geradas por um instrumento, o resultado gerado por um modelo numérico também não é uma representação completamente fiel da realidade. A validação é o mecanismo que verifica se as informações geradas por um processo (de medição ou de modelagem) atendem às expectativas do usuário, quantificando sua acurácia com relação aos valores esperados.

As regras de validação vão desde simples comparação de valores até verificações mais complexas com base nas informações geradas por outros processos no mesmo período de tempo.

A validação de limites verifica se os valores analisados representam valores fisicamente possíveis de serem obtido – por exemplo, a umidade relativa do ar deve estar entre 0% e 100%. Já a validação lógica considera que muitos dos registros geram valores médios, máximos e mínimos referentes ao intervalo de tempo do monitoramento – por exemplo, a temperatura média de um período não pode ser maior que a temperatura máxima ou menor que a temperatura mínima deste mesmo período. Por fim, a validação de limites do período identifica valores suspeitos de erros com base na comparação dos valores de um intervalo específico – por exemplo, a diferença de temperatura máxima permitida para um determinado horário deve ser menor que 15°C.

A validação temporal verifica o comportamento histórico da variável baseada em sua série temporal, com o objetivo de saber se essa informação é consistente conforme o período de geração – por exemplo, temperatura de 0°C no verão brasileiro indica erro. O escore (razão entre a diferença entre o valor e a média do período e o desvio padrão) avalia quantas vezes o valor analisado se afastou do desvio padrão, a partir da média da amostragem. Caso o escore seja muito grande, isso pode indicar um erro.

A validação espacial utiliza os dados de várias estações próximas para detectar erros ou valores suspeitos. Para isso, assume-se que existe uma correlação ou padrão de comportamento quanto a distribuição espacial entre as estações mais próximas. Pode-se restringir o raio de abrangência do cálculo de correção para um certo número de quilômetros, limitando àquelas que possuam informações de um mesmo período. Para verificar quais as estações estão correlacionadas umas com as outras, pode-se utilizar o coeficiente de correlação de Pearson. Quanto maior o valor desse coeficiente, melhor a correlação: por exemplo, 0.70 a 0.89 indica uma correlação forte.

Selecionando as estações com correlação muito forte, pode-se utilizar uma regressão linear do tipo “y = ax +b” (equação 1) para gerar um valor estimado para cada uma das estações, baseando-se nos dados das estações próximas (xi,d é o dado observado na estação próxima i em um período d):

\(\hat{y}_{i,d}=a_ix_{i,d}+b_i (1)\)

Também calcula-se a raiz do erro médio quadrático (equação 2) para comparar os valores estimados com os observados:

\(RMSE_i=\sqrt{\frac{\sum\limits_{d=1}^N(y_d-\hat{y}_{i,d})^2}{N}} (2)\)

Com base nesses erros médios, pode-se estimar os valores para as estações próximas e utilizá-lo como variável para ponderar o dado em questão (equação 3, onde m é o número de pares de estações):

\(w_d=\frac{\sum\limits_{i=1}^m\frac{x_{i,d}}{RMSE_i^2}}{\sum\limits_{i=1}^m\frac{1}{RMSE_i^2}} (3)\)

Calculando-se o erro padrão (equação 4), é possível determinar o intervalo de confiança conforme metodologia de Mateo e Leung (2010) (equação 5):

\(SE=\sqrt{\frac{m}{\sum\limits_{i=1}^m\frac{1}{RMSE_i^2}}} (4)\)
\(w_d-c\times SE\leq y_d\leq w_d+c\times SE (5)\)

O valor de c é uma constante que indica quantas vezes, além do erro padrão, será o intervalo de confiança, podendo variar conforme a variável analisada.

Fontes

BABA, Ricardo Kazuo; VAZ, Maria Salete Marcon Gomes; COSTA, Jéssica da. Agrometeorological data correction using statistical methods. Rev. bras. meteorol., São Paulo , v. 29, n. 4, p. 515-526, dez. 2014 . Disponível em <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-77862014000400005&lng=pt&nrm=iso>. acessos em 14 jan. 2016. http://dx.doi.org/10.1590/0102-778620130611.

MATEO M. A. F.; LEUNG C. K. Design and Development of a Prototype System for Detecting Abnormal Weather Observations , ACM, 2010.