voltar para mapbiomas.org

Possíveis inconsistências na base de dados das estatísticas da Superficie de água, coleção 2

Bom dia.
Sou pesquisador do Instituto Paranaense de Desenvolvimento Econômico e Social (IPARDES). Inicialmente gostaria de parabenizar a equipe do Mapbiomas, pelo trabalho de excelência.
Provavelmente existem algumas inconsistências na base de dados das estatísticas da Superfície de água, coleção 2. Para demonstrar exemplificarei tomando o Estado do Paraná como base e os municípios de Toledo e Douradina, ambos com homônimos em outros estados da federação (MG e MS respectivamente), e os resultados para o ano de 2022.
Para o caso do Paraná, e de outros estados, os resultados divergem conforme as consultas feitas nas planilhas pivot_mun_sta, states_annual e mun_annual da coleção2.
A priori as inconsistências verificadas ocorrem ao comparar os critérios de seleção por estado e as consultas realizadas pelo código dos municípios:
1a) Na planilha pivot_mun_sta , seleção “state” PR, a superfície do Paraná em 2022 é 341.567,7161 Ha. Neste caso, ao selecionar "city"nos campos da tabela, são listados 360 municípios (O estado tem 399 municípios). Ou seja, 39 ficam de fora nesta maneira de seleção;
2a) Na planilha pivot_mun_sta, esses 39 municípios aparecem relacionados quando a seleção é feita para outros estados da federação. Por exemplo, o município de Toledo (oeste do Paraná) é relacionado quando o filtro “state” é MG. Isso provavelmente ocorre visto que em Minas Gerais também tem uma cidade com o nome de Toledo;
3a) Em outra planilha, a denominada states_annual, a superfície calculada para Paraná em 2022 foi 383.250,4563 Ha (diferença superior a 40 mil hectares em relação a planilha pivot_mun_sta pelo critério descrito anteriormente);
As divergência ficam mais evidentes conforme a forma de consulta/seleção da planilha denominada mun_annual:
1b) Quando a seleção em mun_annual é feita pelo critério da coluna “state” PR o resultado é o mesmo da planilha pivot_mun_sta, ou seja, o total da somatória dos municípios paranaenses é estimado em 341.567,7161 Ha;
2b) Todavia são listados 371 municípios (acréscimo de 11 em relação a tabela pivot_mun_sta);
3b) Desta vez, municípios do Paraná com nome homônimo em outros estados aparecem duplicados. Em cada duplicidade o código da coluna “code” é diferenciado, se referindo ao código de cada cidade homônima (exemplo: Douradinha “code” 4107256 - Paraná; e Douradina “code” 5003504 - Mato Grosso do Sul).
Outros apontamentos verificados ao comparar as consultas/seleções entre as tabelas, conforme os municípios citados anteriormente e o ano de 2022:
1c) na tabela pivot_mun_sta o município de Douradina aparece somente na seleção “state” PR, com o resultado da área sendo a somatórias das áreas dos dois municípios. Isto significa que na planilha em questão, o resultado da somatória final para o conjunto estado do Paraná considera o cálculo da área dos dois municípios homônimos, o localizado no Paraná e o situado no Mato Grosso do Sul. Na planilha a somatória desse caso é 315,0397108 ha, sendo 154,2651755 Ha de Douradina do Pr e 160,774535 Ha de Douradina do MS;
2c) na seleção “state” MS da planilha pivot_mun_sta, o município de Douradina não está listado na somatória total das áreas de Mato Grosso do Sul;
3c) Douradina também não está listado na planilha mun_annual como município de Mato Grosso do Sul;
Na planilha “mun_annual” outra seleção (filtro) possível pode ser feita utilizando como critério a coluna “code”.:
1d) Ao selecionar os códigos iniciados com 41, que é o referente aos municípios do estado, são listados os 399 municípios do Paraná. Neste caso a somatória é igual ao da planilha states_annual (383.250,4563 ha);
2d) No entanto, ao observar a coluna “state” da planilha mun_annual, 39 municípios aparecem listados como pertencentes a outros estados. O exemplo do município de Toledo é ilustrativo, visto que aparece somente na seleção “state” MG;
3d) Nesta seleção (“code” iniciados com 41) a área do município de Douradina aparece com 154,2651755 Ha, ou seja somente a medida calculada para o município situado no Paraná; Provavelmente esse tipo de situação explica a divergência do cálculo final de cada uma das tabelas em foco.
Em resumo:
1e) As áreas para o Paraná divergem em mais de 10% entre planilhas pivot_mun_sta e states_annual;
2e) Na planilha mun_annual o cálculo da área total para o Paraná são divergentes conforme a forma de consulta/seleção, entre as colunas “code” 41… ou “state” PR, com a primeira coluna resultando no mesmo valor calculado para states_annual e a segunda convergindo com o resultado de pivot_mun_sta;
3e) As inconsistências apontadas, a priori, se relacionam a municípios homônimos e as suas respectivas codificações.
4e) Provavelmente essas inconsistências afetem os dados e resultados dos demais estados, por ora não exemplificados;
5e.1) Não relatado anteriormente: os resultados das somatórias de outros anos para o estado do Paraná apresentados na planilha pivot_mun_sta da coleção 2 divergem da somatória das áreas calculadas na coleção1. Isso acontece quando comparadas as planilhas pivot_mun_sta da coleção 2 com as planilhas states_annual e mun_annual da coleção1;
5e.2) Ao tomar o recorte das grandes regiões, no caso do Sul essas inconsistências se repetem; As demais planilhas (biomas, regiões hidrográficas etc…) não foram analisadas, mas pode ser que parte dos problemas relatados também ocorram.

Por fim, registro que para a consulta/seleção da coleção2 foi feita a exportação das tabelas para um novo arquivo excel, de modo a possibilitar o uso da ferramenta de filtragem dos dados.

Diante do exposto solicito orientações. Obrigado.

Atenciosamente,