Imagens de satélite são ferramentas valiosas para diversos propósitos, incluindo o mapeamento de uso e cobertura do solo (Lulc, na sigla em inglês). De acordo com um grupo de pesquisadores do Instituto Nacional de Pesquisas Espaciais (Inpe), a eficácia dessas “fotografias” pode ser aprimorada se forem avaliadas por especialistas antes de serem analisadas com algoritmos e outras ferramentas computacionais.
A equipe divulgou um estudo na revista Forests sobre o mapeamento de uso e cobertura do solo no estado de São Paulo. O estudo considerou a expertise dos cientistas na pré-seleção das imagens para classificar o uso e a cobertura do solo em seis categorias: floresta, plantação florestal, corpos d’água, áreas urbanas, agricultura e pastagem.
Os dados coletados pelo grupo mostram que as áreas florestais estão concentradas principalmente na região leste de São Paulo, predominantemente em encostas mais íngremes, representando 19% da área de estudo. A pastagem e a agricultura dominam 73% da paisagem paulista, representando, respectivamente, 39% e 34%. Para validar os resultados, a equipe os comparou à classificação do Projeto MapBiomas (rede colaborativa que produz mapeamento anual da cobertura e do uso da terra), obtendo uma acurácia geral de 85,47%.
“A inovação do método proposto é selecionar as imagens com base nas características espectrais e temporais de classes predefinidas de Lulc. Primeiro, definimos as seis classes que seriam mapeadas no ano de 2020. Depois, analisamos visualmente suas características espectrais de variabilidade ao longo do ano, para selecionar aquelas que melhoram cada classe de Lulc, individualmente, nas imagens. Em seguida, pré-processamos essas imagens para gerar um mapa destacando cada classe de Lulc”, resume Yosio Edemir Shimabukuro, pesquisador da Divisão de Observação da Terra e Geoinformática (DIOTG) do Inpe e primeiro autor do artigo.
Classificação
A equipe utilizou dois mosaicos de imagens do satélite Landsat-8 Operational Land Imager (OLI), da Nasa (agência espacial norte-americana): 379 capturadas de janeiro a junho de 2020 (final da estação chuvosa e início da seca) e 212 feitas de maio a setembro (estação seca). Com base nesses mosaicos, investigou o período temporal mais adequado para classificar cada categoria.
“Um mosaico anual – no nosso caso, de janeiro a dezembro de 2020 – ajuda a melhorar a classificação dos corpos d’água. Já para identificar as classes urbana e florestal, os melhores resultados foram alcançados com imagens de maio a setembro de 2020, que é a estação seca. Para a classificação da agricultura, utilizamos imagens de janeiro a junho de 2020, período que destaca a categoria, por ser época de cultivo”, explica Egídio Arai, coautor do artigo.
Segundo ele, o grupo começou classificando a água, que é uma tarefa mais fácil, seguida por área urbana, floresta, agricultura e, por último, as áreas de floresta plantada. “Assumimos que todas as áreas restantes estavam cobertas por pastagens.”
Classificar as florestas plantadas exigiu a utilização de imagens de maio a setembro do período de 2013 a 2020. “A diferença da floresta plantada para a permanente é justamente a temporalidade. Por isso, usamos imagens de 2013 a 2020. Sabemos que, no Estado de São Paulo, o que mais se planta é eucalipto, que tem ciclo de corte de cinco a sete anos. Assim, se eu usar imagens de um único ano, e calhar de ser justamente quando as árvores foram cortadas, não vou entender que é uma floresta plantada. Ela tem muitos ciclos de corte, então é preciso mostrar ao algoritmo que ele terá de usar muitas imagens para classificar aquele tipo de vegetação”, explica Gabriel Máximo da Silva, doutorando em sensoriamento remoto no Inpe.
As classes de uso e cobertura do solo foram categorizadas individualmente com o uso de bandas espectrais específicas, índices espectrais (resultado de operações matemáticas entre valores numéricos de pixels das bandas de uma imagem) e também imagens de fração (geradas a partir de um modelo linear de mistura espectral). O grupo empregou um algoritmo classificador conhecido como Random Forest, disponível na plataforma Google Earth Engine (GEE), para a classificação das imagens em cada classe Lulc. “Por meio de diferentes processamentos, procuramos realçar cada categoria de interesse, utilizando as bandas espectrais originais e tentando destacar cada alvo”, relata Shimabukuro.
O artigo publicado na Forests é apenas um dos resultados do projeto “Análise espaço-temporal do uso e cobertura da terra no estado de São Paulo utilizando técnicas de sensoriamento remoto”, coordenado por Shimabukuro e financiado pela FAPESP. O objetivo geral foi mapear, monitorar e analisar as mudanças no uso e cobertura da terra entre 1970 e 2020 no Estado de São Paulo, por meio de sensoriamento remoto e geoprocessamento.
Nuvens
Uma das dificuldades do uso dessas técnicas, segundo Arai, são as nuvens que encobrem, nas imagens, aquilo que se quer visualizar. De acordo com o pesquisador, mesmo restringindo o período estudado, ainda há nuvens e sombras nas imagens. Isso sem contar a dificuldade do próprio algoritmo que, mesmo sendo bastante preciso, tem seus limites.
“O algoritmo filtra as nuvens, tirando-as das imagens, e ainda leva em conta os percentis da série histórica [cada uma das partes, na divisão da amostragem em cem partes]. Assim, é possível selecionar visualmente os melhores percentis para fazer a classificação. Só que, mesmo com o filtro do algoritmo, restam nas imagens as sombras ou pedaços de nuvens, ou ainda nuvens menos espessas. O Landsat tem uma resolução temporal de 16 dias. Num período chuvoso é complicado conseguir imagens sem nuvens.”
No projeto apoiado pela FAPESP, como a intenção era avaliar um período longo, a maior cobertura é do Landsat, mas o grupo lançou mão de imagens dos outros satélites também, como Sentinel-2 MSI; Terra MODIS; PROBA-V; CBERS-4 WFI, MUX, PAN; SRTM; RapidEye; Worldview, VIIRS, entre outros. Cada um deles agrega diferentes resoluções, tanto temporais quanto espaciais.
“É possível usar imagens de todos eles, em conjunto: por exemplo, os dados do Landsat com o melhor do Sentinel-2 MSI, que é a resolução espacial, e o melhor no MODIS, que é a resolução temporal, quase diária. O Sentinel tem uma resolução espacial de 10 metros; no Landsat, ela é de 30 metros. Então, haveria mais detalhes espaciais com o Sentinel. No MODIS, a possibilidade de conseguir imagens sem nuvens é maior, por conta da resolução temporal, mas a resolução espacial dele é pobre. Então, pode-se utilizar a resolução espacial do Landsat. Eu não me lembro de ver outros trabalhos empregando vários sensores combinados para obter uma melhor classificação de uso e cobertura do solo”, ressalta Arai.
Replicabilidade e referência
Segundo os cientistas, tentar melhorar a classificação pré-selecionando as imagens e categorizando primeiramente as paisagens mais fáceis aparentemente reduz a ocorrência de erros de classificação. “Creio que, nesse sentido, o trabalho traz uma contribuição para a discussão e a compreensão das mudanças de uso e cobertura do solo no contexto dos esforços gerais para entender seus impactos nas mudanças climáticas globais. Também é mais uma ferramenta disponível para os tomadores de decisão”, afirma Silva.
Shimabukuro assegura que a metodologia pode ser aplicada em outros lugares, mas deve ser adaptada às condições locais.