Reliable engineering
takes many forms


IA nas florestas: procurando o significado de montanhas de dados

7 Julho 2023by admin

Introdução

Tal como foi mencionado na Newsletter de Maio, a recolha de dados de campo nas florestas é dificil e dispendiosa, pelo que quanto mais informação alguém puder extrair, melhor será o trabalho. Dependendo da tecnologia, da distância até à copa das árvores e das especificações do trabalho, os dados de campo podem ascender de 40Mb até 500Mb por hectare pesquisado. Como a saída dos dados de campo é a entrada de todos os sistemas de Inteligência artificial [IA], os decisores exigem que qualquer sistema de apoio à decisão seja capaz de elevadas capacidades de abstração para extrair as variáveis críticas sobre as quais irão atuar.

A análise das florestas depende geralmente da computação eficiente de dois tipos de elementos tridimensionais e da capacidade de os separar corretamente: o cenário, que é considerado imutável, e a vegetação que varia no tempo.

A análise das florestas depende geralmente da computação eficiente de dois tipos de elementos tridimensionais e da capacidade de os separar corretamente: o cenário, que é considerado imutável, e a vegetação que varia no tempo.

O cenário é maioritariamente composto pela superfície do solo mas, dependendo do contexto ou da aplicação, pode conter pontos de referência ou características como linhas aéreas, caminhos-de-ferro, estradas, canais e aquedutos, construções ou estufas, etc. Em muitas aplicações, as coordenadas do cenário são mais ou menos conhecidas a partir da cartografia, o que não dispensa a necessidade de identificar as características do cenário, uma vez que os dados cartográficos podem estar desatualizados ou com precisão e detalhe insuficientes (a largura de uma estrada, por exemplo). A extração das características do cenário é, portanto, muitas vezes um requisito primordial: por exemplo, ao medir a invasão florestal ao longo das bermas de uma estrada, um método eficiente é começar por localizar a estrada utilizando coordenadas geográficas da cartografia e, em seguida, medir as distâncias das árvores e dos ramos até envolver verdadeiramente a estrada, com as suas curvas e variações de largura, cruzamentos, instalações à beira da estrada, etc.. O cenário e as suas características podem mudar ao longo dos anos, no entanto, a principal diferença é que o sistema não o segue como um “ativo” em mudança, mas como um activo fixo que pode necessitar de uma atualização.

Embora a vegetação mude lentamente ao longo do tempo, especialmente a silvicultura cujo crescimento se mede em anos ou em décadas, ao contrário da agricultura que tem ciclos intra-anuais, essa variação é um dos valores críticos do negócio. Assim, o sistema de gestão de ativos é concebido para abraçar a mudança como a sua variável chave que correlaciona observações e sintetiza informação e valor.

A ênfase na eficiência é dominante, uma vez que, no contexto florestal, a precisão e a minimização dos recursos computacionais são objetivos opostos: um é melhorado à custa do outro. Assim, é importante dominar os requisitos de qualidade desde o início, uma vez que estes podem conduzir a diferentes tecnologias e procedimentos eficientes de aquisição de dados.

Inteligência Artificial tradicional e moderna

Na Albatroz Engenharia, o termo Inteligência Artificial [IA] é usado num sentido lato. Engloba tanto algoritmos “tradicionais” e processamento de sinais como métodos “modernos” como a aprendizagem automática. Para além disso, em alguns casos, as abordagens de ambas as famílias foram testadas para o mesmo problema e a comparação dos resultados é elucidativa [1]. Notamos que, embora se espere que a aprendizagem automática seja uma abordagem mais adequada para, por exemplo, a classificação de espécies de árvores, outras tarefas, como a identificação de objetos ou características específicas, podem ser igualmente bem sucedidas com técnicas simples e mais diretas, como a aplicação de algumas regras e a análise de dados em imagens 2D simples (por exemplo: a detecção de ninhos da lagarta processionária do pinheiro).

Uma vez que a maioria dos métodos de aprendizagem automática depende da disponibilidade de grandes conjuntos de dados experimentais, este facto pode constituir um obstáculo à exploração de novas formas de dar significado aos dados. Pelo contrário, o processamento de sinais baseia-se em regras e, embora exija uma maior compreensão do problema a resolver, pode ser desenvolvido a partir de uma mão-cheia de exemplos do terreno. De um modo geral, a concorrência de ambos os conjuntos de ferramentas permite escolher a melhor ferramenta para cada etapa da I&D na resolução de cada problema.

Do LIDAR e dados dos sensores de imagem à informação

Os dados florestais podem ser adquiridos numa missão utilizando o LiDAR e/ou sensores de imagem e, possivelmente, sensores de infravermelhos/termografia. Estes dados brutos são necessários, para alimentar algoritmo(s), quer sejam simples (por exemplo, contagem de árvores isoladas), de complexidade média (por exemplo, medição da distância entre árvores e fios em linhas elétricas) ou muito complexo (por exemplo, deteção de espécies “exóticas” numa floresta ou estimativa do volume do sub-bosque para avaliar o risco de incêndio). Em seguida, precisaremos de extrair ou inferir a informação , para forma humana e estruturada que queremos tratar a um nível de abstração mais elevado. Para o efeito, podemos utilizar diferentes ferramentas. A partir de um conjunto de pontos 3D (de LiDAR) ou de pixeis 2D (de uma única imagem), podemos começar por encontrar os nossos objetos de interesse, como árvores, mas também (dependendo do contexto e dos objetivos) rochas, torres e fios de linhas aéreas, ou outras estruturas de origem humana (por exemplo, casas, pontes).

Esta informação surge naturalmente em três dimensões [3D] no caso do LiDAR (que pode incluir características para além das distâncias de alcance, tais como a intensidade dos sinais recebidos). Juntando várias imagens 2D, que podem incluir cor, também se pode usar ferramentas de fotogrametria para obter representações 3D embora, tal como mencionado na secção anterior, isso possa ser desnecessário ou inadequado para alguns objetivos.

Em primeiro lugar, devido à enorme quantidade de dados e também para melhor adequação a cada actividade, é útil particionar os dados de aquisição em unidades que façam sentido para cada negócio, tais como vãos (definidos por duas torres) no caso de uma inspeção de linhas elétricas, quilómetros ou milhas para estradas ou caminhos-de-ferro (Figura 1) ou quadrículas de terreno de tamanho fixo para aplicações de uso mais geral.

No alt text provided for this image
Figura 1 – 2 km de levantamento ferroviário divididos em vinte secções de 1 hectómetro. Note-se a sobreposição dos dados LiDAR nas transições entre os hectómetros para assegurar que as árvores ficam completas e as gamas de cores individuais otimizadas para cada conjunto de dados.

Nos trabalhos específicos de cada unidade de negócio, juntamente com o reconhecimento ou identificação de objetos, podemos modelar o terreno (DTM: Digital Terrain Model  ou MDT: Modelo Digital de Terreno) e  a superfície de sobreposição (DSM: Digital Surface Model ou MDS: Modelo Digital de Superfície). Além disso, podemos (e muitas vezes queremos) calcular estatísticas e relações entre objetos, como a distância das árvores às linhas elétricas. Note-se que podemos aplicar diferentes níveis de detalhe/granularidade aos objetos, em função dos objetivos, da atividade, da qualidade dos dados ou dos recursos disponíveis. Podemos estar interessados na floresta como um todo, eventualmente em blocos de vegetação, ou na identificação de cada árvore isolada, eventualmente também com o seu tronco principal e alguns ramos (ou no caso de uma torre ou poste de linha elétrica, podemos representá-la com um único ponto, ou ter um modelo mais completo, incluindo até os isoladores.

Para além disso, quando temos pelo menos duas observações diferentes do mesmo objeto com um intervalo de tempo podemos compará-las, traduzindo-se em informação mensurável e significativa, como o crescimento da vegetação (altura e volume).

No alt text provided for this image
No alt text provided for this image
Figura 2 – Um vão de linha elétrica de 200m com duas observações de campo, 2018 e 2020, utilizado para estimativas de crescimento de árvores e de biomassa. A biomassa está relacionada com a captura de dióxido de carbono.

Tendo recolhido e analisado muitos dados ao longo do tempo, podemos ser capazes de inferir mais informações. Por exemplo, muitos tipos de análise de risco podem ser refinados, reduzindo as margens de erros, com recurso a mais dados de diferentes naturezas. Num outro exemplo, a classificação de espécies de árvores pode ser efetuada dentro de um leque de espécies relevantes, especialmente se se dispuser de dados de referência  com boa verosimilhança, variedade e quantidade.

Da informação à apresentação e à compreensão

Podemos ter armazenado enormes quantidades de dados brutos e inferido muitos dados novos e úteis, mas tudo isso pode perder o seu objetivo se não formos capazes de os compreender e visualizar e de os apresentar às partes interessadas. Note-se que a visualização também pode ser importante no processo de compreensão. De pouco serve ter muitos números positivos e negativos diferentes, por exemplo, sobre o crescimento das árvores, da distância à linhas eléctricas ou ferrovias, da variação do volume de madeira ou de biomassa, do número de insetos ou de defeitos, se não compreendermos o que se está a passar. O estado atual é mau ou bom? Melhor ou pior do que as observações anteriores? Quando e onde? Como está a evoluir? Quão crítico é? Quais são as causas prováveis?

Para ajudar na racionalização dos dados, devemos analisá-los, começando por um tratamento estatístico, tanto a nível global como local (no espaço e no tempo), e encontrar correlações. Os números podem ser visualizados numa folha de cálculo ou num quadro, com números globais e parciais agregados e organizados por unidades de negócio, juntamente com quadros e gráficos, salientando os factos mais relevantes para o negócio (por exemplo, cores diferentes para diferentes níveis de risco). A visualização de mapas com uma aplicação interativa, também com cores para as regiões de interesse, é extremamente útil tanto para uma visão geral e cativante como para localizar problemas, aprofundando os pormenores se for incluída informação individual (por exemplo, ao nível da árvore individual) associada a ferramentas de zoom.

No alt text provided for this image
Figura 3 – Quatorze parcelas diferentes estão representadas em apenas 30ha de floresta de Eucaliptos. Embora o plantio tenha sido simultâneo e igual em todas as parcelas, após 11 anos de crescimentos as diferenças na densidade de árvores são significativas.

Da compreensão ao apoio à decisão

A compreensão dos dados processados, no sentido das questões expressas nas secções anteriores (qual é a situação, o que se passa, porquê, onde, quais são os riscos), é fundamental para apoiar as decisões de gestão.

Com os riscos e/ou frutos do negócio calculados, quantificados e localizados, os gestores podem decidir justificadamente sobre o tipo e o montante dos investimentos e da manutenção a promover e a realizar no tempo e no espaço, otimizando a distribuição dos recursos disponíveis. O conhecimento adicional obtido também fornece informações sobre possíveis novas direções comerciais. A Figura 3 destaca como os dados espaciais e numéricos contribuem de diferentes formas para a tomada de decisões. Juntamente com a amostragem no terreno dos diâmetros dos troncos e do números de árvores, pode ser estabelecido um calendário ótimo para o corte das árvores, juntamente com uma estimativa mais precisa do valor económico de cada parcela. Os dados operacionais processados, juntamente com relatórios executivos desenhados à medida das necessidades, são assim um precioso contributo para as ferramentas do próprio cliente com os seus dados privados, para o seu processo de tomada de decisões.

Conclusões

Os dados recolhidos sobre a floresta e a vegetação com recurso a sensores de imagem e LiDAR ao longo do tempo podem constituir um tesouro de informação para a actividade, pelo que não devem ser dispensados. Cada aquisição é no entanto, dispendiosa e gera uma enorme quantidade de dados. Desta forma, para além de os armazenar eficientemente para utilização futura com qualquer tipo de algoritmos, devem ser calculados dados mais abstratos a partir deles e também ser devidamente armazenados. Podemos então ter a história de cada árvore individual, o que permitirá decisões de gestão mais informadas, tendo a capacidade de compreender tanto os casos locais como o quadro global com as suas distribuições espaço-tempo. Para isso, a análise e agregação de dados, juntamente com as ferramentas visuais, são também essenciais para uma avaliação e decisão mais fácil, que previsivelmente contribui para a otimização da afetação e planeamento de recursos, minimizando os custos/riscos, e maximizando lucro e outros objetivos, para além de alargar o conhecimento do nosso objeto de estudo. De um modo geral, alargaremos os horizontes das empresas e da investigação, ao mesmo tempo que abordaremos as preocupações ambientais.

Referências

[1]  J. Gomes-Mota, “Automated Visual Inspections – Comparing Computer Vision to Machine Learning” – 25th International Conference on Electricity Distribution, paper nº 52, CIRED, Madrid, Spain, 3-6 June 2019.