O uso de técnicas de inteligência artificial para processamento de imagens com a finalidade de detectar objetos vem nos últimos anos sendo impulsionado pela rápida evolução de placas gráficas e o desenvolvimento pela fabricante NVIDIA de bibliotecas focadas em inteligência artificial para suas placas gráficas “GPU”.
Como o Cuda que é instalado através da plataforma de Deep Learning do ArcGis Pro como uma dependência, essas placas de vídeo têm uma configuração significativamente melhor, pois são criadas para trabalhar com matrizes e tensores, superando todas as expectativas na entrega de resultados, possibilitando que empresas de tecnologias como Google, Facebook, Microsoft, Amazon, IBM, OpenIA ou consórcios Opensource desenvolvam Frameworks e bibliotecas que exploram esse poder de processamento sem paralelos até então para a criação de redes neurais complexas, com foco na resolução de problemas que antes somente o cérebro humano tinha capacidade de resolver com exatidão.
A Eldorado Brasil atua orientada em pilares como competitividade, inovação e valorização das pessoas e nesse sentido estimula e apoia as inciativas de desenvolvimento de soluções de tecnologia em sua equipe.
Nesse cenário de rápido desenvolvimento, nós da Eldorado passamos a acompanhar o avanço rápido da ESRI que com seus blogs GEOAI e Community, nos inspirou a testar a tecnologia de inteligência artificial geoespacial para resolver problemas de negócio da área florestal. Encontrando uma resposta para um problema antigo que é análise de sobrevivência e qualidade de plantio de eucalipto aos 90 dias a partir de imagens de drones.
Apesar da Empresa ter sido pioneira em 2012 no uso das imagens de drones para esse tipo de análise, essa atividade ainda demandava uma forte dedicação humana para validação de dados e consistências, trabalho realizado em amostragem devido a sua alta exigência de atenção e tempo.
Com o desenvolvimento de novas ferramentas e modelos de inteligência artificial ficou evidente que apesar de eficiente a análise de amostras nos limitara e que seria possível encontrar novas maneiras de analisar mais e melhor as imagens.
Um dos passos primordiais foi a definição do modelo a se utilizar. Pois para a detecção de elementos em uma imagem e a posterior contagem dos mesmos, é necessária uma análise dos modelos de Deep Leaning existentes a fim de identificar qual pode ser mais aderente a resolução do problema em questão.
Nosso projeto focou na utilização de segmentação de instancia baseada em uma rede Convolutional Neural Networks (CNN), Redes Neurais Convolucionais. Para se ter melhor eficiência na detecção da copa e seu tamanho, mesmo que existam plantas daninhas tocando a copa. A segmentação de instancia pode contribuir para o delineamento da copa da muda separando à de outros elementos, contribuindo para melhor eficiência no processo de detecção e extração.
A segmentação de instancia tem por objetivo identificar e rotular cada elemento de classe detectado na imagem, criar a segmentação pixel a pixel que compõem o objeto, definindo assim uma máscara sobre o elemento, se dois elementos se tocam eles são separados por mascaras distintas.
As redes CNN são modelos de Deep Learning, traduzindo aprendizado profundo, que tornam o processo de extração das características que melhor definem o alvo, algo implícito ao algoritmo uma vez que as redes convolucionais de múltiplas camadas as extraem através de convoluções que tem o mesmo princípio da aplicação de filtros como Blur, Galsean, entre outros. Esse processo diminui significativamente a quantidade de dados que no final são encaminhados para uma rede neural densamente conectada que faz a classificação.
No artigo publicado em 20 de março de 2017 Mask R-CNN, esse método unifica um detector de objetos Faster-RCNN e um segmentador, produzindo a segmentação dentro da caixa delimitadora garantindo, assim, melhor taxa de acurácia. Este artigo deu origem a uma implementação em python utilizando o framework Pythorch, a plataforma que serve de base para o fluxo de trabalho de treino e detecção de objetos utilizando o Mask R-CNN do ArcGis Pro.
A partir dessas técnicas de Deep Learn lançadas para a extensão “Image Analyst” foi desenvolvida uma metodologia de análise das imagens a partir de treinamento de um modelo de segmentação de instancia baseado no framework Mask-RCNN. Isso nos permitiu processar áreas de análises muito maiores e com uma taxa de acerto muito alta. Por exemplo, para uma área de 100.000 m² onde eram realizadas análises e contagem em apenas 800 m² (menos de 1%) e atualmente realizamos o censo das mudas em 100% da área o que nos permitiu um conhecimento mais amplo do stand de plantio e dos seus padrões na busca por uma ampliação da qualidade e eficiência.
A principal dificuldade de qualquer aplicação de aprendizado de máquina e Deep Learning é a rotulação adequada dos objetos que se deseja localizar em imagens, para transpor as dificuldades inerentes a essa etapa utilizamos a detecção manual feitas em parcelas, que nossos colaboradores já executavam, pegamos as circunferências de copas e importamos para ferramenta Labeled Objects.
Na sequência é feita a exportação dos dados para treinar o modelo através do Export Training Data para o RCNN Masks criando o dataset para treino.
Após treinarmos o primeiro modelo até que a função de perda não mais tivesse melhora no ajuste de pesos e a acurácia do modelo não tivesse ganho e o algoritmo parar a execução das épocas garantindo assim a melhor relação tempo de treino e precisão.
Testamos o modelo salvo em outras imagens verificando onde o mesmo sofria falhas na detecção. O resultado encontrado foi então utilizado por um analista que o importava para a ferramenta Labeled Objects rotulando as mudas que não foram detectadas pelo modelo. Exportando esse conjunto de dados seguindo passo relatado a cima criando novo dataset. Treinando um novo modelo, utilizando o modelo anterior como Pre-treined model diminuindo o tempo de treino e garantindo maior precisão.
O resultado final de nossa incursão em modelos de IA no ArcGis Pró tem garantido um produto mais preciso para análise de sobrevivência, quantificando os indivíduos vivos. A imagem abaixo mostra o resultado da detecção por parcela versos censo.
A tecnologia de inteligência artificial incluída no ArcGis Pro, é um fator chave no futuro da área florestal com grandes possibilidades para refinar e tornar mais rápida e assertiva a elaboração de tarefas que hoje são custosas para as equipes de SIG e Meio Ambiente, pode-se criar modelos para tarefas como classificação pixel a pixel de imagens orbitais e de drones, identificação de arvores nativas, detecção de moradores vizinhos as propriedades rurais de interesse. Assim como muitas outras possibilidades que tornaram indispensável a utilização dessa área da computação.
Você também pode gostar:
Seu trabalho apresentado no EU Esri 2021
Sorteio Exclusivo para Inscritos no EU Esri 2021
EU Esri 2021: GIS & Location Intelligence criando um futuro sustentável
Você gostou desse artigo?
O Portal GEO está sempre trabalhando para trazer novidades, tendências e o que há de melhor em dicas do universo GIS. Clique abaixo e faça sua inscrição gratuita para receber com comodidade todos os nossos artigos, que tenho certeza, vão te apoiar em seu cotidiano profissional e pessoal, te deixando sempre bem informado: