dissertação

Detecção e estimação de distância de marcos visuais por um veículo autônomo a partir de segmentação de imagens com aprendizado profundo e processos Gaussianos

Carregando...
Imagem de Miniatura

Notas

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Departamento

Programa de Pós-Graduação em Engenharia de Sistemas e Automação

Programa de Pós-Graduação

Departamento de Engenharia

Agência de fomento

Tipo de impacto

Tecnológico

Áreas Temáticas da Extenção

Tecnologia e produção

Objetivos de Desenvolvimento Sustentável

ODS 9: Indústria, inovação e infraestrutura

Dados abertos

Resumo

No cenário de evolução constante das tecnologias para a implementação de veículos autônomos, a precisão na localização do veículo emerge como um desafio significativo. O objetivo deste trabalho é propor um algoritmo que aplique técnicas de predição de distâncias para estimar a distância entre o veículo posicionado com uma câmera e marcos no ambiente ao qual ele será submetido. Para isso, foram empregadas técnicas de visão computacional para detecção dos marcos e em seguida foi feita a segmentação dos objetos de forma a incrementar a percepção do algoritmo quanto ao ambiente. Para o desenvolvimento do algoritmo de predição foi escolhida a linguagem Python e foi considerado um banco de dados real com aproximadamente 8000 amostras coletadas em campo na Universidade de Waterloo, por meio de um veículo autônomo instrumentado. A utilização da rede YOLO-v8 nos modelos de Detecção e de Segmentação de objetos, a rede DeTr (Detection Transformers) e a rede SAM (Segment Anything Model) foram avaliadas para fornecer os dados de entrada que foram relacionados a estimação da distância a partir de técnicas de aprendizado de máquinas com o modelo GPR (Gaussian Process Regression). Ao final do projeto, foi observada superioridade da rede YOLO-v8 no modelo de segmentação para a tarefa de detecção de objetos, com um Recall Médio de 0,76 e maP@0,5 de 0,891, evidenciando o benefício do uso das máscaras de segmentação também para detecção de objetos. A análise mostrou que a combinação das redes YOLO-v8 Segmentação e SAM aprimora a percepção do ambiente com um coeficiente DICE de 71,039% e reduz significativamente o erro na predição de distâncias, alcançando um MAE de 0,65 metros. No entanto, essa combinação resultou em um aumento do tempo de processamento, destacando-se como um desafio para a aplicação em tempo real a partir do hardware utilizado. A partir dos resultados, é possível notar que a incorporação de características de segmentação aos dados de entrada melhora substancialmente o desempenho do modelo GPR na predição de distâncias, ressaltando o potencial das técnicas de visão computacional na melhoria da localização e decisão em veículos autônomos.

Abstract

In the constantly evolving scenario of technologies for autonomous vehicles implementation, precision in vehicle localization emerges as a significant challenge. The objective of this work is to propose an algorithm that applies distance prediction techniques to estimate the distance between a vehicle equipped with a camera and landmarks in the environment it will be exposed to. For this purpose, computer vision techniques were employed for landmark detection, followed by object segmentation to enhance the algorithm's perception of the environment. For the development of the prediction algorithm, the Python language was chosen, and a real database with approximately 8000 samples collected in the field at the University of Waterloo, through an instrumented autonomous vehicle, was considered. The use of YOLO-v8 network with Object Detection and Segmentation models, DeTr (Detection Transformers) network, and SAM (Segment Anything Model) network were evaluated to provide the input data that were related to distance estimation from deep learning techniques with a GPR (Gaussian Process Regression) model. At the end of the project, the superiority of YOLO-v8 network in the segmentation model when applied to object detection task was observed, with an average Recall of 0.76 and a maP@0.5 of 0.891, highlighting the benefit of using segmentation masks also for object detection. The analysis showed that the combination of YOLO-v8 Segmentation and SAM networks enhances the environment perception with a DICE coefficient of 71.039% and significantly reduces the error in distance prediction, achieving a MAE (Mean Absolute Error) of 0.65 meters. However, this combination resulted in an increase in processing time, standing out as a challenge for real-time application from the perspective of the hardware used. From the results, it is possible to note that the incorporation of segmentation characteristics to the input data substantially improves the performance of the GPR model in distance prediction, highlighting the potential of computer vision techniques in improving the localization and decision-making in autonomous vehicles.

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

BERNARDES, Danilo Serenini. Detecção e estimação de distância de marcos visuais por um veículo autônomo a partir de segmentação de imagens com aprendizado profundo e processos Gaussianos. 2024. 66p. Dissertação (Mestrado em Engenharia de Sistemas e Automação)–Universidade Federal de Lavras, Lavras, 2024.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 4.0 International