Учёные планируют создать самообучающуюся нейросеть, способную адаптироваться к разным средам
Em robôs móveis e carros autónomos, a capacidade de “ver” em 3D não é um luxo: é o que evita colisões e reduz incertezas, especialmente quando há objetos parcialmente ocultos. Uma equipa de cientistas do MFTI, em colaboração com centros de investigação internacionais, apresentou uma nova abordagem de estereovisão chamada Un-ViTAStereo, que promete perceção tridimensional sem pontos cegos.
Segundo a assessoria de imprensa do MFTI, o algoritmo calcula a distância até aos objetos sem recorrer a lidars caros nem a rotulagem manual, o que o torna mais acessível e mais versátil para diferentes aplicações.
O Un-ViTAStereo é treinado com a ajuda do modelo Depth Anything V2, que estima a profundidade relativa dos objetos a partir de uma única imagem, interpretando sombras, perspetiva e sobreposições. Com isso, o algoritmo consegue selecionar apenas as previsões que batem certo com as pistas do “professor”, melhorando a precisão.
O sistema funciona em três etapas: verificação de cada píxel quanto à compatibilidade com as pistas, procura de vizinhos verdes para pontos vermelhos e construção de contornos usando uma função de suavização da disparidade. Como resultado, a proporção de erros grosseiros no teste de veículos autónomos KITTI 2015 caiu para 5%, o que corresponde a 23% menos erros perigosos na estimativa das distâncias aos objetos.
No MFTI, destacam que a versão atual do Un-ViTAStereo é apenas o ponto de partida. Os investigadores planeiam criar uma rede neuronal autoaprendente, capaz de se adaptar a diferentes ambientes, e usar medições precisas de lidars para aumentar ainda mais a exatidão. A nova tecnologia abre perspetivas amplas para elevar a segurança e a funcionalidade de sistemas autónomos. O estudo foi publicado na IEEE Transactions on Circuits and Systems for Video Technology.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário