Учёные планируют создать самообучающуюся нейросеть, способную адаптироваться к разным средам
Em vez de depender de sensores caros para “ver” em 3D, uma nova abordagem de visão estereoscópica promete tornar a perceção tridimensional mais acessível para robôs e carros autónomos. Investigadores do MФТИ (Instituto de Física e Tecnologia de Moscovo) e de centros internacionais apresentaram a tecnologia Un-ViTAStereo, concebida para permitir uma leitura volumétrica do ambiente com menos pontos cegos.
Segundo a assessoria de imprensa do MФТИ, o algoritmo calcula a distância até aos objetos sem recorrer a lidars dispendiosos nem a anotação manual, o que o torna mais universal e mais fácil de aplicar em diferentes cenários.
O Un-ViTAStereo é treinado com o apoio do modelo Depth Anything V2, que estima a profundidade relativa dos objetos a partir de uma única imagem, identificando sombras, perspetiva e sobreposições. Isto permite ao algoritmo reter apenas as previsões que estejam alinhadas com as “pistas” do modelo “mentor”, aumentando a precisão.
O sistema funciona em três etapas: valida cada píxel face às pistas fornecidas, procura vizinhos verdes para pontos vermelhos e constrói contornos usando uma função de suavização da disparidade. Como resultado, a taxa de erros grosseiros no teste de veículos autónomos KITTI 2015 desceu para 5%, ou seja, menos 23% de erros perigosos na estimativa das distâncias aos objetos.
O MФТИ sublinha que a versão atual do Un-ViTAStereo é apenas o ponto de partida. Os cientistas planeiam criar uma rede neuronal autoaprendente capaz de se adaptar a diferentes ambientes e usar medições precisas de lidars para melhorar a exatidão. A nova tecnologia abre boas perspetivas para reforçar a segurança e a funcionalidade de sistemas autónomos. O estudo foi publicado na IEEE Transactions on Circuits and Systems for Video Technology.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário