Robust Algorithms for Multiple View Geometry: Outliers and Optimality

Abstract: Popular Abstract in Swedish Hur kan man skapa en tredimensionell modell av ett objekt eller en plats från tvådimensionella bilder? Det är den centrala frågan i den här avhandlingen och en viktig fråga i datorseende generellt. Normalt delar man upp problemet i en serie basproblem. Ett basproblem kan till exempel vara att skatta kamerans rörelse mellan två bilder eller kamerapositionen för en ny bild givet en 3d-modell. Lösningarna till dessa basproblem kan vara intressanta i sig eller som delsteg i skattning av en större modell. Den första delen av avhandlingen beskriver nya algoritmer för ett antal sådana basproblem. Till exempel för problemet att skatta den relativa rörelsen mellan två bilder. Man vill alltså beräkna hur kameran har flyttats och vridits mellan två tagna bilder. Det första steget för att åstadkomma detta är att detektera korrespondenser mellan bilderna. Vi säger att två punkter är korresponderande om de är projektioner av samma punkt i världen. Om du till exempel har en fläck på skjortan som syns i två bilder så är de punkterna korresponderande. När man hittat sådana punkter så är nästa steg att räkna ut en kamerarörelse som stämmer med dessa korrespondenser. Ett problem här är att andra punkter i bilden kan likna fläcken på skjortan och leda till felaktiga korresponser, så kallade outliers. Huvudfokus för algoritmerna i avhandlingen är just att uppnå robusthet för den sortens fel. I den andra delen av avhandlingen lämnar vi basproblemen och tittar på geometriska problem med multipla kameror. Kapitel 5 diskuterar en generell metod för att bygga 3d-modeller från flera vyer. Metoden bygger på såväl grafteori som moderna metoder från konvex optimering. Vidare visas en del teoretiska resultat som styrker den föreslagna metoden. Endimensionella kameror kan vara en ekonomiskt alternativ för till exempel robotnavigering. Systemet bygger på att en slags reflekterande tejp har satts upp på olika ställen i lokalen. Den endimensionella kameran registrerar när en roterande laser reflekteras mot tejpen. En endimensionell bild är alltså ett samling riktningar för vilka reflektion uppmättes. I kapitel 6 visas hur ett flertal problem för endimensionella kameror kan lösas med hjälp effektiva optimeringsmetoder.

  CLICK HERE TO DOWNLOAD THE WHOLE DISSERTATION. (in PDF format)