Projekt

Die 3-D-Rekonstruktion befasst sich mit der Berechnung der 3-D-Geometrie eines Objekts. Diese Geometrie kann in weiteren Anwendungen wie z. B. beim bildbasierten Rendering oder bei der Erzeugung von erweiterter Realität (Augmented Reality) genutzt werden. Dabei werden die Informationen für die aktive Rekonstruktion aus Kamerabildern gewonnen - das Wort "aktiv" bedeutet nicht, dass es sich hierbei um aktive Sensoren, wie z. B. Lasersensoren oder strukturiertes Licht, handelt. Vielmehr werden die Kameras aktiv gesteuert, d. h. für die 3-D-Rekonstruktion werden Ansichten geplant, die den zu erwartenden Fehler der Rekonstruktion minimieren.

Der entwickelte Ansatz basiert auf einem erweiteren Kalman Filter. Dieses erlaubt zunächst die einfache Integration von Informationen aus neuen Bildern, um die bisherige Schätzung der Geometrie zu verbessern. Die Schätzung wird durch die Parameter einer multidimensionalen Normalverteilung repräsentiert. Der Erwartungswert ist dabei der optimale lineare Schätzwert, im Sinne des kleinsten quadratischen Fehlers. Die Kovarianz ist ein Maß für die Unsicherheit.

Mit Hilfe des Kalman Filters lässt sich zudem vorhersagen, wie sich die Integration eines neuen Bildes mit bestimmten Kameraparametern auf die Kovarianzmatrix auswirken wird, ohne tatsächlich das Bild aufnehmen zu müssen. Man kann also aufgrund der bisherigen Schätzung diejenige nächste Konfiguration von Kameraparametern bestimmen, die die Kovarianzmatrix möglichst "klein" werden lässt. Um die "Größe" der Matrix zu bestimmen, wurden zwei Kriterien getestet:

D-Kriterium: Es lässt sich zeigen, dass die Determinante der Kovarianzmatrix einer Normalverteilung, bis auf konstante Terme, der Entropie entspricht. Minimierung der Determinante bedeutet dann Minimierung der Entropie und damit gleichzeit eine Erhöhung des Informationsgehalts. Dieses Kriterium ist also informationstheoretisch motiviert.
E-Kriterium: Die Kovarianzmatix besitzt eine Blockdiagonalstruktur aus 3x3 Blöcken. Jeder Block repräsentiert die Unsicherheit eines 3-D-Punkts in die 3 Raumrichtungen. Der Eigenvektor, der mit dem größten Eigenwert korrespondiert, gibt die Richtung an, in der Schätzung der 3-D-Koordinaten eines Punkts am unsichersten ist. Das E-Kriterium wird aus der Summe der max. Eigenwerte über alle Blöcke berechnet. Es ist also geometrisch motiviert.

Der beschriebene Ansatz wurde realisiert und mit realen Daten getestet. In den Experimenten sind jedoch zwei weitere Randbedingungen zu beachten:

Zur Positionierung der Kameras wurde ein Roboterarm verwendet. Das Bewegungsmodell dieses Arms muss berücksichtigt werden, um nur die Positionen zu analysieren, die tatsächlich erreichbar sind.
Verdeckungen von Objektregionen durch das Objekt selbst müssen berücksichtigt werden. Die Selbstverdeckung kann sonst ein Bild für die 3-D-Rekonstruktion unbrauchbar machen, da evtl. die zu rekonstruierenden Punkte aufgrund der Selbstverdeckung nicht sichtbar sind. Durch die probabilistische Modellierung der Selbstverdeckung konnte diese Randbedingung in den wahrscheinlichkeitstheoretischen Kalman Filter Ansatz integriert werden.

Es konnte gezeigt werden, dass durch die aktive 3-D-Rekonstruktion das Rekonstruktionsergebnis gegenüber einer passiven, d. h. ohne Ansichtenplanung, stark verbessert werden konnte, im Sinne einer höheren Rekonstruktionsgenauigkeit. Das geometrisch motivierte E-Kriterium war dabei dem D-Kriterium überlegen. Durch die Einführung der Verdeckungsmodellierung konnte nun auch bei nichtplanaren Objekten gute Ergebnisse erzielt werden.