UnivIS
Informationssystem der Friedrich-Alexander-Universität Erlangen-Nürnberg © Config eG 
FAU Logo
  Sammlung/Stundenplan    Modulbelegung Home  |  Rechtliches  |  Kontakt  |  Hilfe    
Suche:      Semester:   
 Lehr-
veranstaltungen
   Personen/
Einrichtungen
   Räume   Forschungs-
bericht
   Publi-
kationen
   Internat.
Kontakte
   Examens-
arbeiten
   Telefon &
E-Mail
 
 
 Darstellung
 
Druckansicht

 
 
Einrichtungen >> Technische Fakultät (TF) >> Department Informatik (INF) >> Lehrstuhl für Informatik 5 (Mustererkennung) >>
Aktive 3-D-Rekonstruktion

Die 3-D-Rekonstruktion befasst sich mit der Berechnung der 3-D-Geometrie eines Objekts. Diese Geometrie kann in weiteren Anwendungen wie z. B. beim bildbasierten Rendering oder bei der Erzeugung von erweiterter Realität (Augmented Reality) genutzt werden. Dabei werden die Informationen für die aktive Rekonstruktion aus Kamerabildern gewonnen - das Wort "aktiv" bedeutet nicht, dass es sich hierbei um aktive Sensoren, wie z. B. Lasersensoren oder strukturiertes Licht, handelt. Vielmehr werden die Kameras aktiv gesteuert, d. h. für die 3-D-Rekonstruktion werden Ansichten geplant, die den zu erwartenden Fehler der Rekonstruktion minimieren.

Der entwickelte Ansatz basiert auf einem erweiteren Kalman Filter. Dieses erlaubt zunächst die einfache Integration von Informationen aus neuen Bildern, um die bisherige Schätzung der Geometrie zu verbessern. Die Schätzung wird durch die Parameter einer multidimensionalen Normalverteilung repräsentiert. Der Erwartungswert ist dabei der optimale lineare Schätzwert, im Sinne des kleinsten quadratischen Fehlers. Die Kovarianz ist ein Maß für die Unsicherheit.

Mit Hilfe des Kalman Filters lässt sich zudem vorhersagen, wie sich die Integration eines neuen Bildes mit bestimmten Kameraparametern auf die Kovarianzmatrix auswirken wird, ohne tatsächlich das Bild aufnehmen zu müssen. Man kann also aufgrund der bisherigen Schätzung diejenige nächste Konfiguration von Kameraparametern bestimmen, die die Kovarianzmatrix möglichst "klein" werden lässt. Um die "Größe" der Matrix zu bestimmen, wurden zwei Kriterien getestet:

  • D-Kriterium: Es lässt sich zeigen, dass die Determinante der Kovarianzmatrix einer Normalverteilung, bis auf konstante Terme, der Entropie entspricht. Minimierung der Determinante bedeutet dann Minimierung der Entropie und damit gleichzeit eine Erhöhung des Informationsgehalts. Dieses Kriterium ist also informationstheoretisch motiviert.

  • E-Kriterium: Die Kovarianzmatix besitzt eine Blockdiagonalstruktur aus 3x3 Blöcken. Jeder Block repräsentiert die Unsicherheit eines 3-D-Punkts in die 3 Raumrichtungen. Der Eigenvektor, der mit dem größten Eigenwert korrespondiert, gibt die Richtung an, in der Schätzung der 3-D-Koordinaten eines Punkts am unsichersten ist. Das E-Kriterium wird aus der Summe der max. Eigenwerte über alle Blöcke berechnet. Es ist also geometrisch motiviert.

Der beschriebene Ansatz wurde realisiert und mit realen Daten getestet. In den Experimenten sind jedoch zwei weitere Randbedingungen zu beachten:

  • Zur Positionierung der Kameras wurde ein Roboterarm verwendet. Das Bewegungsmodell dieses Arms muss berücksichtigt werden, um nur die Positionen zu analysieren, die tatsächlich erreichbar sind.

  • Verdeckungen von Objektregionen durch das Objekt selbst müssen berücksichtigt werden. Die Selbstverdeckung kann sonst ein Bild für die 3-D-Rekonstruktion unbrauchbar machen, da evtl. die zu rekonstruierenden Punkte aufgrund der Selbstverdeckung nicht sichtbar sind. Durch die probabilistische Modellierung der Selbstverdeckung konnte diese Randbedingung in den wahrscheinlichkeitstheoretischen Kalman Filter Ansatz integriert werden.

Es konnte gezeigt werden, dass durch die aktive 3-D-Rekonstruktion das Rekonstruktionsergebnis gegenüber einer passiven, d. h. ohne Ansichtenplanung, stark verbessert werden konnte, im Sinne einer höheren Rekonstruktionsgenauigkeit. Das geometrisch motivierte E-Kriterium war dabei dem D-Kriterium überlegen. Durch die Einführung der Verdeckungsmodellierung konnte nun auch bei nichtplanaren Objekten gute Ergebnisse erzielt werden.

Projektleitung:
Prof. em. Dr.-Ing. Dr.-Ing. h.c. Heinrich Niemann

Beteiligte:
Dr.-Ing. Stefan Wenhardt

Stichwörter:
3-D Rekonstruktion; Aktives Sehen; Rechnersehen

Laufzeit: 1.1.2004 - 31.5.2007

Publikationen
Wenhardt, Stefan ; Denzler, Joachim ; Niemann, Heinrich: On Minimizing Errors in 3-D-Reconstruction for Stereo Camera Systems. In: Geppener, V.V. ; Gurevich, I.B. ; Ivanova, S.E. ; Nemirko, A.P. ; Niemann, Heinrich ; Puzankov, D.V. ; Trusova, Yu.O. ; Zhuravlev, Yu.I. (Hrsg.) : 7th International Conference on Pattern Recognition and Image Analysis 2004: New Information Technologies (7th International Conference on Pattern Recognition and Image Analysis 2004: New Information Technologies St. Petersburg, Russia). St. Petersburg : SPbETU, 2004, S. 562–565.
Wenhardt, Stefan ; Deutsch, Benjamin ; Hornegger, Joachim ; Niemann, Heinrich ; Denzler, Joachim: An Information Theoretic Approach for Next Best View Planning in 3-D Reconstruction. In: Tang, Y.Y. ; Wang, S.P. ; Lorette, G. ; Yeung, D.S. ; Yan, H. (Hrsg.) : The 18th International Conference on Pattern Recognition (18th International Conference on Pattern Recognition (ICPR 2006) Hong Kong 20 - 24 August, 2006). Bd. 1. Los Alamitos, California, Washington, Tokyo : IEEE Computer Society, 2006, S. 103-106. (IEEE Computer Society Order Number P2521) - ISBN 0-7695-2521-0
UnivIS ist ein Produkt der Config eG, Buckenhof