Marker – Augmented Reality

Im Zusammenhang mit Augmented Reality hört man oft die Worte “Tracking” und  “Marker”. Was man im Bereich Augmented Reality (AR) im allgemeinen unter Marker versteht, wollen wir an dieser Stelle kurz erläutern. Als Augmented Reality Marker oder AR-Marker werden die visuellen Trigger bezeichnet, welche die Anzeige der virtuellen Zusatzinformation auslösen.
Typische Marker sind Bilder oder kleine Objekte, die vorher in das System trainiert werden, so dass sie später wieder erkannt werden können.  Die Position, Skalierung und Orientierung des Markers wird über seine Verzerrung im Kamerabild ermittelt und wenn nötig auf die anzuzeigende Information übertragen.  An dieser Stelle möchte AnyMotion einen kurzen Überblick über die gängisten Markertypen geben.  Dabei sind im letzten Jahr immer mehr Arten dazu gekommen, doch man muss bedenken, das nicht alle Marker von jedem AR-Framework unterstützt wird.

Framemarker

Die Real-Time  Erkennung von Quadraten in Bildern, selbst wenn Sie gedreht oder skaliert sind, ist schon seit Jahren sehr weit fortgeschritten und erstaunlich robust.  Deswegen wundert es niemanden, das zuerst der Frame- oder Bordermarker entwickelt wurde. Es handelt sich hierbei um einen 2D-Marker der normalerweise auf ein Blatt Papier oder eine Oberfläche gedruckt wird. Diese Marker sind häufig quadratisch und zeichnen sich durch einen dicken schwarzen ( manchmal weissen) Rand aus. Im ersten Durchlauf wird zunächst nach einem schwarzen Quadrat, dem Rand gesucht. Erst nachdem der Rand gefunden wurde, wird der Inhalt des Quadrats analysiert um den eigentlichen Marker zu identifizieren. Da das System weiss, das es sich um ein Quadrat handelt, kann es an Hand der Verzerrung des Quadrats im Bild bestimmen , wie der Marker liegt.

Image / NFT Marker

 

Obwohl dieser Marker noch unter einigen anderen Namen bekannt ist, halten wir Bezeichnung NFT oder natural feature(natürliche Eigenschaften) tracking für am sinnvollsten. NFT Marker sind die logische Weiterentwicklung der Framemarker.  Auch hierbei handelt es sich ebenfalls um einen 2D-Marker, aber statt eines Symbols mit einem Rand kann man hier jedes beliebige Bild nehmen.  Im Trainingsverfahren werden die sogenannten natürlichen Eigenschaften aus dem Bild extrahiert.  Was eine “gute” natürliche Eigenschaft ist, ist jedoch nicht immer ganz klar. Während jedes AR-Framework relativ robust mit Framemarkern funktioniert , gibt es beim Imagemarker bereits große Unterschiede. Dabei hat jedes AR-Framework seine geheimen Algorithmen, um möglichst “gute” Features zu extrahieren.

Beim Scanvorgang wird dann nach den extrahierten natürlichen Eigenschaften gesucht. Hat das System einen solchen Marker gefunden, schließt es aus der Relation der natürlichen Eigenschaften zueinander auf die Position und Orientierung des Markers.

GPS Marker

Eigentlich ist der GPS Marker die erste Idee, auf welche die meisten kommen würden. Bei dieser Technik wird ein virtuelles Objekt über eine GPS Koordinate platziert und die Anzeige des Objektes wird über das GPS und die Bewegung des Anzeigegerätes gesteuert. Trotzdem wird dieser Marker von fast keinen AR-Framework unterstützt. Der Grund dafür liegt in die Ungenauigkeit eines GPS Markers.   Über GPS platzierte virtuelle Gegenstände tauchen teilweise 5 Meter von dem festgelegten Standort auf.
Trotzdem existieren einige wenige Anwendungen mit GPS Markern, wo es auf die Genauigkeit nicht so ankommt. So gibt es eine App, welche die ungefähre Richtung von etwas weiter entfernten POIs ( Point of Interest) anzeigt.  Ein anderes Beispiel ist die AR-Brille von Garmin. Diese zeigt zum Beispiel die aktuelle Geschwindigkeit und die Entfernung zum Ziel an. Einige werden an dieser Stelle jetzt an die Karte von Pokemon Go denken. Ob es sich hierbei jedoch in dem Sinne um AR handelt, ist diskutabel. Auf einer Map wird zwar eine Figur über eine GPS Information platziert, die das Auftauchen von Pokemon auslösen kann. Jedoch fehlt hier der “Reality” Teil. Die Karte, die Figur und die Pokemon sind alles virtuelle Informationen. Man könnte schon fast eher von Augmented Virtuality reden.

Durch Fortschritte in Hard- und Softwarebereich untersuchen einige Entwickler mittlerweile neue Anwendungsmöglichkeiten des GPS Markers, zum Beispiel in Zusammenhang mit anderen Techniken. Jedoch wird der GPS Marker vermutlich noch einige Zeit eine eher marginale Rolle spielen.

Objekt Marker

Bei Image- und Framemarkern handelt es sich um 2D-Objekte. Immer stärkere Mobilgeräte erlauben es mittlerweile jedoch, das SLAM (simultaneous localization and mapping) Problem effektiv zu lösen. Dabei werden in Echtzeit Ecken, Kanten und markante Punkte aus dem Kamerabild extrahiert und mit einem vorher gespeicherten Objekt verglichen. Einige der Premium AR-Frameworks bieten mittlerweile an,  echte 3D-Objekte als Marker zu nehmen. Da die Speicherung und das permante Vergleichen von Punktwolken enorme Resourcen verbraucht, ist dies erstmal nur mit sehr kleinen 3D-Objekten möglich.
Der Vorteil liegt auf der Hand. Bei 2D-Markern muss die Kamera idealerweise direkt auf den Marker gerichtet werden. Die meisten Frameworks sind mittlerweile so robust das die Erkennung bis zu einem gewissen Grad auch noch schräg von der Seite funktioniert. Jedoch ist spätestens bei einem Winkel von 90 Grad Schluss. Einen 3D-Marker würde man von allen Seiten erkennen.

Dabei existiert dieses Verfahren in mehreren Abstufungen. Erste Versuche setzen voraus, das die 3D-Objekte die Form eines Würfels oder Zylinders haben musste. Doch mittlerweile fallen diese Beschränkungen bei den ersten AR-Frameworks weg. Da der Vergleich von Punktwolken sehr aufwendig ist, ist diese Techink im Moment nur für sehr kleine Modelle geeignet.

Markerless (Tracking)

Dieser Name ist vielleicht etwas missverständlich. Diese Technik dürfte vor allem vom Framework Kudan bekannt sein. Man positioniert zunächst zur Laufzeit ein Objekt per Hand im Raum. Danach scheint es an dieser Stelle zu “kleben”.  Jedoch verlässt sich das System hier nicht alleine auf die Bewegungssensoren des Anzeigegeräts. Obwohl es hier enorme Fortschritte in Sachen Genauigkeit gab, ist die fehleranfällig immer noch zu hoch , um das Objekt genau an dem platzierten Ort zu halten . Vermutlich kommt hier eine Kombination aus Sensorik und die Lösung des SLAM (simultaneous localization and mapping) Problems zum Einsatz. Bei der Platzierung wird vermutlich die Umgebung hinter und um das Objekt analysiert und die  natural features werden extrahiert. Diese ermittelten Features dienen dann als “Marker”. Die Hololens geht sogar noch einen Schritt weiter. Sie scannt die gesamte Umgebung ab und erstellt daraus ein internes Abbild. Diese Abbild wird dann als riesieger Marker verwendet.

Diese Tracking Art wurde erst durch die enorme Leistungsfähigkeit der mobilen Endgeräte und der entsprechenden Algorithmen möglich.

Multimarker

Der erste Versuch das potentielle Sichtfeld zu vergrößeren, waren die Multimarker. Dies ist eine Gruppierung von mehren Markern, deren Relation zueinander vorher bekannt ist. Um die virtuelle Information anzuzeigen, muss immer nur ein Marker im Blickfeld sein. Ist die virtuelle Information räumlich platziert, wie ein 3D-Modell, dann wird die Platzierung genauer, desto mehr Marker zu sehen sind.

Geräte Aktivierung, RFID Tags, Soundmarker

Wenn man von “Markern” redet, redet man in vielen Fällen von visuellen Markern. Jedoch ist dies nicht immer der Fall. An dieser Stelle sollen drei “Marker” genannt werden, die keine visuellen Marker sind. Das erste Beispiel ist eine Kamera-App, wie es auf jedem Handy zu finden ist. Die Anzeige von Helligkeit, Auflösung und Blitz innerhalb des Bildes sind virtuelle Zusatzinformationen. Da sie innerhalb des Kamerabildes angezeigt werden, haben wir laut Definition Augmented Reality. Die Aktivierung des Apps wäre in diesem Fall der Marker, oder besser die Situation “Marker gefunden”. Analog wäre das Ausschalten der App die Situation “Marker verloren”.

Das zweite Beispiel sind RFID Tags.  Einige werden diese Technologie aus dem kontaktlosen Bezahlen kennen, doch Sie kann auch im Bereich Augmented Reality eingesetzt werden. Wenn man zum Beispiel in einem Handheld, einem automatischen Museumsführer, eine Antenne installiert und alle Ausstellungstücke mit RFID Tags ausrüstet, dann kann der Museumsführer registrieren , wann er sich einem Ausstellungsstück nähert. Dieser kann dann die virtuellen Informationen in Form von Bildern oder Erzählungen abspielen.

Das letzte Beispiele sind Soundmarker. Das einfachste Beispiel sind hier Sprachbefehle.  So können Zusatzinformationen per Sprachbefehl ein- und ausgeblendet werden.

War diese Information hilfreich?:
1 Star2 Stars3 Stars4 Stars5 Stars (12 votes, average: 5,00 out of 5)
Loading...