Definition Was ist Computer Vision?

Von Holger Hagedorn 2 min Lesedauer

Anbieter zum Thema

Computer Vision gehört zum Bereich der KI und beschäftigt sich überwiegend mit ingenieurwissenschaftlichen Aufgaben. Dabei geht es um das maschinelle Erfassen und Vermessen von Objekten sowie deren Bewegung bzw. der Bewegung des Beobachters.

Computer Vision ist auch aus dem modernen Straßenverkehr nicht mehr wegzudenken und gilt dort als eine der Schlüsseltechnologien für die Zukunft der Mobilität.  (Bild:  Canva / KI-generiert)
Computer Vision ist auch aus dem modernen Straßenverkehr nicht mehr wegzudenken und gilt dort als eine der Schlüsseltechnologien für die Zukunft der Mobilität.
(Bild: Canva / KI-generiert)

Die Beschäftigung mit „computerbasiertem Sehen“ begann bereits in den 1960er-Jahren. Damit zählt Computer Vision zu den frühesten KI-Forschungsgebieten. Während zunächst nur einfache Strukturen erkannt und verarbeitet werden konnten, erweiterten sich die Möglichkeiten mit der Entwicklung der digitalen Fotografie und leistungsstarker Computersysteme erheblich.

Erfassung, Segmentierung und Rekonstruktion

Die zentralen Aufgaben von Computer Vision lassen sich durch ein Zusammenspiel von Erfassung, Segmentierung und Rekonstruktion beschreiben. Dabei ist zu berücksichtigen, dass sich maschinelles Sehen grundlegend von natürlichem Sehen unterscheidet. Der Computer erfasst, strukturiert und "versteht" visuelle Informationen schrittweise.

Zunächst werden Objekte, Personen, Handlungen oder Texte in Bildern und Videos lokalisiert und mit gespeicherten Mustern verglichen. Ziel ist die inhaltliche oder semantische Interpretation, etwa durch Objekterkennung, Gesichtserkennung, Bildklassifizierung oder Texterkennung. Moderne Verfahren setzen auf tiefe neuronale Netze (Deep Neural Networks, DNN), die aus großen Datenmengen lernen und komplexe Szenen zuverlässig interpretieren können.

Bei der Segmentierung wird ein Bild in sinnvolle Bereiche aufgeteilt. Dabei wird jedem Pixel zugeordnet, zu welchem Objekt oder welcher Fläche es gehört. Mit Methoden wie der semantischen Segmentierung, die Objektarten erkennt, oder der Instanzsegmentierung (Instance Segmentation), die einzelne Objekte voneinander unterscheidet, kann das System genau erkennen, welche Elemente einer Szene zusammengehören und wo die Grenzen zwischen ihnen verlaufen.

Mit der Rekonstruktion schließlich ist die Wiederherstellung räumlicher Strukturen aus zweidimensionalen Bilddaten gemeint. Um dreidimensionale Modelle von Objekten oder ganzen Szenen zu erstellen, können verschiedene Techniken genutzt werden. Dazu zählen u.a.:

  • Structure-from-Motion (SfM) zur Erstellung komplexer, maßstabsgetreuer 3D-Modelle aus mehreren 2D-Fotos
  • Stereo-Vision zur Wahrnehmung von räumlicher Tiefe und Entfernung durch die Zusammenführung von Daten aus zwei leicht unterschiedlichen Blickwinkeln.
  • Tiefenschätzung (Depth Estimation) zur Entfernungsbestimmung via Stereo-Vision oder über eine monokulare Tiefenschätzung, die Aussagen aus gespeicherten Werten zu Größen, Perspektiven oder Berechnungsgrundlagen wie Schatten ableitet.

Anwendungsgebiete von Computer Vision

Zu den Anwendungsgebieten von Computer Vision zählen in der Automobilindustrie das autonome Fahren ebenso wie im Gesundheitswesen die Analyse medizinischer Bilddaten. Dazu kommen die Produktüberwachung in Fertigung und Qualitätskontrolle sowie die Überwachung von Pflanzen und Vieh in der Landwirtschaft. Im Einzelhandel dient Computer Vision zur Erkennung von Waren und zur Analyse des Kundenverhaltens. Nicht zu vernachlässigen sind zudem Einsatzgebiete in der Robotik sowie in der Sicherheitstechnik.

(ID:50880367)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung