Suche
Filterung

Bereiche

Branchen

Themen

Computer Vision – der Wunsch, wie ein Mensch zu sehen

Maschinelles Sehen ist mehr als reine Bilderkennung. Es geht um das Erfassen, Analysieren und Interpretieren von Objekten

Das Problem des Sehens und das Erfassen von Bildern erscheint einfach, weil es von Menschen, sogar von sehr kleinen Kindern, auf scheinbar triviale Weise wie selbstverständlich gelöst wird. Wir betrachten ein Bild und wissen, was auf dem Bild dargestellt ist. Wenn aber Computer sehen und erfassen sollen, was sie sehen, stehen sie vor einem großen Problem. Denn neben dem Verständnis für biologisches Sehen stellt die Komplexität der visuellen Wahrnehmung in einer dynamischen Welt mit ständig variierenden Bildern von ein und demselben Objekt eine extrem große Herausforderung dar. Computer Vision ist eine Technologie, die Computern helfen soll, den Inhalt digitaler Bilder – Fotos und Videos – zu sehen und zu verstehen.

Was ist Computer Vision?

Computer Vision ist nicht dasselbe wie Bilderkennung, auch wenn die Begriffe oftmals synonym gebraucht werden. Computer Vision ist ein Teilgebiet der Künstlichen Intelligenz (KI), das Computer darin trainiert, Informationen aus Bild- und Videodaten zu erfassen und zu interpretieren. Das Ziel von Computer Vision ist es, mit Hilfe von Modellen des Maschinellen Lernens (ML) digitale Systeme zu schaffen, die visuelle Daten (Bilder oder Videos) auf die gleiche Weise verarbeiten, analysieren und damit verstehen können wie Menschen. Das Konzept von Computer Vision basiert darauf, Computern beizubringen, ein Bild auf Pixelebene zu analysieren und gegebenenfalls auf das Ergebnis entsprechend zu reagieren, z. B. in Form des Entsperrens des Smartphones, wenn das Gesicht des Benutzers erkannt wurde. Technisch gesehen versuchen Computer mit Hilfe von Sensoren und Algorithmen, visuelle Informationen abzurufen, zu verarbeiten und zu verstehen und damit die Fähigkeit des menschlichen Sehens zu reproduzieren und zu automatisieren.

Wie funktioniert Computer Vision?

Die Computer Vision-Technologie ahmt die Arbeitsweise des menschlichen Gehirns nach, das anhand von Mustern einzelne Objekte entschlüsselt. Computer Vision bedient sich dabei Algorithmen, die auf der Mustererkennung basieren. Um den Computer zu trainieren, visuelle Daten zu verstehen, wird er mit Millionen von Bildern gefüttert, die beschriftet wurden. So analysiert der Computer beispielsweise Millionen Bilder von Blumen, um Muster zu identifizieren, die allen Blumen ähnlich sind. Am Ende des Prozesses erstellt er ein Modell „Blume“, das ihm hilft, genau zu erkennen, ob es sich bei einem bestimmten Bild um eine Blume handelt.

Whitepaper "Intelligent Process Automation für Unternehmens­entscheider"

Erfahren Sie, wofür Sie Intelligent Process Automation in Ihrem Unternehmen einsetzen können, welche Kosten bei der Einführung entstehen und welchen ROI Sie erwarten können.

Maschinelles Sehen mittels DL

Modernes maschinelles Sehen stützt sich dabei auf Deep Learning (DL), das einen bestimmten Algorithmen verwendet, der als neuronales Netzwerk bezeichnet wird. Die neuronalen Netze extrahieren Muster aus bereitgestellten Datenproben. Inspiriert von der menschlichen Funktionsweise des Gehirns, befindet sich auf der Kernebene eines neuronalen Netzes das Perzeptron – die mathematische Darstellung eines biologischen Neurons. Ähnlich wie bei biologischen Neuronen können mehrere Schichten von Perzeptronen miteinander verbundener werden. Eingabewerte (Rohdaten) werden durch das von Perzeptronen erstellte Netzwerk geleitet und landen in der Ausgabeschicht, die eine Vorhersage oder eine fundierte Vermutung über ein bestimmtes Objekt darstellt.

Bilder als eine Reihe von Pixeln

Technisch gesehen interpretiert der Computer Bilder als eine Reihe von Pixeln mit jeweils eigenen Farbwerten. Die Helligkeit jedes Pixels wird durch eine einzelne 8-Bit-Zahl dargestellt, die von 0 (schwarz) bis 255 (weiß) reicht. Die Daten werden als Eingabe für den Computer Vision-Algorithmus bereitgestellt, der die weitere Analyse und Entscheidungsfindung übernimmt. Bei einem farbigen Bild, bei dem Farben vom Computer normalerweise als eine Reihe von 3 Werten – Rot, Grün und Blau (RGB) – auf derselben Skala von 0–255 ausgelesen werden, hat jeder Pixel zusätzlich 3 Werte, die der Computer speichern muss.

Aufgaben für die Computer Vision

Computer Vision ist bereits in viele Bereiche unseres Lebens integriert. Generell lassen sich die Anwendungsbereiche in drei Klassen einteilen.

Objektklassifizierung

Die Objektklassifizierung geht der Frage nach: Um welche allgemeine Objektkategorie handelt es sich auf diesem Foto? Das System analysiert visuelle Inhalte und klassifiziert das Objekt auf einem Foto oder in einem Video in die definierte Kategorie. So erkennt das System auf einem Bild unter allen Objekten beispielsweise einen Hund.

Objektidentifikation

Das System analysiert visuelle Inhalte und identifiziert ein bestimmtes Objekt auf einem Foto oder in einem Video. Die Objektidentifikation gibt Antworten auf die Frage, welche Objekte sich auf diesem Foto wo befinden und um welche Art von Objekt es sich auf dem Foto handelt? So findet das System einen bestimmten Hund auf einem Bild mit mehreren Hunden.

Objektverfolgung

Bei der Objektverfolgung verarbeitet das System ein Video, findet das den Suchkriterien entsprechende Objekt und verfolgt seine Bewegung.

Beispiele aus der Praxis

In der Praxis wird Computer Vision heute in einer Vielzahl von privaten und wirtschaftlichen Bereichen eingesetzt, von denen wir nachfolgend einige bemerkenswerte Beispiele zusammengetragen haben:

Organisation

Computer Vision hilft uns, Inhalte zu organisieren. Ein schönes Beispiel aus dem täglichen Leben ist die Apple Photo App. So ermöglicht die App, die Fotosammlungen auf dem Handy strukturiert durchsuchen zu können und erstellt eine kuratierte Ansicht der schönsten Momente des Benutzers, indem die App die Fotos ausliest und den Fotos automatisch inhaltsrelevante Tags hinzufügt.

Gesichtserkennung

Computer Vision wird auch eingesetzt, um Fotos von Gesichtern von Personen mit ihrer Identität abzugleichen. So verwendet Facebook diese Technologie, um Personen auf Fotos zu identifizieren. Ein weiteres Einsatzgebiet ist die biometrische Authentifizierung, die es vielen Benutzern ermöglicht, ihre Smartphones zu entsperren, indem sie ihre Gesichter zeigen. Über die Frontkamera verarbeiten Smartphones das Gesicht und können anhand der Analyse erkennen, ob die Person, die das Gerät in der Hand hält, zugriffsberechtigt ist.

Augmented Reality

Computer Vision hilft Augmented Reality-Apps, physische Objekte – sowohl Oberflächen als auch einzelne Objekte innerhalb eines bestimmten physischen Raums – in Echtzeit zu erkennen und diese Informationen zu verwenden, um virtuelle Objekte in der physischen Umgebung zu platzieren. Die AR basierte Ikea Place App bietet den Benutzern beispielsweise die Möglichkeit, zu überprüfen, ob die Möbel, die sie kaufen möchten, in ihre Einrichtung passen.

Selbstfahrende Autos

Autonomes Fahren wird erst durch Computer Vision möglich, da die Technologie dem Auto hilft, die Umgebung zu erkennen und zu verstehen, indem sie die über einige Kameras aus verschiedenen Blickwinkeln aufgenommenen Videos verarbeitet. Die Computer Vision-Software verarbeitet die Videobilder in Echtzeit und erkennt so beispielsweise Objekte in der Nähe des Autos wie Straßenmarkierungen, Ampeln, Fußgänger und andere Autos.

Gesundheit

Bildinformationen machen in der medizinischen Diagnose 90 Prozent aller medizinischen Daten aus. Röntgen, MRT und Mammographie liefern täglich eine Vielzahl von Bildern, die mittels Computer Vision schneller ausgewertet werden können. So können Computer Vision-Algorithmen z. B. die diabetische Retinopathie erkennen, die am schnellsten wachsende Ursache für Erblindung. Computer Vision-Algorithmen können Bilder des Augenhintergrunds verarbeiten, Veränderungen erkennen und nach Schweregrad bewerten. Auch in der Krebsdiagnostik kommt Computer Vision bereits zum Einsatz. Gerade hier ist die Genauigkeit bei der Diagnose verschiedener Krebsarten von entscheidender Bedeutung. Bei der Erkennung von Krebsmetastasen liefern Computer Vision Tools Ergebnisse mit viel höherer Präzision als „menschliche“ Ärzte. Der Computer Vision-Algorithmus identifiziert erfolgreich Tumorregion, da er nicht durch die normalen Bereiche verwirrt wird, die wie Tumore aussehen.

Landwirtschaft

In der Landwirtschaft wird Computer Vision eingesetzt, um die Ernte zu überwachen und die üblichen landwirtschaftlichen Probleme wie Unkrautwachstum oder Nährstoffmangel zu lösen. Computer Vision-Systeme können die Bilder von Satelliten, Drohnen oder Flugzeugen verarbeiten und helfen, Probleme in der Frühphase zu erkennen, um unnötige Ernteausfälle und finanzielle Verluste zu vermeiden.

Stellen Sie die Weichen für Ihre berufliche Zukunft!

Sie sind beruflich auf der Suche nach völlig neuen Herausforderungen sowie abwechslungsreichen Aufgaben? Wenn Sie in einem innovativen Umfeld etwas bewegen möchten, dann finden Sie bei der Weissenberg Group die richtigen Voraussetzungen.

Vorteile von Computer Vision

Mit der Fähigkeit zu sehen und zu interpretieren, automatisiert Computer Vision Aufgaben, ohne dass ein menschliches Eingreifen erforderlich ist. Monotone, sich wiederholende Aufgaben können schneller ausgeführt werden, wodurch der gesamte Prozess vereinfacht wird. Zudem ist es kein Geheimnis, dass Maschinen niemals Fehler machen und folglich Computer Vision-Systemen bei verschiedenen Bildverarbeitungsfunktionen im Gegensatz zum Menschen keine Fehler unterlaufen.

Pinterest Lens kennt den Preis

Gerade im Handel bietet Computer Vision viele Vorteile. Im Onlinehandel beispielsweise können anstelle von Tags verschiedene Bilder für den Produktvergleich verwendet werden, um dem Kunden zu helfen, das zu finden, was er sucht, weil das menschliche Auge sich Bilder leichter merken, als komplizierte Wörter verarbeiten kann. Produkte, die man irgendwo sieht, von denen man aber weder den Preis noch den Produktnamen oder die herstellende Firma kennt, können mittels Pinterest oder Google Lens identifiziert werden. Diese Tools analysieren anhand von Computer Vision alle Produktdetails und zeigen Preise, Herstellerfirma, physische Größe, Herkunftsland und viele andere Informationen an.

Computer Vision als Wachmann

Generell hat Computer Vision in Verbindung mit ML und KI viele Vorteile, darunter verbesserte Sicherheit, bessere Tools zur Krankheitsdiagnose, Pflanzenstudien, besserer Kundenservice, Kostensenkung und vieles mehr. Computer Vision kann auch zur Aufdeckung schädlicher Aktivitäten wie Betrug, Herstellung gefälschter Waren und Währungen beitragen. Computer Vision kann im Sicherheitsbereich den Einsatz von Überwachungskameras erheblich vereinfachen, da das System selbstständig die Umgebung überwacht und die Sicherheitsabteilung alarmiert, wenn es etwas Verdächtiges erkennt. Sicherheitsmitarbeiter müssen nicht mehr stundenlang Material an Bildschirmen überprüfen.

Herausforderungen für Computer Vision

Aber es gibt auch noch einige Herausforderung. Noch haben Computer das Problem, unvollständige visuelle Daten zu verarbeiten. Während Menschen die Lücken basierend auf ihren Erfahrungen und logischen Annahmen füllen können, haben Computer noch nicht dieses Intelligenzniveau erreicht.

Zudem gibt es Faktoren, die ein Computer Vision-System aus dem Gleichgewicht bringen können. Schattierungen, Färbungen, Dunkelheit und Licht, seltsame Formen – all das kann das System verwirren und zum Scheitern bringen. Obwohl ein gut trainiertes System mit den meisten dieser Probleme umgehen kann, kann es dennoch passieren, dass etwas nicht verarbeitet wird, weil das System darauf zuvor nicht gestoßen ist.

Weissenberg Intelligence – Ihr kompetenter Partner in allen Fragen der digitalen Transformation

Möchten auch Sie die Wettbewerbsfähigkeit Ihres Unternehmens im digitalen Zeitalter stärken? Wir beraten Sie gern zur digitalen Transformation Ihres Unternehmens.

Ohne Fachleute geht es noch nicht

Zudem beinhaltet die Computer Vision-Technologie den Einsatz von KI und ML. Um aber ein auf KI und ML basierendes Computer Vision-System zu trainieren, benötigen Unternehmen ein Team von Fachleuten mit technischem Fachwissen. Ohne sie ist der Aufbau eines Systems, das die möglichen Umgebungsdetails analysieren und verarbeiten kann, nicht möglich. Auch befindet sich die Technologie noch in einem frühen Stadium und die Systeme müssen überwacht werden, um ordnungsgemäß zu funktionieren.

Fazit

Computer Vision ist eine Technologie, die das Potenzial hat, die meisten Branchen innerhalb des laufenden Jahrzehnts zu verändern. Unter Berücksichtigung der Vor- und Nachteile von Computer Vision können Unternehmen eine Lösung entwickeln, die den individuellen Geschäftsanforderungen entspricht. Die großen Datenmengen, die täglich anfallen und von einigen Unternehmen immer noch als Fluch betrachtet werden, sind dabei der Treibstoff, der Computer Vision vorantreibt, indem sie dazu verwendet werden, Computern beizubringen, Objekte zu sehen, zu erkennen und zu verstehen. Mit der Fähigkeit, die Gesichter von Menschen zu erkennen sowie ihren Aufenthaltsort und ihre Gewohnheiten zu verfolgen, wird Computer Vision allerdings auch die Zukunft des Datenschutzes verändern. Mit zunehmender Verbreitung dieser Technologie müssen sich die Benutzer bewusst darüber werden, welche Art von Daten und welche Datenmengen sie preisgeben.

Milad Safar
Milad Safar

Managing Partner und Autor zahlreicher Veröffentlichungen zum Themenfeld Digitalisierung

Das könnte Sie interessieren

Newsletter Anmeldung

RPA-Newsletter von Weissenberg

Aktuellen Neuigkeiten & hilfreiche Tipps rund um die Themen digitale Transformation, Künstliche Intelligenz und Robotic Process Automation.

Anfrage senden