Bildverarbeitung als KI-Vorreiter

Die industrielle Bildverarbeitung ist weit fortgeschritten, wenn es um den Einsatz von Künstlicher Intelligenz (KI) und insbesondere um Deep Learning geht. Die Vision-Experten kennen aber auch die Grenzen des KI-Ansatzes.

Sick Deep Learning für ein Pilotprojekt in der Holzindustrie zoom

Dass die industrielle Bildverarbeitung eine KI-Vorreiter ist, liegt zum einen daran, dass sich die Vision-Experten ohnehin seit je her mit dem Erkennen von Mustern beschäftigen. Es liegt zum anderen aber auch daran, dass die Bilderkennung ganz generell ein beliebtes Betätigungsfeld für KI-Experten ist. So erkennt Googles KI-Kamera-Software Google Lens durch die Smartphone-Kamera nun mittlerweile eine Milliarde Gegenstände und kann diese dann automatisch zuordnen.

„Die künstliche Intelligenz hat längst in der industriellen Bildverarbeitung Einzug gehalten“, bestätigt Dr. Maximilian Lückenhaus, Director Marketing + Business Development beim Vision-Software-Spezialisten MVTec Software. Eine besondere Bedeutung hierbei habe Deep Learning, meist basierend auf Convolutional Neural Networks (CNN). „Diese CNNs sind von biologischen Prozessen inspirierte künstliche neuronale Netze. Sie nutzen sehr große Mengen an digitalen Bilddaten für einen umfassenden Trainingsprozess, um danach selbstständig neue Objekte klassifizieren zu können“, erläutert Lückenhaus.

Vortrainierte Deep-Learning-Tools

In diesem Trainingsprozess werden spezifische Besonderheiten und Merkmale von Objekten automatisch eingelernt. Nach diesem Training können neue Bilddaten zugeordnet und damit besonders hohe und robuste Erkennungsraten erzielt werden. Bevorzugte Anwendungsgebebiete: Klassifizierung und Objektdetektion.

Damit Firmen die Vorteile der Technologie möglichst einfach nutzen können, bietet Mvtec in seiner Software vortrainierte Deep-Learning-Tools an, die auf der Basis von rund drei Millionen sorgfältig selektierten Bildern aus dem industriellen Umfeld vortrainiert wurden. „Damit benötigen Unternehmen nur noch vergleichsweise wenige eigene Bilder, um die Netze auf Ihre Anwendungen angepasst fertig zu trainieren“, verspricht Lückenaus.

Auch Cognex hat Deep-Learning-basierte Bildanalyse-Tools in seine Software integriert. Die Technologie dafür haben sich die US-Vision-Spezialisten durch den Zukauf der schweizerische Vidi Systems an Bord geholt. „Wenn der Mensch lernen kann, Produkte zu prüfen, kann Visionpro Vidi dies auch“, betont Joerg Kuechen, Senior Vice President für Bildverarbeitungsprodukte bei Cognex: „Außerdem kann Visionpro Vidi in wenigen Minuten mit lediglich 50 Bildern trainiert werden.“

Deep Learning-Technologie sei vor allem dann eine gute Ergänzung, wenn komplizierte Prüfverfahren für Herstellungsprozesse benötigt werden, die zeitaufwändig sind und mit herkömmlicher regelbasierter Bildverarbeitung nur schwierig zu programmieren sind, betont Cognex. Außerdem können damit auch Personen, die keine Programmierexperten sind, Bildverarbeitungsanwendungen auf Werksebene pflegen und neu trainieren.

KI-Software braucht Kundendaten

Sick setzt ebenfalls auf Sensorlösungen, die auf Basis von Deep Learning Algorithmen arbeiten. „Ziel ist es, mit Hilfe von KI den Sensor zu befähigen, seine Aufgabe in der jeweiligen Applikation noch besser zu lösen“, erklärt Bernhard Müller, Vice President Industrie 4.0. Sein Argument: Standardsensoren erledigen ihren Job zwar bereits sehr gut, aber wenn eine neue Aufgabe hinzukomme, dann stoßen die Sensoren an ihre Grenzen. „Mit KI dagegen kann ein Sensor aus Erfahrungen lernen und antizipieren: Was ist das, was ich da sehe? So entsteht ein besserer Sensor, der auch Dinge erkennen kann, die er noch nie gesehen hat.“

Anstatt auf vortrainierte KI-Netze setzt Sick dabei auf individuelle Kundenprojekte: „Zum Beispiel arbeiten wir in der Holzindustrie an einem Kamera-Pilotprojekt mit Deep Learning“, erklärt Müller. Für eine optimale Ausnutzung des Rohstoffs Holz, müssen Sägewerke wissen, wie die Verhältnisse im Holzstamm sind. Wo befinden sich die Jahresringe, wo der Kern? „Herauszufinden, wie das Holz am besten genutzt werden kann, das haben wir der Kamera mittels Deep Learning beigebracht. Eine Aufgabe, die zuvor ausschließlich von Menschen erledigt werden konnte“, so Müller. Wichtig sei dabei der enge Austausch mit dem Kunden: „Beim Thema KI geht es nicht ohne den Kunden. Diese sollte daher am besten konkrete Beispieldaten liefern, mit denen der KI-Sensor lernen kann: Denn KI benötigt passende Trainingsdaten.“

Fehlerrate in der Praxis stark reduziert

Auch Mvtec hat bei der Entwicklung der Deep-Learning-Features seiner Software Halcon eng mit Pilotkunden aus verschiedenen Branchen zusammengearbeitet. Mit Erfolg: Beim Prüfen von Kontaktflächen führte die Implementierung einer Deep-Learning-basierten Fehlererkennung zu einer massiven Reduzierung der Fehlerquote, was den Bedarf an manueller Prüfung drastisch reduzierte und die Produktion beschleunigte.

Also alles gut dank Deep Learning? „Die Technologie bringt viele Vorteile, hat aber auch Grenzen“, sagt Lückenhaus. Zum einen sind zum Trainieren Hundertausende von Beispielbildern nötig; gerade wenn man dazu Opensource-Lösungen nutzt. Zum anderen benötigen das Training und auch die spätere KI-basierte Klassifizierung der Daten sehr viele Rechenressourcen. „Daher werden große Rechenkapazitäten und eine entsprechende Hardware benötigt. Bei sehr zeitkritischen Anwendungen reicht eine Standard-CPU meist nicht aus“, betont Lückenhaus.

Industrie-Kamerahersteller wie IDS reagieren darauf. Bei deren App-basierten Industriekameras wird die Kamera-CPU durch einen programmierbaren Specialchip, ein Field Programmable Gate Array (FPGA), unterstützt. Daher hat IDS nun eine KI-Vision App entwickelt, die den integrierten FPGA in einen KI-Prozessor verwandelt, der viele bekannte Architekturen neuronaler Netze beschleunigt ausführen kann.