Künstliche Intelligenz, was ist das?
Bevor wir auf Deep Learning in der Videoüberwachung eingehen, beginnen wir mit einer kurzen Übersicht über Künstliche Intelligenz (KI) im Allgemeinen. Wenn Sie nur am Teil Videoüberwachung interessiert sind, können Sie direkt zum Kapitel «Deep Learning in der Videoüberwachung» weiter unten.
Schwierige Definition von KI
Unter Künstlicher Intelligenz (engl. Artificial Intelligence, AI), versteht man die Wissenschaft, welche Dinge intelligent macht. Andere denken an Maschinen die menschliche Intelligenz zeigen. Die Definition von Künstlicher Intelligenz ist auch dem Wandel der Zeit unterzogen und ändert sich stetig. Auch bei Wikipedia findet man keine anerkannte Definition. Wichtig für KI scheinen aber ein Zusammentreffen von
- Informatik (Softwareprogramme)
- Automatisierung von intelligentem Verhalten
Ein dritter meist genannte Punkt sind Maschinen. Wobei man unter Maschinen dann reale Maschinen, Anlagen oder Roboter versteht, aber auch Softwareapplikationen (bzw. virtuelle Maschinen). Letztere werden in letzter Zeit immer wichtiger.
Welche Aufgaben können heute mit künstlicher Intelligenz gelöst werden
Maschinen oder wie oben beschrieben Softwareprogramme können heute
- Objekte erkennen
- Sprache und Geräusche erkennen
- Kreativ sein und etwas neues aus einem alten Muster kreieren
- Voraussagen treffen, was in Zukunft eintreffen wird (aus Daten der Vergangenheit)
- Sprachen übersetzen
- Am Computer neue menschliche Gesichter generieren
- Verhalten und Emotionen erkennen
Das Ziel dieser Entwicklungen ist stets ein System zu bauen, das etwas gleich gut oder sogar besser kann wie ein Mensch. Interessant ist hierbei, dass es bis heute erst gelang Maschinen jeweils eine separate Sache zu lernen. Die Kombination von mehreren Aufgaben ist aktuell bei Facebook in Entwicklung (zu lesen bei heise.de). Sie möchten einen Assistenten für das Videospiel Minecraft entwickeln. Dieser soll dann mehrere Aufgaben gleichzeitig besser als ein Mensch erledigen können, was aktuell ein Novum wäre. Künstliche Intelligenz wird in Zukunft in praktisch allen Branchen und Lebensbereichen unser Leben verändern. Oft genannt in der Presse werden der Finanzbereich, die Medizin und das Gesundheitswesen, die Verwaltung allgemein, aber auch Logistik- und Speditionswesen. Neben diesen wird aber kaum ein Lebensbereich von KI unberührt bleiben.
Struktur in der KI Forschung
Die Künstliche Intelligenz kann folgendermassen strukturiert werden:
- Künstliche Intelligenz
- Machine Learning
- Deep Learning
- Machine Learning
Deep Learning ist also ein Teilbereich von Machine Learning, was wiederum ein Teilbereich von Künstlicher Intelligenz ist.
Machine Learning als Teilgebiet der Künstlichen Intelligenz
Machine Learning ist ein Teilgebiet der Künstlichen Intelligenz. Dabei wird einer Maschine gelernt, wie sie aus Vergangenheits-Daten Zusammenhänge erkennen kann. Wichtige ist dabei, dass nicht alle Regeln programmiert werden, sondern dass die Maschine die Regeln selber findet. Dazu muss die Maschine vorab mit vielen Daten gefüttert werden. Neue Daten, die ähnlich sind wie die zuvor eingegebenen, kann die Maschine dann selbständig einordnen. Hier spielt dann auch ein weiteres grosses Thema, nämlich «Big Data» eine Rolle.
Wichtig ist hierbei auch zu verstehen, dass diese Maschine nichts aussagen kann über Dinge, die sie nicht kennt. Allerdings wird es relativ einfach sein, einer Maschine die auf Bildern Katzen erkennen kann, das Erkennen von Hunden zu lernen.
Typische Aufgaben für maschinelles Lernen
- Regression: Zukünftige Einwohnerzahlen vorhersagen
- Klassifizierung: In der Bilderkennung (erkennen von Mensch, Auto, Lastwagen, usw. oder auch als Jugendschutzfilter)
- Gruppenbildung: Ähnliche Produkte erkennen (Empfehlungen auf Shopping-Seiten oder ähnliche Lieder oder Filme bei Streaming Diensten)
- Sequenz Vorhersage: Es geschehen einige Dinge, die auf ein Ereignis in der Zukunft hindeuten. Typisches Beispiel hier ist die Wettervorhersage. Auch eine Künstliche Intelligenz die Cyberangriffe vorhersagen kann, gehört zu dieser Kategorie.
Deep Learning als Teilgebiet von Machine Learning
Deep Learning ist also eine Technik, wie Machine Learning umgesetzt werden kann. Eine dieser Techniken sind «Deep Neutral Networks (DNNs)». Diese kennzeichnen sich durch eine Struktur von mehreren (virtuellen) Schichten. Die Idee dahinter ist der Versuch, das menschliche Gehirn nachzuahmen, also ein Neuronales Netzwerk. Damit kommt man dem Ziel eine Künstliche Intelligenz zu bauen einen grossen Schritt näher.
Die Punkte ganz links entsprechen dem Input. Die Punkte im mittleren Bereich sind die Neuronen. Sie erhalten den Input und geben nach einer Prüfung desselben einen Output an die nächste Schicht von Neuronen weiter. Die letzte Schicht dieses Modells liefert dann das Resultat. Während jedem Berechnungs-Durchlauf werden die Schichten angepasst, was dann das eigentliche Lernen darstellt. Dabei ist es wichtig zu verstehen, dass die Anzahl Inputs, die Anzahl Schichten und die darin enthaltenen Neuronen sehr gross sein können. Nimmt man hier z.B. als Input ein HD-Bild, dann enthält dieses über 2 Millionen Pixel (2MP). Dabei bildet jedes dieser Pixel einen Input, der dann von den Neuronen weiterverarbeitet wird. Damit sind wir nun auch bei der Videoüberwachung angekommen. Typischer Weise wird daneben Deep Learning heute genutzt um Autos zu steuern, um Krankheiten zu diagnostizieren oder um gesprochene Sprache zu verarbeiten.
Deep Learning in der Videoüberwachung
In der Videoüberwachung werden Videoanalysen immer wichtiger. Hier geht es darum, einen Videostream zu analysieren. Dies kann live oder auch im Nachhinein sein. Klassischerweise wird dies heute noch von einem Menschen vorgenommen (einem Mitarbeiter in einer Überwachungszentrale). Wenn ein Mensch ein Video analysiert, dann kann er das nur mit normaler Geschwindigkeit machen (nicht z.B. im Schnellvorlauf). Auch mehrere Videos parallel zu analysieren erscheint sehr schwierig. Soll nun eine Videoüberwachung mit dutzenden, hunderten oder tausenden Überwachungskameras analysiert werden, so ist man auf die Hilfe von Videoanalyse-Software angewiesen. In der Videoanalyse gibt es heute Software, die auf Videos die unterschiedlichsten Ereignisse erkennen kann. Um diese Ereignisse erkennen zu können, wird meist Deep Learning als Technologie eingesetzt, also Künstliche Intelligenz. Hikvision, Unser Partner für intelligente Überwachungskameras, ist hier Vorreiter.
Wichtige Deep Learning Anwendungen in der Videoüberwachung
Die wichtigsten Deep Learning Anwendungen in der Videoüberwachung sind heute
- Gesichtserkennung
- Menschen erkennen (AcuSense bei Hikvision)
- Fahrzeuge erkennen (AcuSense bei Hikvision)
- Verhalten von Personen und Fahrzeugen erkennen:
– Herumlungern
– Panik in einer Menschenmenge
– Entreissdiebstähle erkennen
– Hingefallene Personen erkennen und Alarm auslösen wenn diese nicht wieder aufstehen
– Ein Fahrzeug erkennen, das auf einem Bahnübergang stehen bleibt
– Geisterfahrer - Feuer erkennen (mit Wärmebildkameras)
Man sieht, dass Künstliche Intelligenz in der Videoüberwachung bereits heute eine grosse Rolle spielt.
Weitere interessante Anwendungen in der Videoanalyse sind
- Autonummern erkennen (LPR)
- Zurückgelassene Objekte erkennen (Flughafen, wildes Müllabladen)
- Gestohlene Objekte erkennen (Museen, Ausstellung)
- Fahrzeuge zählen (oder andere Objekte)
- Geschwindigkeit von Fahrzeugen ermitteln
- Beim Bankomat Skimming erkennen
- Leere Gestelle oder freie Parkplätze finden
- Personen oder Fahrzeuge über verschiedene Überwachungskameras verfolgen
- Kundenspezifische Anwendungen, wie z.B. Sprayer erkennen
Künstliche Intelligenz in der Videoüberwachung heute
Aktuell wird Künstliche Intelligenz bei den oben beschriebenen Anwendungen eingesetzt. Dabei sind, was die Häufigkeit angeht, vor allem die Erkennung von Personen und Fahrzeugen (bei Hikvision AcuSense), sowie die Gesichtserkennung weit verbreitet. Dies aus dem Grund, weil dann direkt auf Ereignisse eingegangen werden kann, welchen von diesen Gruppen (Personen und Fahrzeuge) ausgelöst wurden. Alle anderen Ereignisauslöser können dann ausgeschlossen werden (z.B. Tiere, Pflanzen, Licht und Schatten). Bei der intelligenten Videoüberwachung ist China bekanntlich Vorreiter. Dazu findet man im Internet auch eindrückliche Zahlen. So plant China die Installation von 626 Millionen Überwachungskameras bis 2020 und ist dabei auf gutem Weg.
Überwachung der Bevölkerung durch den Staat
Mit Hilfe von Videoüberwachungen mit Künstlicher Intelligenz überwachen heute bereits mindestens 75 Länder ihre Bevölkerung. Dies ist in der aktuellen Studie «The Global Expansion of AI Surveillance» nachzulesen. Die Studie hat dazu 176 Länder durchleuchtet. 64 dieser Länder setzen Gesichtserkennung zur Überwachung ein. Wie nicht anders zu erwarten, ist dabei China der Hauptlieferant für die Technologie. Der kleiner Teil der untersuchten Länder benutzt Künstliche Intelligenz Technologie aus den USA. Die Studie ist sehr detailliert und listet auch die Hauptlieferanten auf. Darin auch erwähnt werden 56 Länder, die bereits Systeme für «Smart Cities» einsetzen. Denn auch hier kommt Deep Learning zum Einsatz.
Künstliche Intelligenz in der Videoüberwachung der Zukunft
Wenn man in die Zukunft schaut und sich Gedanken über das macht, was möglich wäre, dann kommt man auf unzählige neue Szenarien. Da die Überwachungskamera ja Personen identifizieren kann, ist es heute bereits möglich Gebiete so abzusichern, dass Alarm ausgelöst wird, wenn eine bestimmte Person oder Personengruppe einen definierten Bereich betritt. Da kann z.B. die Überwachungskamera zu Hause in der Küche Alarm auslösen, wenn der Ehegatte nachts seinen nächtlichen Hunger stillen möchte. Aber auch Personen die sich nicht in der Nähe von Kindergärten aufhalten dürfen, kann man so leicht aufspüren. Grundsätzlich können Kameras Ereignisse so gut wie ein Mensch erkennen, ev. sogar noch besser. Denn die Überwachungskamera hat ja immer die gesamte «Aufmerksamkeit» auf der Szene und «beobachtet» jede Kleinigkeit.
Künstliche Intelligenz aus der Cloud
Weil Videoüberwachung und Zutrittskontrolle bei den meisten Unternehmen nicht eine strategische Position einnehmen, können diese Themen grundsätzlich outgesourced werden. Was die Firmen heute noch daran hindert, sind nicht verfügbare Services und das mangelnde Vertrauen in den Outsourcer, bzw. den Cloud Service. Dies weil es sich bei Videoüberwachung und auch bei der Zutrittskontrolle um sehr sensible Daten handelt. Ist die Sicherheit gewährleistet bietet die Cloud Lösung viele Vorteile. So kann der Dienstleister die verschiedensten Videoanalysen als Service zur Verfügung stellen (SaaS) und das Unternehmen selbst kann sich um sein Key-Business kümmern. Denn gerade die Themen mit Künstlicher Intelligenz, wie z.B. Deep Learning, erfordern doch ein gewisses Know-how.
Ist der Service aber etabliert, muss sich das Unternehmen nicht mehr um die Wartung der Videoüberwachung oder der Zutrittskontrolle, um eigenes ausgebildetes Personal und oft auch nicht um die Installation selbst kümmern. Denn all dies kann der Cloud-Anbieter unter dem Thema «Managed Services» anbieten.
Predictive Policing
Die Überwachungskamera der Zukunft wird auch vermehrt im Bereich «Predictive Policing» eine Rolle spielen. D.h. aufgrund von vergangenen Beobachtungen wird die Videoüberwachung auf zukünftige Handlungen schliessen können. Damit besteht dann auch die Chance, dass das vorhergesagte Ereignis verhindert werden kann. Dabei registrieren Überwachungskameras z.B. verdächtiges Verhalten (Erkennung erlernt via Deep Learning) und können so verdächtige Personen identifizieren. Die effektive Polizeiarbeit wird dann aber immer noch von echten Polizisten weitergeführt. In der oben erwähnten Studie «The Global Expansion of AI Surveillance» wurde auch Predictive Policing untersucht. Dabei hat man 52 Länder identifiziert, die bereits heute Künstliche Intelligenz in der Verbrechensbekämpfung einsetzen.
Verhaltenserkennung
Intelligente Überwachungskameras können heute bereits verschiedene Verhaltensweisen von Personen erkennen. Dieses Einsatzgebiet der Künstlichen Intelligenz wird sich in Zukunft aber noch wesentliche vergrössern. Heute werden die einzelnen Szenarien den Videoüberwachungen beigebracht. Dies sind Szenarien wie «hinfallen und nicht wieder aufstehen» (wichtig in Altersheimen oder Spitälern) oder «Entreissdiebstähle» oder «Panik auf Plätzen». In Zukunft werden Überwachungskameras aber ungewöhnliches Verhalten einfach so erkennen. Nach einem Einlernzeitraum hat die Kamera gelernt, was «normal» ist. Nach dieser Deep Learning Einlernphase erkennt die Kamera selbständig, wenn etwas ungewöhnliches beobachtet wird. Dabei ist ungewöhnlich einfach alles, was nach einer Einlernphase neu ist. Aktuell testet gerade das Ministerium der Justiz in Deutschland in einer Justizvollzugsanstalt (JVA) eine Videoüberwachung mit Künstlicher Intelligenz zur Suizidprävention. Auch hier geht es darum, bestimmte Verhaltensmuster mit einer intelligenten IP-Kamera zu erkennen und mittels Videoanalyse auszuwerten.
Datenschutz und Deep Learning
Umso mehr Daten eine Videoüberwachung sammelt, umso kritischer wird diese aus Sicht des Datenschutzgesetzes. Weil bei Videoanalysen, bei denen Künstliche Intelligenz eingesetzt wird, meist auch biometrische Daten gespeichert werden, sieht unser Datenschutzgesetz dafür die schärfsten Gesetze vor. So gesehen ist vor einer Einführung einer solchen intelligenten Überwachung mit Künstlicher Intelligenz stets der Nutzen gegenüber den Kosten (hier die Einschränkung der Persönlichkeitsrechte) abzuwägen. Wie heute die Gesetzeslage bei einer Videoüberwachung aussieht, erfahren Sie im Blog «Videoüberwachung: Was ist erlaubt und was nicht».
Sind Sie an einer intelligenten Videoüberwachung interessiert?
Dann kommen Sie auf uns zu! Wir beraten Sie kostenlos! -> KONTAKT

Gerne beraten wir Sie persönlich
“…Zögern Sie nicht, uns bei weitere Fragen zu Kontaktieren.”