Schlechte Daten gibt es häufig im Internet der Dinge und obwohl es schwer ist, eine Einschätzung darüber zu bekommen, welcher Anteil der von vernetzten Geräten eingehenden Informationen nicht verwendet werden können, zerbrechen sich viele Menschen darüber den Kopf.
Etwa 40 Prozent aller Daten aus den Kanälen der IoT-Netze sind "fehlerhaft ", sagt etwa Harel Kodesh, Vice President von GE Predix Software-Geschäft und CTO von GE Digital. Dabei sei jedoch ein Großteil dieser Daten nicht falsch, sondern nur nutzlos, also etwa doppelte Informationen, die Mitarbeiter versehentlich zweimal hochgeladen haben oder sich wiederholende Meldungen, die Maschinen im Leerlauf automatisch senden.
Foto: Shutterstock - schankz
Darüber hinaus könne es zu Problemen kommen, wenn eine neue IoT-Plattform auf die alten industriellen Reporting-Systeme gebaut werde, sagt Kodesh, weil die Legacy-Tools Daten auf ihre eigene Weise formatierten: "Man erhält nicht die echten elementaren Daten, sondern eine Übersetzung davon."
Wenn das Falsche gemessen wird
Manchmal generieren die Devices aber einfach nur Daten, die falsch oder irreführend sind. Kriecht beispielsweise ein Wurm über einen Temperatur-und Feuchtigkeitssensor in einem Feld, bekommt der Landwirt eine Auswertung darüber, wie warm und feucht der Wurm ist. Dies wird ihm aber nicht dabei helfen, seine Felder effizient zu bewirtschaften. Auch wenn ein Sensor mit Schmutz oder Fabrikschmutz bedeckt ist oder durch Vandalen beschädigt wird, kann dies die generierten Daten verfälschen.
Foto: John Deere
Je härter die Umgebungsbedingungen und je isolierter das Gerät ist, desto größer ist wahrscheinlich das Problem mit den schlechten Daten. Neben der Landwirtschaft sind davon Branchen wie die Öl- und Gasindustrie sowie die Energiewirtschaft betroffen. Aber es sind nicht nur weit entfernte Sensoren, die Probleme bereiten können. Sogar in einem Krankenhaus kann ein am Finger eines Patienten geklemmter Blut-Sauerstoffsensor schlechten Daten liefern, wenn er falsch angelegt wurde.
Hinzu kommt, dass manche IoT-Geräte selbst nicht mehr funktionieren und fehlerhafte Daten ausspucken oder gar keine Berichte mehr abliefern. In vielen anderen Fällen ist menschliches Versagen der Übeltäter: Falschen Einstellungen versauen, was das Gerät generiert.
Ein Weg, um schlechte Daten zu reduzieren, ist es entsprechend sicherzustellen, dass die Ausrüstung richtig eingestellt ist. So etwa beim Landwirtschaftsmaschinenhersteller John Deere: John Deere rüstet seine riesigen Farmwerkzeuge mit Sensoren aus, die erkennen, ob die Maschinen richtig funktionieren. So besitzt etwa die Einzelkornsämaschine ExactEmerge drei Sensoren pro Saatreihe um zu erkennen, wie viele Samen gepflanzt werden und mit welcher Geschwindigkeit. Diese kalibriert der Landwirt oder ein Deere-Händler mindestens einmal im Jahr - vor der Pflanzzeit - händisch, damit sie genau sind, erklärt Lane Arthur, Deere's Direktor für digitale Lösungen.
Mehr ist besser
Allerdings sind viele IoT-Sensoren zu schwer erreichbar, um eine regelmäßige Kalibrierung und Wartung vorzunehmen. In diesen Fällen kann Redundanz die Lösung sein, obwohl auch dies kein Patenzrezept ist. Mehrere Sensoren des gleichen Typs an einer Maschine, in einer Bergwerkanlage oder in einem Feld erzeugen aber mehr Eingaben, die an sich hilfreich sein können.
Weather Underground, ein Teil von IBM's Tochterfirma Weather Company erstellt seine Reports teils mit Daten von nicht kalibrierten, kostengünstigen Sensoren in den Hinterhöfen von Privatnutzern. Weather Underground erhält so für wenig Geld mehr Datenpunkte, aber die Qualität ist natürlich ein großes Thema. Ein Sensor kann versagen und mehrere Zentimeter Regen melden, während der neben ihm nichts misst, erklärt John Cohn, IBM Fellow für Watson IoT: "Das Großartige daran ist, dass Sie mit einer ausreichenden Dichte an solchen Sensoren mit etwas Mathematik die Ausreißer finden können und so erkennen, welche man sich vornehmen muss."
Unternehmen können auch verschiedene Sensor-Geräte, insbesondere Kameras, nutzen, um Sensoren zu überprüfen, die möglicherweise Probleme haben. Kombiniert man eine Videokamera mit einer Bildanalyse-Software, kann man feststellen, ob ein defektes Gerät schmutzig, beschädigt oder zerstört wurde", sagt Doug Bellin, Senior Manager Global Private Sector Industries bei Cisco. Manchmal können auch bereits vorhandene Sicherheitskameras diese Aufgabe (mit)übernehmen.
Foto: Shutterstock - YKTR
Eine Technik zum Verifizieren verschiedener Arten von Sensoren gegeneinander ist die Sensorfusion. Sie wiegt den Input von zwei oder mehr Sensoren gegeneinander ab, um zu einer Einschätzung zu kommen. Sensorfusion werde aktuell besonders in Krankenhäusern eingeführt, da dort falsche Alarme überhandnähmen, erklärt Stan Schneider, Präsident und CEO des IoT-Software-Unternehmens Real-Time Innovations (RTI). Anstelle etwa jedes Mal einen Alarm auszugeben, wenn der Blutsauerstoffsensor am Finger eines Patienten einen niedrigen Sauerstoffgehalt misst, würde ein solches Sensor-Fusionssystem diesen Messwert ständig mit denen der anderen Sensoren des Patienten vergleichen, wie zum Beispiel von Atmungs- und Herzfrequenzmessgeräten.
Der Phantomsensor
Andere Datenquellen können sogar für einen Sensor einspringen, der nicht einmal mehr da ist. Wie GE-Mann Kodesh berichtet, testet sein Unternehmen jedes neu gefertigte Strahltriebwerk auf seine Abgastemperatur, ein Wert, der seine Leistungsfähigkeit reflektiert. GE legt dazu einen Sensor mitten in den Abgaskanal, auch wenn er dort nach einigen Minuten verglüht. In der Zwischenzeit sammeln aber Sensoren an sichereren Stellen rund um das Triebwerk Daten - und durch Vergleich ihrer Messwerte mit dem, was die dem Untergang geweihte Vorrichtung vor der Zerstörung aufzeichnete, kann GE den direkten Sensor durch höhere Mathematik virtuell wiederherstellen.
Foto: General Electric
Das Ziehen von Schlussfolgerungen aus mehreren Informationsströmen trägt das Problem der Datenqualität in den Bereich des maschinellen Lernens. Das ist, wo die interessantesten Sachen passiert, sagt IBM-Fellow Cohn. IBM nutze beispielsweise die Watson Analytics-Plattform, um den Energieverbrauch in IBM-Einrichtungen in Irland zu verstehen. So könne Watson nicht nur eine Diskrepanz aufzeigen, wenn eine Klimaanlage sagt, sie sei ausgeschaltet, aber die Gesamtleistungsaufnahme dafür zu hoch ist. Im Laufe der Zeit lerne das System sogar die typische Art und Weise zu erkennen, wie diese Klimaanlage Strom zieht, wenn sie startet. Und mit diesem Wissen könne die Anlage dann praktisch auf frischer Tat ertappt werden.
Im Vergleich zu zusätzlichen Sensoren oder Kameras erfordert Machine Learning allerdings eine gewisse Zeit, um die Kontrolle auf fehlerhafte Daten aufnehmen zu können. "Das System wird schlauer, je länger es läuft", erklärt Cisco-Manager Bellin: Wenn es das erste Mal läuft, würde ich ihm nicht vertrauen. Läuft es das tausendste Mal, ist es ... wahrscheinlich schlauer als ich."
Je kritischer das IoT-System ist, desto wichtiger ist es, mit schlechten Daten umzugehen. Sensorfusion beispielsweise komme zum Einsatz, wenn die Zuverlässigkeit wichtig ist, etwa weil die Gesundheit eines Patienten auf dem Spiel stehe, sagt Schneider von RTI. Bei einigen Formen von IoT komme man aber gut ohne mehrere Datenquellen aus: "Für das Thermostat in Ihrem Haus brauchen Sie das bestimmt nicht."