Wasserfolter - Eine analytische Analogie geht eine Brücke zu weit

Tropfanalyse

Daten gibt es wie Wasser in vielen Formen. Der menschliche Geist hat sich weiterentwickelt, um die meisten Daten herauszufiltern, die uns in den Weg kommen, weil es einfach so viel davon gibt.

Wenn Sie Ihre Augen und Ohren öffnen, sind Daten überall. Die Farbe der Wand, das Geräusch der Klimaanlage und der Geruch des Kaffees Ihres Nachbarn werden wie Feuchtigkeit behandelt. Das Wasser ist die ganze Zeit in der Luft, aber es ist nicht sinnvoll, ihm viel Aufmerksamkeit zu schenken.

Wenn Wasser zu Nebel kondensiert, zwingt es Sie, es zu sehen, und erschwert das Verständnis der Welt um Sie herum. Unvollständige Datensätze, beschädigte Daten, schlechte Wissenschaft, falsche Schlussfolgerungen und kognitive Vorurteile führen dazu, dass Sie sich im Nebel verirren.

Daten fallen wie Regen. Wenn es nur wenig gibt, ist es wild unbefriedigend - gerade genug, um Ihr Auto schmutzig zu machen und das Gespräch zu verwirren. Sie wischen den Fleck auf Ihrer Brille weg, während jemand einen zufälligen Datenpunkt ausstößt, der aus einer unbekannten Quelle stammt.

  • Altes Wasser in einem flachen Teich ist gefährlich. Daten, die aus einer unzuverlässigen Versorgung stammen, weder gereinigt noch normalisiert wurden und stagnieren, können leicht zu fehlerhaften Schlussfolgerungen führen.
  • A stetiges Rinnsal Wasser kann gerade genug sein, um eine Kantine zu füllen oder ein Waldökosystem zu erhalten. Nur drei Datenpunkte (die Anzahl der gesendeten E-Mails im Vergleich zum Öffnen im Vergleich zum Klicken) können ein Marketingprogramm unterstützen.
  • A gesünderer Fluss Daten in Form eines kleinen Baches können zum Baden verwendet werden. Ein kontinuierlicher Datenfluss ermöglicht Benchmarking und historischen Vergleich. Die Zielseitenoptimierung kann mit stetigen Conversion-Daten durchgeführt werden.
    A bescheidener Fluss kann eine Mühle antreiben, um Holz zu sägen oder Weizen zu mahlen. Eine Empfehlungsmaschine benötigt nur den zuverlässigen Beitrag einer Handvoll Nebenflüsse, um den Wert von Einkaufswagen zu steigern.
  • A Wasserfall of kann ein riesiges Wasserrad antreiben und ein ausreichender Informationsfluss kann ein dynamisches Echtzeit-Content-System steuern.
  • A Fluss Das ist breit und tief genug, um eine ganze Transportbranche zu unterstützen. Genug Daten können Lastkähne und Frachtschiffe in Form einer Sammlung von Cookies aus Werbenetzwerken, Datenaggregatoren für Kundenkartenprogramme und Datenbrokern schweben lassen.

Wenn Daten zu erwarteten Zeiten in erwarteten Mengen eintreffen, können sie erfasst, kanalisiert und verwendet werden. Bewässerungssysteme, Dämme und Stauseen vermitteln ein Gefühl der Kontrolle und ermöglichen den Bau einer sich ständig erweiternden Infrastruktur mit Kanälen, Schleusen und Dämmen. Data Warehouses wurden auf weniger vertrauenswürdigen Flows aufgebaut.

Sauberkeit ist das halbe Leben

Sauberes Wasser ist entscheidend für den Erfolg des Lebens, der Bewässerung, des Betriebs von Kraftwerken usw. Die Definition von „sauber“ kann sich zu diesem Zweck ändern. Es ist in Ordnung, wenn Algen im Wasser sind, das ein Kraftwerk kühlt, und es ist nicht akzeptabel, wenn mehr als 10 Teile pro Milliarde Arsen im Trinkwasser enthalten sind.

Daten sind die gleichen. Bei einer Direktwerbung spielt es keine Rolle, ob Sie den Titel einer Person (Herr, Frau, Frau) haben ... es sei denn, Sie senden an Ärzte. Aber schmutzige Daten bringen Sie jedes Mal zum Stolpern.

Als US Chief Data Scientist DJ PatilSagen Sie es auf einem CTO-Gipfel der ersten Runde: „Wenn Sie nicht von Anfang an darüber nachdenken, wie Sie Ihre Daten sauber halten können, sind Sie begeistert. Ich garantiere es. Der Versuch, es nachträglich aufzuräumen, wird mindestens Monate dauern. “

Wenn Sie Wasser bis zum Siedepunkt erhitzen, kann dies eine ganze industrielle Revolution auslösen. Daten scheinen dasselbe zu tun. Von dem Moment an, an dem Computer speichern und berechnen konnten, wurden Daten so schnell erfasst, wie die Speicherausrüstung dafür erstellt werden konnte.

Der Datensee

Während die Daten dieser Nebenflüsse durch die Motoren der Mühlen fließen, landet alles im See hinter dem Damm. Da Daten kontrolliert ausgegeben werden, treiben sie die Turbinen der Datenindustrie an. diese riesigen Motoren der Datenverarbeitung mit Namen wie Google und Facebook. Hier wird es keine Dürre geben.

Und schließlich gibt es ein tiefes Wasserbecken, das darauf wartet, dass der Analytiker eintaucht. Tauchausrüstung und Harpune in der Hand, der Analytiker untersucht die Tiefe, kartiert neuen Boden und entdeckt neue Arten. Es ist eine sehr aufregende Zeit, ein Datenexplorer zu sein.

Deshalb sind so viele von ihnen zum eMetrics-Gipfel seit 2002. Die nächste Gelegenheit ist in Boston vom 27. September bis 1. Oktober 2015.

Registrierung des eMetrics Summit

A Bridge Too Far

Und was ist mit der Kraft der Daten, um den nächsten Grand Canyon zu schnitzen? Was ist mit dem Gletscherschmelzen strukturierter Daten? Wie behandeln wir Abwasser in einer Welt, die immer datenschutzbewusster wird?

Das sind Fragen für ein anderes Mal und Wasser unter der Brücke.

Was denken Sie?

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahren Sie, wie Ihre Kommentardaten verarbeitet werden.