Praktisches maschinelles Lernen für Unternehmen, Teil I

"Sprich Englisch!", sagte das Eaglet. "Ich kenne die Bedeutung der Hälfte dieser langen Wörter nicht, und außerdem glaube ich, dass du sie auch nicht kennst!" - Alice im Wunderland

Das maschinelle Lernen (und seine Untergruppe, das Deep Learning) wurden als "The Next Big Thing" gepriesen, das in der Lage ist, autonome Autos zu entwickeln, Geschäftsmodelle umzukrempeln und generell massive Investitionen in Human- und Finanzkapital zu erfordern, damit ein Unternehmen wettbewerbsfähig bleibt. Der Hype hat das "Wie" und vor allem das "Warum" übertönt. Wir bei SnapLogic sind zwar optimistisch, was das Versprechen des maschinellen Lernens (ML) im Unternehmen angeht, aber wir glauben, dass die erste Frage nicht lautet: "Wie implementiere ich es?", sondern: "Was will ich wissen?"

Ein Crashkurs in ML

Im Kern basieren die meisten ML-Algorithmen auf etwas, das Sie vielleicht schon in der Schule gemacht haben: eine Linie durch eine Reihe von Punkten zu zeichnen. Wenn Sie jemals eine Regression in Excel durchgeführt haben, haben Sie auch maschinelles Lernen betrieben. Was ist nun das Besondere daran?

Im Wesentlichen geht es um die Datenmenge und die Rechenleistung für die Verarbeitung. Die Regression ist ein Beispiel für überwachtes Lernen, was eine formale Umschreibung dafür ist, dass man die richtigen Antworten bereits kennt, aber versucht, ein Modell zu erstellen, das diese Antworten vorhersagen kann. (Oder, wie ein Datenwissenschaftler sagen würde, Sie haben "gelabelte Daten".) Die andere große Problemklasse ist das "unüberwachte Lernen", bei dem Sie eine Masse von Daten ("nicht gelabelte Daten") haben und hoffen, dass ein Algorithmus irgendwie aus all dem einen Sinn machen kann. Da Sie wahrscheinlich viel mehr unmarkierte als markierte Daten haben, kann die Verarbeitung dieser Daten eine Menge Rechenleistung erfordern.

"Ich glaube, mein Nest-Rauchmelder geht los. Google Adwords hat mir gerade einen Feuerlöscher und ein Angebot für eine Notunterkunft angezeigt." Copyright marketoonist.com

Eine weitere wichtige Kategorie ist die Anomalieerkennung (AD). Es gibt viele Möglichkeiten, AD zu implementieren, aber die Grundidee ist, aus einer Menge von Daten diejenigen Punkte zu identifizieren, die "falsch" sind. Wenn Sie eine Kreditkarte besitzen, haben Sie wahrscheinlich schon einmal einen Anruf von der ausstellenden Firma erhalten, weil ihr AD-Algorithmus eine Transaktion als potenziell betrügerisch eingestuft hat. Neben der Betrugserkennung ist AD unter anderem auch für die Qualitätskontrolle, die vorausschauende Wartung und die Sicherheit nützlich.

Maschinelles Lernen im Unternehmen einsetzen

Wenn Ihr Unternehmen Datenwissenschaftler beschäftigt, fragen Sie sie, wo sie den Großteil ihrer Zeit verbringen. A Artikel der New York Times heißt es, dass "50 bis 80 Prozent ihrer Zeit mit dem Sammeln und Aufbereiten widerspenstiger digitaler Daten vergeudet werden, bevor diese auf nützliche Nuggets untersucht werden können. Einige Unternehmen stellen "Big Data Engineers" ein, um den Datenwissenschaftlern diese Datenaufbereitung abzunehmen. In jedem Fall wird die doppelte bis vierfache Anzahl an Arbeitsstunden damit verbracht, die Daten in eine brauchbare Form zu bringen, als damit, sie tatsächlich nutzbar zu machen.

Bei SnapLogic ist die Datenverarbeitung, die Datenaufbereitung, die Datenpflege, die Datentransformation - wie auch immer Sie es nennen wollen - unsere Spezialität. Erinnern Sie sich daran, dass das moderne Interesse an maschinellem Lernen von der Menge der verfügbaren Daten und der Rechenleistung, die für deren Verarbeitung zur Verfügung steht, angetrieben wird. Wie wir kürzlich sagten, "SnapLogic bringt all Ihre Daten zusammen, mit unglaublicher Geschwindigkeit und mit einer noch nie dagewesenen Leichtigkeit. Daten, Anwendungen und APIs - von jeder Quelle, überall."

Ja sagen

Dies war der erste Teil einer mehrteiligen Serie über maschinelles Lernen im Unternehmen. Zukünftige Beiträge werden sich damit befassen, welche Fragen wir an ML stellen sollten, welche Daten und Infrastrukturen erforderlich sind, um diese Antworten zu erhalten, und wie SnapLogic und seine Partner diese Lösungen ermöglichen. Neben dieser Serie sollten Sie sich auch unsere IoT-Blogserie, unseren YouTube-Kanaloder uns für eine Demo ansprechen.

Wir stellen ein!

Entdecken Sie Ihre nächste große Karrierechance.