Warnung Icon Sie haben in Ihrem Browser Javascript deaktiviert! Bitte aktivieren Sie Javascript um eine korrekte Darstellung und Funktionsweise von IT-Schulungen zu gewährleisten. Warnung Icon
Header Background

Digitale Transformation - der Workshop zum Einstieg

19.09.-20.09.2019 in Nürnberg

Seminar Certified Ethical Hacker v10 (CEH)

15.07-19.07.2019 in Köln

Header Image
 
 

Vermutlich haben Sie Kontakt mit einer Data Mining-Anwendung gehabt. Wenn Sie online ein Buch erstanden haben, und eine Empfehlung wie “Andere Kunden, die dieses Produkt gekauft haben, kauften auch… ” bekamen, oder wenn Ihre Kreditkartenunternehmen Sie bittet, eine verdächtige Transaktion zu bestätigen oder bei der Beantragung eines Bankkredits einem Credit-Scoring unterzogen wurden dann haben Sie Kontakt mit einer Data Mining-Anwendung gehabt.

 

Einsatzszenarien von Data Mining

Data Mining Anwendungen ermöglichen aus großen Datenmengen noch unbekannten Zusammenhänge innerhalb von Daten zu erkennen, Trends, Muster und Vorhersagen abzuleiten. Im Gegensatz zu den klassischen Abfragewerkzeugen muss ihr Anwender nicht von vornherein wissen, wonach er sucht. Vielmehr führen sie den Anwender von sich aus zu den oft vermeintlich interessanten Informationen.
Aus Bestelldaten können auf diese Weise Kundenprofile gewonnen werden. Damit lässt sich das Marketing besser auf die Bedürfnisse der Kunden zuschneiden. Kredit-Scoring im Bankenbereich oder Warenkorbanalysen im (Internet-) Handel sind weitere Beispiele für die vielfältigen Einsatzsmöglichkeiten von Data Mining.

Der SQL Server beinhaltet die Technologie um Data Mining-Anwendungen zu Entwicklen. Dazu stehen bereits eine Vielzahl von Data Mining-Algorythmen zur Verfügung. Damit können Daten nach Mustern untersucht, um anschließend optional Vorhersagen anhand dieser Muster zu erstellen.

 

Entwickeln von Data Mining Anwendungen

Die Auswahl eines passenden Algorithmus zum Geschäftsproblem ist keine triviale Aufgabe, da ein Geschäftsproblem mit mehreren verschiedenen Algorithmen analysiert werden kann. Die richtige Auswahl stellt aber einen zentralen Erfolgsfaktor bei der Durchführung von Data-Mining Projekten dar.

Bei der Wahl einer entsprechenden Mining-Methode sind zwei Merkmale bei den Daten zu beachten:
Sind die Daten diskret (discrete) oder stetig (continuous)?
Sind die Daten voneinander abhängig oder unabhängig?
Welcher Algorithmus für welches Szenario benötigt wird, zeigt folgende Übersicht:

 

Analyseproblem Beispiele Microsoft-Algorithmen 

Klassifizierung:

Einteilen von Fällen in vordefinierte Klassen
wie "Gut" kontra "Schlecht" 

  • Analyse der Kreditwürdigkeit
  • Abwanderungsanalyse
  • Kundenbindung 
  • Decision Trees
  • Naive Bayes
  • Neural Nets
Segmentierung:
Entwickeln einer Taxonomie zum Gruppieren
  • Kundenprofilanalyse
  • Mailing-Kampagne 
  • Clustering
  • Sequence Clustering
Zuordnung:
Fortgeschrittenes Zählen von Korrelationen
  • Warenkorbanalyse
  • Fortgeschrittene Datenuntersuchung
  • Decision Trees
  • Association Rules 
Zeitreihenvorhersage:
Zukunftsvorhersage
  • Umsatzvorhersage
  • Aktienkursvorhersagen
  • Time Series
Vorhersage:
Vorhersage für den Wert eines neuen Falls
(z.B. neuer Kunde) basierend auf den Werten
ähnlicher bestehender Fälle (bestehende Kunden)
  • Angabe von Versicherungsprämien
  • Vorhersage für das Kundeneinkommen
  • Vorhersage der Temperatur 
  •  Alle
Abweichungsanalyse:
Entdecken von Unterschieden zwischen
Fällen oder Segmenten
  • Aufdecken von Kreditkartenbetrug
  • Netzwerkeinbruchanalyse
  • Alle

 

Data Mining-Algorithmen des SQL Server

Eine kurze Beschreibung ausgewählter DM-Algorithmen des SQL Server:

 
Microsoft Decision Trees ist häufig der Ausgangspunkt für Datenuntersuchung. Es handelt sich hier vor allen Dingen einen Klassifizierungs-Algorithmus, der sehr gut zur Entwicklung von Vorhersagemodellen für diskrete und kontinuierliche Attribute geeignet ist. Wenn der Algorithmus ein Modell erstellt wird untersucht, wie jedes in einen Datensatz eingegebene Attribut das Ergebnis des vorhergesagten Attributs beeinflusst. Das Ziel ist es, eine Kombination von eingegebenen Attributen und deren Status zu finden, die es erlaubt, das Ergebnis des vorhergesagten Attributs zu prognostizieren.  

Microsoft Naive Bayes erstellt schnell Mining-Modelle, die zur Klassifizierung und Vorhersage dienen. Es werden Wahrscheinlichkeiten für jeden möglichen Status des eingegebenen Attributs anhand jedes Status des vorhersagbaren Attributs errechnet. Der Algorithmus unterstützt nur diskrete (nicht kontinuierliche) Attribute und betrachtet alle eingegeben Attribute als unabhängig für das vorgegebene vorhersagbare Attribut ein. Da der Naive Bayes-Algorithmus sehr schnell rechnet, wird er gerne für die erste Datenuntersuchungsphase verwendet, sowie für Klassifizierung und Vorhersage.

 
aive   naive bayes viewer

 
Microsoft Clustering verwendet iterative Techniken, um Auszüge aus einem Datensatz in Cluster zu fassen, die ähnliche Eigenschaften besitzen. Mit diesen Clustern können Daten auf Beziehungen hin untersucht werden. Ebenso können anhand des Cluster-Modells Vorhersagen erstellt werden.
 

Microsoft Association basiert auf einem a priori-Algorithmus, und bietet effektive Unterstützung zum Auffinden von Mehrfachkorrelationen innerhalb großer Datensätze. Der Association-Algorithmus durchsucht die Transaktionen innerhalb einer Datenbank, um herauszufinden, welche Elemente in den Transaktionen eines einzelnen Benutzers am wahrscheinlichsten gemeinsam auftreten. Zusammenhängende Elemente werden in Itemsets gruppiert, und es werden Regeln generiert, die zur Vorhersage dienen. Microsoft Association wird am häufigsten für Warenkorbanalysen verwendet. Jede relationale oder OLAP-Analyse, die häufig "distinct counts" ausführt, ist ein geeigneter Kandidat für eine Association-Analyse. Der Microsoft Association-Algorithmus reagiert empfindlich auf die Wahl der Algorithmus-Parameter, deshalb empfiehlt sich bei kleineren Problemen Microsoft Decision Trees als der bessere Algorithmus für Warenkorbanalysen.
 associaton rules viewer


Microsoft Sequence Clustering kombiniert Sequenzanalyse und Clustering für das Untersuchen von Daten und Vorhersagen. Das Sequence Clustering-Modell beachtet die Reihenfolge, in der Ereignisse auftreten. Zusätzlich berücksichtigt der Clustering-Algorithmus andere Attribute bei der Clusterbildung, was die Entwicklung eines Modells ermöglicht, das sequenzielle und nicht sequenzielle Informationen korreliert. Der Sequence Clustering-Algorithmus kann für Clickstreamanalysen verwendet werden, die den Verkehrsfluss auf einer Website analysieren; so kann herausgefunden werden, welche Seiten am engsten mit dem Verkauf eines Produkts verbunden sind, und es kann vorhergesagt werden, welche Seiten als nächste besucht werden.
 Sequence Clustering Viewer

 

 
Microsoft Time Series erstellt Modelle für die Vorhersage einer oder mehrerer kontinuierlicher Variablen, wie etwa Aktienkurse. Der Time Series-Algorithmus basiert seine Vorhersage allein auf den Trends, die aus den Trainingsdaten während der Entwurfsphase des Modells abgeleitet wurden. Microsoft Time Series verwendet eine AutoRegression Trees-Technik, ist sehr einfach zu handhaben und generiert extrem genaue Modelle. Ein gesamter Zweig in der statistischen Analyse ist ausschließlich Time Series gewidmet. Die meisten anderen Data Mining-Produkte bieten viele Techniken wie ARMA, ARIMA, und Box-Jenkins, unter denen der Statistiker die für das Modell passendste heraussuchen muss. Microsoft hat sich für eine Herangehensweise entschieden, die Time Series-Analyse einem breiten Publikum zugänglich macht, und das mit exzellenten und genauen Ergebnissen.
 Time Series Model

 
Microsoft Neural Net, wie auch Decision Trees und Naïve Bayes, wird hauptsächlich für das Untersuchen von Daten, die Klassifizierung und Vorhersage verwendet. Neural Net ist eine Technik der künstlichen Intelligenz, die alle möglichen Datenbeziehungen untersucht. Da es sich um eine sehr gründlich arbeitende Technik handelt, ist das der langsamste der drei Klassifizierungs-Algorithmen.

 
Data Mining Schulungen   

Die Seminare werden von unseren projekterfahrenen Data Mining-Spezialisten durchgeführt. Wir vermitteln Ihnen punktgenau das notwendige technologische, methodische oder organisatorische Wissen für Ihr individuelles Projekt. Ein Auswahl unserer Data Mining-Seminare.

 
 
 

Diese Seite weiterempfehlen:

0
Merkzettel öffnen
0
Besuchsverlauf ansehen
IT-Schulungen.com Control Panel