Ausreißer-Erkennung mit einem neuen hybriden Ansatz auf gemischten Datensätzen
Data Mining ist ein Prozess, bei dem versteckte und nützliche Informationen aus den Daten extrahiert werden. Die Erkennung von Ausreißern ist ein grundlegender Teil des Data Mining und genießt in letzter Zeit große Aufmerksamkeit in der Forschungsgemeinschaft. Ein Ausreißer ist ein Datenobjekt, das von anderen Beobachtungen abweicht. Die Erkennung von Ausreißern hat wichtige Anwendungen bei der Datenbereinigung sowie beim Mining von abnormalen Punkten für die Erkennung von Betrug, Börsenanalyse, Intrusion Detection, Marketing, Netzwerksensoren. Die meisten der bestehenden Forschungsbemühungen konzentrieren sich auf numerische Datensätze, die nicht direkt auf kategorische Datensätze anwendbar sind, bei denen es wenig Sinn macht, die Daten zu ordnen und Abstände zwischen Datenpunkten zu berechnen. Darüber hinaus benötigen einige der aktuellen Ausreißer-Erkennungsmethoden quadratische Zeit in Bezug auf die Größe des Datensatzes und benötigen in der Regel mehrere Scans der Daten; diese ...