Partitionierung zur effizienten Duplikaterkennung in relationalen Daten

ebook ∣ Ausgezeichnete Arbeiten zur Informationsqualität

By Uwe Draisbach

cover image of Partitionierung zur effizienten Duplikaterkennung in relationalen Daten

Format

ebook

ISBN

9783834817723

Release

09 March 2012

Subjects

Computer Technology Nonfiction

Search for a digital library with this title

Learn more about precise location detection

Title found at these libraries:

Library Name	Distance
Loading...

Duplikate bzw. Dubletten sind mehrere Datensätze, die das gleiche Realweltobjekt beschreiben, etwa mehrfach erfasste Kunden in einem CRM-System oder unterschiedliche Repräsentationen eines Produkts. Das Auffinden dieser Duplikate ist auch für moderne Computer eine komplexe und zeitintensive Aufgabe. Uwe Draisbach vergleicht zwei der einschlägigen Partitionierungsstrategien, die eine intelligente Auswahl von zu vergleichenden Datensatzpaaren treffen. Daraus entwickelt er ein verallgemeinertes Verfahren und zeigt, dass eine intelligente Auswahl der Datensatzpaare den Aufwand signifikant reduzieren kann, ohne die Qualität der Duplikaterkennung wesentlich zu verringern.

Die Arbeit wurde mit dem „Information Quality Best Master Degree Award" der Deutschen Gesellschaft für Informations- und Datenqualität ausgezeichnet.

Format

ebook

ISBN

9783834817723

Series

Ausgezeichnete Arbeiten zur Informationsqualität

Author

Uwe Draisbach

Publisher

Vieweg+Teubner Verlag

Release

09 March 2012

Subjects

Computer Technology Nonfiction

Partitionierung zur effizienten Duplikaterkennung in relationalen Daten

Copy and paste the code into your website.

<div><script src="https://www.overdrive.com/media/9574229/sample-embed?slug=partitionierung-zur-effizienten-duplikaterkennung-in-rel"></script></div>

Partitionierung zur effizienten Duplikaterkennung in relationalen Daten

ebook ∣ Ausgezeichnete Arbeiten zur Informationsqualität

By Uwe Draisbach

Format

ISBN

Series

Author

Publisher

Release

Share

Subjects

Search for a digital library with this title

Title found at these libraries:

Format

ISBN

Series

Author

Publisher

Release

Share

Subjects