Die Wahl des Suchbegriffs in anfragebasierten Systemen zur Erkennung bibliographischer Dubletten
Jele, H.; · B.I.T online, Wiesbaden · 2013 · Heft 12 · S. 453 bis 465
Bibliografische Angaben
Zusammenfassung
Bei der Deduplizierung bibliographischer Daten ist man im Besonderen darauf bedacht, nicht zu viele Titeleinträge miteinander vergleichen zu müssen. Dies liegt einerseits natürlich darin begründet, dass die Dublettenberechnung großer Treffermengen aufwändig ist. Effektiver ist natürlich jeder Ansatz, der die Menge an zu prüfenden Titeln gering hält. Je kleiner diese Menge wird, umso größer ist im Umkehrschluss jedoch die Wahrscheinlichkeit, dass Dubletten übersehen werden. Bei jeder getätigten Einschränkung des Suchraums, in dem eine Prüfung auf Dubletten stattfindet, stehen sich somit Effizienz und Zuverlässigk…