gibt es ein prinzipielles Problem, das bereits den Nutzen
einschränkt: Die Datenbasis ist entweder zu groß oder zu klein.
Nur mal angenommen, jeder würde mit kompletten Daten in der ATD
stehen. Und jetzt würde man versuchen, mit Hilfe der im Artikel
genannten Beispielabfrage (Personen, die in den letzten x Jahren in
Land y waren und/oder regelmässig Geld dorthin überweisen) eine
Rasterfahndung zu starten - das Ergebnis wäre nutzlos, weil die
Anfrage zu allgemein ist und wahrscheinlich tausende Treffer
angezeigt würden. Wir bräuchten also sehr spezielle und gut
ausgearbeitete Anfragen, um einen Nutzen daraus ziehen zu können.
Und jetzt im Gegenbeispiel mal eine ATD, in der wirklich nur bereits
verurteilte oder eindeutig gefährliche(*) Personen gespeichert. Eine
ähnlichbreite Anfrage bringt jetzt durch die Beschränkung der
Datenbasis ein verwertbares Ergebnis. Es gibt einige wenige
Einzeltreffer die überprüft werden können, und durch einschlägige
Vorstrafen ist das auch berechtigt und tatsächlich zielführend.
(*) nur mal ANGENOMMEN das wäre eindeutig.
Sobald das jetzt allerdinge ein Mischmasch aus nicht-dolorosa und
dolomiten Personen drin steht, ist eigentlich vorprogrammiert, das
auch bei kleinen Ergebnismengen, höchstwahrscheinlich keine
zielführenden Treffer dabei sind, man das allerdings nicht erkennt
und einer Ladung unschuldiger Leute das Leben zur Hölle macht, weil
man anhand der Datenbasis nicht mehr unterscheiden kann, ob
tatsächlich Anhaltspunkte vorliegen.
Unscharfe Abfragen auf kleine, valide Datenbestände funktionieren.
Sehr scharfe Abfragen auf sehr große und allgemeine datenbestände
funktionieren (Data-Mining)
Unscharfe Abfragen auf mittelgroße, schwammige Ausgangsdaten ergeben
nur Müll. Das ist wie der 6-Klässler, der ausrechnen soll wie viele
18-tonner LKWs man man für eine 1245 Tonnen Schiffsladung braucht und
ein ergebnis mit 38 Nachkommastellen aufschreibt, nur weil sie auf
dem Taschenrechner stehen. Und sich dann noch freut, dass er es genau
bis auf die Größe einer Streichholzschachtel gelöst hat!
Garbage in - garbage out!
Und wie angedroht hab ich noch nichtmal die verfassungsrechtlichen
und datenschutzrechtlichen Dimensionen tangiert.
einschränkt: Die Datenbasis ist entweder zu groß oder zu klein.
Nur mal angenommen, jeder würde mit kompletten Daten in der ATD
stehen. Und jetzt würde man versuchen, mit Hilfe der im Artikel
genannten Beispielabfrage (Personen, die in den letzten x Jahren in
Land y waren und/oder regelmässig Geld dorthin überweisen) eine
Rasterfahndung zu starten - das Ergebnis wäre nutzlos, weil die
Anfrage zu allgemein ist und wahrscheinlich tausende Treffer
angezeigt würden. Wir bräuchten also sehr spezielle und gut
ausgearbeitete Anfragen, um einen Nutzen daraus ziehen zu können.
Und jetzt im Gegenbeispiel mal eine ATD, in der wirklich nur bereits
verurteilte oder eindeutig gefährliche(*) Personen gespeichert. Eine
ähnlichbreite Anfrage bringt jetzt durch die Beschränkung der
Datenbasis ein verwertbares Ergebnis. Es gibt einige wenige
Einzeltreffer die überprüft werden können, und durch einschlägige
Vorstrafen ist das auch berechtigt und tatsächlich zielführend.
(*) nur mal ANGENOMMEN das wäre eindeutig.
Sobald das jetzt allerdinge ein Mischmasch aus nicht-dolorosa und
dolomiten Personen drin steht, ist eigentlich vorprogrammiert, das
auch bei kleinen Ergebnismengen, höchstwahrscheinlich keine
zielführenden Treffer dabei sind, man das allerdings nicht erkennt
und einer Ladung unschuldiger Leute das Leben zur Hölle macht, weil
man anhand der Datenbasis nicht mehr unterscheiden kann, ob
tatsächlich Anhaltspunkte vorliegen.
Unscharfe Abfragen auf kleine, valide Datenbestände funktionieren.
Sehr scharfe Abfragen auf sehr große und allgemeine datenbestände
funktionieren (Data-Mining)
Unscharfe Abfragen auf mittelgroße, schwammige Ausgangsdaten ergeben
nur Müll. Das ist wie der 6-Klässler, der ausrechnen soll wie viele
18-tonner LKWs man man für eine 1245 Tonnen Schiffsladung braucht und
ein ergebnis mit 38 Nachkommastellen aufschreibt, nur weil sie auf
dem Taschenrechner stehen. Und sich dann noch freut, dass er es genau
bis auf die Größe einer Streichholzschachtel gelöst hat!
Garbage in - garbage out!
Und wie angedroht hab ich noch nichtmal die verfassungsrechtlichen
und datenschutzrechtlichen Dimensionen tangiert.