Table Of ContentNegative Identifizierung
anhand des Tippverhaltens
bei Verwendung
fester und freier Textbestandteile
Sebastian Erdenreich
Negative Identifizierung
anhand des Tippv erhaltens
bei Verwendung fester
und freier Text bestandteile
RESEARCH
Sebastian Erdenreich
Wolnzach, Deutschland
Dissertation der Wirtschaft swissenschaft lichen Fakultät der Universität Regensburg, 2012
ISBN 978-3-658-00966-3 ISBN 978-3-658-00967-0 (eBook)
DOI 10.1007/978-3-658-00967-0
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen National-
bibliografi e; detaillierte bibliografi sche Daten sind im Internet über http://dnb.d-nb.de
abrufb ar.
Springer Vieweg
© Springer Fachmedien Wiesbaden 2013
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung,
die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zu-
stimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Über-
setzungen, Mikroverfi lmungen und die Einspeicherung und Verarbeitung in elektronischen
Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem
Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche
Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu
betrachten wären und daher von jedermann benutzt werden dürft en.
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier
Springer Vieweg ist eine Marke von Springer DE. Springer DE ist Teil der Fachverlagsgruppe
Springer Science+Business Media
www.springer-vieweg.de
Danksagung
An dieser Stelle möchte ich allen danken, die zum Gelingen dieser Arbeit
beigetragen haben:
• Meinem Erstkorrektor und Betreuer, Herrn Prof. Dr. Dieter Bart-
mann, für die zahlreichen Anregungen, kreativen Vorschläge und die
Freiräume,diemirbeiderAnfertigunggelassenwurden.Ebensodank-
bar bin ich für die zahlreichen Erfahrungen, die mir für meinen wei-
teren Berufsweg sehr hilfreich sein werden.
• Herrn Prof. Dr. Peter Lory für die Bereitschaft, als zweiter Betreuer
meine Doktorarbeit zu begleiten.
• Meinem ehemaligen Arbeitskollegen Dr. Markus Wagenhofer, der als
Mathematiker wertvolle Anregungen gegeben hat, insbesondere für
den theoretischen Teil der Arbeit.
• Frau Rosemarie Knipper für die Unterstützung bei verwaltungstech-
nischen Angelegenheiten.
• Ganz besonders danken möchte ich meinen Freunden und ehemali-
gen Kollegen, Andreas Beer und Johann Schenkl. Neben den zahl-
losen wertvollen Anregungen für die Erstellung und Korrektur die-
ser Arbeit, vor allem auch für die Unterstützung bei programmier-
technischen Herausforderungen. Ebenso dankbar bin ich für die stets
gute Zusammenarbeit, bei der trotz zahlreicher Herausforderungen
der Spaß nie auf der Strecke blieb.
• Meinen Eltern, Heidi und Johann Erdenreich, die mir während der
Anfertigung dieser Arbeit stets den Rücken gestärkt haben.
Inhaltsverzeichnis
1 Problemstellung, Ziele und Aufbau 1
1.1 Problemstellung. . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Ziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Aufbau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I Grundlagen der Tippverhaltenserkennung 5
2 Relevante Aspekte der Biometrie 7
2.1 Einteilung und Beispiele biometrischer Systeme . . . . . . . 7
2.2 Aufbau eines biometrischen Systems . . . . . . . . . . . . . 12
2.3 Darstellung des Enrolments . . . . . . . . . . . . . . . . . . 16
2.4 Darstellung unterschiedlicher Betriebsmodi . . . . . . . . . 18
2.4.1 Verifizierung . . . . . . . . . . . . . . . . . . . . . . 18
2.4.2 Positive Identifizierung . . . . . . . . . . . . . . . . . 20
2.4.3 Negative Identifizierung . . . . . . . . . . . . . . . . 22
2.5 Qualitätskriterien biometrischer Systeme . . . . . . . . . . . 23
2.5.1 Wichtige Qualitätskriterien im Überblick . . . . . . 23
2.5.2 Wichtige Qualitätskennzahlen . . . . . . . . . . . . . 25
2.5.3 ROC und DET Kurve . . . . . . . . . . . . . . . . . 28
3 Ausgangslage bei Tippverhaltenserkennung 31
3.1 Einteilung der Verfahrensarten und Einsatzmöglichkeiten . 31
3.1.1 Vorgegebener Festtext . . . . . . . . . . . . . . . . . 32
3.1.2 Individueller Festtext . . . . . . . . . . . . . . . . . 33
viii Inhaltsverzeichnis
3.1.3 Freitext . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.4 Abhängigkeiten der Verfahrensarten . . . . . . . . . 34
3.2 Relevante Kriterien gemäß Problemstellung . . . . . . . . . 36
3.2.1 Vergleichbarkeit . . . . . . . . . . . . . . . . . . . . 36
3.2.2 Benutzerkomfort . . . . . . . . . . . . . . . . . . . . 37
3.2.3 Trennschärfe . . . . . . . . . . . . . . . . . . . . . . 37
3.2.4 Signifikanz der Ergebnisse . . . . . . . . . . . . . . . 38
3.3 Bewertung bestehender Festtextverfahren . . . . . . . . . . 38
3.3.1 Übersicht ausgewählter Verfahren. . . . . . . . . . . 38
3.3.2 Bewertung mittels beschriebener Kriterien . . . . . . 40
3.3.3 Fazit der Bewertung . . . . . . . . . . . . . . . . . . 46
3.4 Bewertung bestehender Freitextverfahren . . . . . . . . . . 48
3.4.1 Übersicht ausgewählter Verfahren. . . . . . . . . . . 48
3.4.2 Bewertung mittels beschriebener Kriterien . . . . . . 49
3.4.3 Fazit der Bewertung . . . . . . . . . . . . . . . . . . 53
II Entwicklung eines Freitextverfahrens 55
4 Grundideen für Freitextverfahren 57
4.1 Problem der textabhängigen Merkmale . . . . . . . . . . . . 57
4.2 Beschreibung der Grundidee einheitlicher Merkmalsvektoren 58
4.3 BeschreibungderGrundideederVerwendungvonTwoClass
SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.4 Verwendete Daten . . . . . . . . . . . . . . . . . . . . . . . 61
4.4.1 Sammlung der Freitextdaten . . . . . . . . . . . . . 61
4.4.2 Beschreibung der Datensätze . . . . . . . . . . . . . 64
5 Merkmalsextraktion 67
5.1 Mathematische Darstellung der Tippproben . . . . . . . . . 67
5.2 Merkmale ohne Kontextbindung . . . . . . . . . . . . . . . 68
5.2.1 Haltedauerhistogramm . . . . . . . . . . . . . . . . . 70
Inhaltsverzeichnis ix
5.2.2 Übergangsdauerhistogramme . . . . . . . . . . . . . 70
5.2.3 Verhältnishistogramm . . . . . . . . . . . . . . . . . 72
5.3 Merkmale mit Kontextbindung . . . . . . . . . . . . . . . . 73
5.3.1 Haltedauern . . . . . . . . . . . . . . . . . . . . . . . 77
5.3.2 Übergangsdauern . . . . . . . . . . . . . . . . . . . . 79
5.3.3 Verhältnisse . . . . . . . . . . . . . . . . . . . . . . . 81
5.4 Trennschärfe der Merkmale . . . . . . . . . . . . . . . . . . 82
5.4.1 Trennschärfe der Merkmale ohne Kontextbindung . 83
5.4.2 Trennschärfe der Merkmale mit Kontextbindung . . 85
5.4.3 Trennschärfe bei Kombination der Merkmale . . . . 87
6 Aufbau des Verfahrens 89
6.1 Grundlagen der Support Vector Machine . . . . . . . . . . . 89
6.1.1 Lineare SVM mit linear separierbaren Daten . . . . 90
6.1.2 Lineare SVM mit beliebigen Daten . . . . . . . . . . 94
6.1.3 Nichtlineare SVM . . . . . . . . . . . . . . . . . . . 98
6.1.4 Grid-search und cross-validation . . . . . . . . . . . 102
6.2 Klassifikation mit einzelnem Merkmal . . . . . . . . . . . . 104
6.3 Klassifikation mit Ensemble . . . . . . . . . . . . . . . . . . 107
III Verifizierung mit Freitext 111
7 Testdesign und Auswertung 113
7.1 Verwendetes Testdesign . . . . . . . . . . . . . . . . . . . . 113
7.2 Umfang des Enrolments . . . . . . . . . . . . . . . . . . . . 115
7.3 Länge der Tippproben . . . . . . . . . . . . . . . . . . . . . 117
7.3.1 Verwendung kurzer Texte . . . . . . . . . . . . . . . 117
7.3.2 Verwendung langer Texte . . . . . . . . . . . . . . . 119
7.3.3 Vergleich und Interpretation. . . . . . . . . . . . . . 121
8 Einordnung und Vergleich 123
8.1 Signifikanz der Ergebnisse . . . . . . . . . . . . . . . . . . . 123
x Inhaltsverzeichnis
8.2 Vergleich mit Festtextverfahren . . . . . . . . . . . . . . . . 126
8.3 Vergleich mit Freitextverfahren . . . . . . . . . . . . . . . . 128
IV Negative Identifizierung mit Fest- und Freitext 133
9 Grundlagen zur negativen Identifizierung 135
9.1 Unterschiede zur Verifizierung . . . . . . . . . . . . . . . . . 135
9.2 Verwendetes Testdesign . . . . . . . . . . . . . . . . . . . . 136
9.3 Berechnung der Templates . . . . . . . . . . . . . . . . . . . 141
10 Verwendung von Festtext 143
10.1 Abhängigkeit von Textmenge . . . . . . . . . . . . . . . . . 144
10.2 Abhängigkeit von Poolgröße . . . . . . . . . . . . . . . . . . 145
10.3 Abhängigkeit von Anzahl der Templates pro Benutzer . . . 147
10.4 Betrachtung der Signifikanz . . . . . . . . . . . . . . . . . . 149
11 Verwendung von Freitext 151
11.1 Abhängigkeit von Textmenge . . . . . . . . . . . . . . . . . 152
11.2 Abhängigkeit von Poolgröße . . . . . . . . . . . . . . . . . . 153
11.3 Abhängigkeit von Anzahl der Templates pro Benutzer . . . 155
11.4 Betrachtung der Signifikanz . . . . . . . . . . . . . . . . . . 157
12 Verwendung von Fest- und Freitext 159
12.1 Kombination von Frei- und Festtextanalyse . . . . . . . . . 160
12.2 Vergleich und Kombination bei identischen Bedingungen . . 161
12.2.1 Abhängigkeit von Textmenge . . . . . . . . . . . . . 162
12.2.2 Abhängigkeit von Poolgröße . . . . . . . . . . . . . . 163
12.2.3 Abhängigkeit von Anzahl der Templates pro Benutzer 165
12.3 Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Inhaltsverzeichnis xi
V Zusammenfassung und Ausblick 169
13 Zusammenfassung der Ergebnisse 171
13.1 Entwicklung eines Freitextverfahrens . . . . . . . . . . . . . 171
13.2 Erkennung von Mehrfachanmeldungen . . . . . . . . . . . . 174
14 Ausblick auf mögliche Verbesserungen 177
14.1 Entwicklung eines Freitextverfahrens . . . . . . . . . . . . . 177
14.2 Erkennung von Mehrfachanmeldungen . . . . . . . . . . . . 179
15 Bewertung der Zielerreichung 183
Literaturverzeichnis 185
Abbildungsverzeichnis
1.1 Aufbau der Arbeit . . . . . . . . . . . . . . . . . . . . . . . 4
2.1 Arten der Authentifizierung nach [74] . . . . . . . . . . . . 8
2.2 Aufbau eines biometrischen Systems, Abbildung in Anleh-
nung an [52]. Zwingend erforderliche Komponenten sind mit
blauer Farbe unterlegt. . . . . . . . . . . . . . . . . . . . . . 12
2.3 Ablauf des Enrolments, Abbildung in Anlehnung an [52] . . 17
2.4 Ablauf der Verifizierung, Abbildung in Anlehnung an [52] . 19
2.5 Ablauf der Identifizierung, Abbildung in Anlehnung an [52] 21
2.6 ROC Kurven biometrischer Systeme aus [36, S. 96] . . . . . 28
2.7 DET Kurven biometrischer Systeme aus [36, S. 96] . . . . . 29
3.1 EinteilungderVerfahrensartenanhandvonRestriktionenbei
Textwahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Einsatzmöglichkeiten der Verfahrensarten . . . . . . . . . . 35
4.1 Visualisierung des Problems textabhängiger Merkmale . . . 58
4.2 Visualisierung von Imputation und Weglassen . . . . . . . . 60
5.1 Erkennungsleistung der Merkmale ohne Kontextbindung . . 84
5.2 Erkennungsleistung der Merkmale mit Kontextbindung . . . 86
5.3 Erkennungsleistung der Merkmalsgruppen . . . . . . . . . . 87
6.1 Lineare SVM bei linear separierbarem Problem (in Anleh-
nung an [15]) . . . . . . . . . . . . . . . . . . . . . . . . . . 91