dc.contributor.author
Ickler, Christian
dc.contributor.author
Wiesel, John
dc.date.accessioned
2018-06-08T07:47:57Z
dc.date.available
2012-11-09
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/18738
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-22424
dc.description.abstract
The internet promises ad hoc availability of any kind of information. Conflict
researchers seem to be bound only by the effort needed to find and extract the
necessary information from international news sources. This begs the question
of whether the sheer number of accessible news sources and the speed of the
news cycle dictate an automated coding approach in order to keep up. Will the
initial costs of implementing such a system outweigh the possible loss of
information on violent conflict? We answer these questions in relation to the
Event Data on Armed Conflict and Security project (EDACS) where we carry out
both human and machine-assisted coding to generate spatiotemporal conflict
event data. We use spatiotemporal comparability measures for quantitative and
qualitative comparison of the two datasets. While the quality of human-coding
exceeds a purely automated approach, a compromise between efficiency and
quality results in a supervised, semi-automated machine learning approach. We
conclude by critically reflecting on the possible discrepancies in the
analysis of these resulting datasets.
de
dc.description.abstract
Das Internet verspricht ad hoc Verfügbarkeit jedweder Information.
Konfliktforscher müssen daher dem Anschein nach nur noch die gewünschten
Informationen finden und extrahieren. Dies wirft die Frage auf, ob die schiere
Zahl verfügbarer Nachrichtenquellen und die Geschwindigkeit des
Informationsflusses eine Maschinenkodierung zwingend notwendig machen? Und
wiegen die initialen Kosten der Implementierung eines solchen Systems die
Kosten des möglichen Informationsverlustes auf? Wir haben diese Fragen für das
Event Data on Armed Conflict and Security Projekt (EDACS) beantwortet und im
Zuge dessen, sowohl manuell als auch semiautomatisch, raumzeitlich
desaggregierte Ereignisdaten eines bewaffneten Konflikts kodiert. In diesem
Papier stellen wir beide Ansätze quantitativ und qualitativ mit Hilfe
raumzeitlicher Vergleichsmaße einander gegenüber. Während die Qualität manuell
kodierter Daten die maschinell erstellter Daten übertrifft, bietet die semi-
automatische Variante einer überwachten Maschinenkodierung einen Kompromiss
zwischen Effizienz und Qualität. Wir schließen mit einer kritischen
Aufarbeitung möglicher Diskrepanzen in Analysen basierend auf den beiden
Datensätzen.
de
dc.relation.ispartofseries
urn:nbn:de:kobv:188-fudocsseries000000000012-2
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject.ddc
600 Technik, Medizin, angewandte Wissenschaften::600 Technik::600 Technik, Technologie
dc.subject.ddc
300 Sozialwissenschaften::350 Öffentliche Verwaltung, Militärwissenschaft::355 Militärwissenschaft
dc.title
New Method, Different War?
dc.title.subtitle
Evaluating Supervised Machine Learning by Coding Armed Conflict
refubium.affiliation
Politik- und Sozialwissenschaften
de
refubium.affiliation.other
SFB 700: Governance in Räumen begrenzter Staatlichkeit
refubium.mycore.fudocsId
FUDOCS_document_000000015258
refubium.series.issueNumber
39
refubium.series.name
SFB Governance working paper series / Englische Ausgabe
refubium.mycore.derivateId
FUDOCS_derivate_000000002182
dcterms.accessRights.openaire
open access