dc.contributor.author
Stärk, Luka
dc.date.accessioned
2021-08-27T06:03:37Z
dc.date.available
2021-08-27T06:03:37Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/31751
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-31482
dc.description.abstract
Orchard is a creative clustering application developed in the Idea2Market project. The task of bringing many ideas into spacial-relation, called clustering, is part of a more extensive ideation process and is considered highly creative and beneficial to humans in developing ideas. Hence, taking away this task with an automated cluster generation might harm the ideation process. Still, manually going through a stack of hundreds of ideas can be mundane. This thesis implements a recommendation feature that supports users in clustering many ideas to synthesize and evolve them into more advanced and promising ideas. The creative task of clustering remains in the user's hand. However, through interaction they can control which ideas are explored next when building their representation of ideas by clustering them. This is done by repeatedly specifying a target for which the recommendation feature provides similar ideas.
For the similarity measurements, to recommend similar ideas, the recommendation feature applies the information of knowledge graphs (KGs) that describe resources and encode relations and facts of concepts. This work includes experiments on the performance of five variants of concept similarity methods and one idea similarity method using the Wikidata KG to ensure the accuracy of the used similarity measures. The similarity method path uses the path-length between concepts of the KG, the methods res, lin, jcn differently apply a graph-based Information Content measurement and wpath combines the two.
The evaluation points out the potential of Wikidata as a knowledge source for semantic similarity. The semantic similarity approach proved its suitability by a high correlation to human perceptions of word similarity for five well-studied datasets, namely R&G, M&C, WS353, WS353-Sim, and SimLex. wpath performed best in three out of five datasets and thus was applied in the recommendation feature. The idea similarity method is a variant of the Word Mover's Distance and proved its accuracy in further experiments.
A Think-Aloud user study with five participants conducted for this thesis shows that the recommendation feature achieves a targeted and more efficient iteration through the ideas for the clustering tool Orchard. With the novel feature, the participants reported they were able to explore the ideas for clusters of their current interest, which enabled an in-depth iteration on various topics. These observations could indicate an improvement in the idea synthesis, which could be looked at in further research.
en
dc.description.abstract
Orchard ist eine Clustering Applikation, die im Rahmen des Idea2Market-Projekts entwickelt wurde. Die Aufgabe, viele Ideen in einen räumlichen Zusammenhang zu bringen, das sogenannte Clustering, ist Teil eines umfassenderen Ideenfindungsprozesses und erfordert Kreativität und hilf bei der Weiterentwicklung von Ideen. Daher könnte es dem Ideenfindungsprozess schaden, wenn diese Aufgabe durch eine automatisierte Cluster-Generierung wegfällt. Dennoch kann es banal sein, manuell durch einen Stapel von Hunderten von Ideen zu gehen. Diese Arbeit implementiert ein Empfehlungsfeature, das die User*in beim Clustern vieler Ideen unterstützt, um diese zu synthetisieren und zu fortgeschritteneren und vielversprechenderen Ideen weiterzuentwickeln. Die kreative Aufgabe des Clusterings bleibt in der Hand der User*in. Durch Interaktion kann sie jedoch steuern, welche Ideen als nächstes untersucht werden, während sie ihre räumliche Darstellung der Ideen durch Clustering aufbaut. Dies geschieht durch wiederholtes Auswählen einer Idee oder eines Wortes, für das das Empfehlungsfeature ähnliche Ideen liefert.
Für die Ähnlichkeitsmessungen, um ähnliche Ideen zu empfehlen, wendet das Empfehlungsfeature die Informationen von Knowledge Graphs (KGs) an, die Ressourcen beschreiben und Beziehungen und Fakten von Konzepten kodieren. Diese Arbeit umfasst Experimente zu fünf Konzeptähnlichkeitsmethoden und einer Ideenähnlichkeitsmethode unter Verwendung des Wikidata KG, um die Genauigkeit der verwendeten Ähnlichkeitsmaße zu verifizieren.
Die Ähnlichkeitsmethode path verwendet die Pfadlänge zwischen den Konzepten im KG, die Methoden res, lin, jcn wenden auf unterschiedliche Art und Weise eine grafbasierte Messung des Information-Contents an und wpath kombiniert beide.
Die Evaluation zeigt das Potenzial von Wikidata als Wissensquelle für semantische Ähnlichkeit auf. Der semantische Ähnlichkeitsansatz bewies seine Eignung durch eine hohe Korrelation zur menschlichen Wahrnehmung von Wortähnlichkeit für fünf gut untersuchte Datensätze, R&G, M&C, WS353, WS353-Sim und SimLex. Die Methode wpath schnitt in drei von fünf Datensätzen am besten ab und wurde daher im Empfehlungsfeature angewandt. Die Ideenähnlichkeitsmethode ist eine Variante der Word Mover's Distance und bewies ihre Eignung in weiteren Experimenten.
Eine für diese Arbeit durchgeführte Think-Aloud-Userstudie mit fünf Teilnehmer*innen zeigt, dass das Empfehlungsfeature für das Clustering-Tool Orchard eine zielgerichtete und effizientere Iteration durch die Ideen ermöglicht. Die Teilnehmer*innen berichteten, dass sie mit dem neuartigen Feature gezielt Ideen für Cluster ihres aktuellen Interesses untersuchen konnten, was eine vertiefung zu verschiedenen Themen ermöglichte. Diese Beobachtungen könnten auf eine Verbesserung der Ideensynthese hindeuten, was in weiterer Forschung untersucht werden könnte.
de
dc.format.extent
v, 50 Seiten
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
semantic similarity
en
dc.subject
knowledge graph
en
dc.subject.ddc
000 Informatik, Informationswissenschaft, allgemeine Werke::000 Informatik, Wissen, Systeme::004 Datenverarbeitung; Informatik
dc.title
Semantic Similarity of Concepts for a Human-Centered Idea Recommendation Feature in the Clustering Application Orchard
dc.identifier.urn
urn:nbn:de:kobv:188-refubium-31751-3
dc.title.translated
Semantische Konzeptähnlichkeiten für ein Human-Centered Ideen-Empfehlungsfeature der Clustering Applikation Orchard
de
refubium.affiliation
Mathematik und Informatik
refubium.affiliation.other
Institut für Informatik / Arbeitsgruppe Human-Centered Computing
refubium.affiliation.other
Technische Universität Berlin / Quality and Usability Lab
refubium.resourceType.isindependentpub
yes
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access