Methoden der Human-Robot-Interaction (HRI)
von Tobias Senger

1. Einleitung
Die Mensch-Roboter-Interaktion (Human-Robot-Interaction; HRI) ist ein dynamisches Forschungsfeld, das verschiedene Disziplinen wie Robotik, Psychologie, Soziologie und Ethologie miteinander verbindet. Die Vielfalt der Methoden zur Evaluation von HRI verdeutlicht sowohl die Komplexität dieses Bereichs als auch die Notwendigkeit einer Standardisierung (Bethel et al., 2009).
2. Überblick über die Methoden der HRI-Evaluation
Zur Evaluation der HRI werden primär fünf Methoden eingesetzt: Selbstbewertungen, Verhaltensbeobachtungen, psychophysiologische Messungen, Interviews und Aufgabenleistungs-Metriken (Bethel et al., 2020). Jede dieser Methoden bietet spezifische Vor- und Nachteile.
Selbstbewertungen
Selbstbewertungen, eine häufig verwendete Methode in HRI-Studien, umfassen Fragebögen, psychometrische Skalen und Umfragen, bei denen die Teilnehmer ihre Gefühle und Motivationen im Zusammenhang mit der Roboter-Interaktion einschätzen (Bethel et al., 2020). Ein kritischer Punkt bei Selbstbewertungen ist die Subjektivität und die Möglichkeit einer Verzerrung durch Antwortverhalten das sozial erwünscht ist. Ein Beispiel für den Einsatz von Selbstbewertungen zeigt die Studie von Dautenhahn und Kollegen (2006), die unstrukturierte Interviews und Videoaufnahmen kombiniert, um die Interaktionen der Teilnehmer mit Robotern zu analysieren. Die Studie zeigt, wie Selbstbewertungen durch zusätzliche Methoden ergänzt werden können, um die Validität der Ergebnisse zu erhöhen.
Verhaltensbeobachtungen
Verhaltensbeobachtungen sind eine wichtige Methode zur Evaluation von HRI. Sie ermöglichen es, das tatsächliche Verhalten der Teilnehmer während der Interaktion mit Robotern zu beobachten und zu kodieren (Bethel, 2009). Diese Methode ist objektiv, ist jedoch oft durch den Aufwand für Kodierungs- und Analysetechniken eingeschränkt. Die Studie von Moshkina und Arkin (2005) kombinierte Verhaltensbeobachtungen mit Selbstbewertungen. Trotz einer kleinen Stichprobengröße konnten durch diese Methodenkombination detaillierte Erkenntnisse gewonnen werden.
Psycho-physiologische Messungen
Psycho-physiologische Messungen erfassen körperliche Reaktionen wie Herzfrequenz, Hautleitfähigkeit und Atemfrequenz, um das Erregungsniveau der Teilnehmer zu bestimmen (Bethel et al. 2020). Diese objektiven Daten sind nicht durch subjektive Verzerrungen beeinflusst, haben jedoch die Schwierigkeit, spezifische Emotionen zu identifizieren. Kulić und Croft (2007) führten eine Studie durch, in der sie mehrere psychophysiologische Reaktionen erfassten. Ihre Studie zeigt die Bedeutung der Nutzung mehrerer Messmethoden zur Validierung der Ergebnisse.
Interviews
Interviews, sowohl strukturiert als auch unstrukturiert, erfassen tiefere Einsichten und subjektive Erfahrungen der Teilnehmer. Sie bieten die Möglichkeit, detaillierte qualitative Daten zu sammeln, die oft schwer quantifizierbar sind. Es wird eine sorgfältige Planung und Durchführung empfohlen, um zuverlässige und valide Daten zu erhalten (Bethel et al., 2020). Die Durchführung halbstrukturierter Interviews bieten die Möglichkeit, die Vorteile von strukturierten und unstrukturierten Interviews zu verbinden.
Aufgabenleistungsmetriken
Aufgabenleistungsmetriken messen die Effektivität und Effizienz der Interaktion von Versuchspersonen mit Robotern. Diese Metriken können objektive Daten über die Leistung und das Verhalten der Teilnehmenden liefern, sind jedoch oft auf spezifische Aufgaben beschränkt. Mutlu und Kollegen (2006) verwendeten Aufgabenleistungsmetriken in ihrer Studie, um die Interaktionen der Teilnehmer mit Robotern zu bewerten. Ihre Ergebnisse unterstreichen die Notwendigkeit größerer Stichprobengrößen, um signifikante Ergebnisse zu erzielen.
3. Diskussion der Standardisierung
Die Standardisierung von Evaluationsmethoden in HRI bleibt eine Herausforderung. So wird argumentiert, dass eine Kombination aus verschiedenen Methoden (Triangulation) notwendig sei, um valide und zuverlässige Ergebnisse zu erzielen (Bethel et al., 2009). Diese Sichtweise wird durch die Studien unterstützt, die mehrere Methoden zur Evaluation von HRI verwendeten (Dautenhahn et al., 2009). Es werden größere Stichproben und die Durchführung von Langzeitstudien empfohlen, um die Auswirkungen von Robotern auf den Menschen besser zu verstehen (Baxter et al., 2016). Die Standardisierung der Methoden erhöht dabei nicht nur die Vergleichbarkeit der Studien, sondern verbessert auch die Reproduzierbarkeit der Ergebnisse.
4. Schlussfolgerung
Die Evaluationsmethoden der Mensch-Roboter-Interaktion sind vielfältig und komplex. Die Kombination mehrerer Evaluationsmethoden, die Berücksichtigung angemessener Stichprobengrößen und die Durchführung von Langzeitstudien sind wichtige Elemente, um die Validität und Reliabilität der Forschungsergebnisse zu erhöhen. Die fortgesetzte interdisziplinäre Zusammenarbeit und die Entwicklung standardisierter Verfahren werden entscheidend sein, um die Herausforderungen der HRI-Evaluation zu bewältigen und die Integration von Robotern in das tägliche Leben zu unterstützen.
Quellen:
Bethel, C.L., Murphy, R.R. (2009). Use of large sample sizes and multiple evaluation methods in human-robot interaction experimentation. In: 2009 AAAI Spring Symposium Series, Experimental Design for Real-World Systems.
https://cdn.aaai.org/Symposia/Spring/2009/SS-09-03/SS09-03-002.pdf
Dautenhahn, K., Walters, M., Woods, S., Koay, K.L., Nehaniv, C.L., Sisbot, A., Alami, R.,
Siméon, T. (2006). How may I serve you? A robot companion approaching a seated person in a helping context. In: 1st ACM SIGCHI/SIGART Conference on Human-Robot Interaction, pp. 172–179. ACM Press. https://doi.org/10.1145/1121241.1121272
Jost, C., Pévédic, B. L., Belpaeme, T., Bethel, C., Chrysostomou, D., Crook, N., Grandgeorge, M., & Mirnig, N. (2020). Human-Robot interaction: Evaluation Methods and Their Standardization. Springer. https://doi.org/10.1007/978-3-030-42307-0
Kulić, D., & Croft, E. (2007). Physiological and subjective responses to articulated robot motion. Robotica, 25(1), 13–27. doi:10.1017/S0263574706002955
Moshkina, L., Arkin, R.C. (2005). Human perspective on affective robotic behavior: a longitudinal study. In: IEEE/RSJ International Conference on Intelligent Robots and Systems, pp. 2443–2450. https://doi.org/10.1109/IROS.2005.1545343
Mutlu, B., Osman, S., Forlizzi, J., Hodgins, J.K., Kiesler, S. (2006). Task structure and user attributes as elements of human-robot interaction design. In: 15th IEEE International Workshop on Robot and Human Interactive Communication (RO-MAN 2006). IEEE. https://doi.org/10.1109/ROMAN.2006.314397