Nachgeholter Bericht von der ACL-Konferenz:
Counstantinos Boulis (Vortragender) und
Mari Ostendorf von der
University of Washington:
"A Quantitative Analysis of Lexical Differences Between Genders in Telephone Conversations".
In dieser Präsentation ging es um eine Fragestellung aus der Soziolinguistik, das ist ein Teilgebiet der Linguistik, das sich mit Unterschieden in der Sprache einzelner sozialer Gruppen, Schichten, Minderheiten oder eben auch zwischen den Geschlechtern beschäftigt. Hier war die Frage: Verwenden Männer und Frauen unterschiedliche Wörter?
Lexikalische Unterschiede zwischen den Geschlechtern in Konversationen sind bislang nur wenig untersucht worden. Eine Pilotstudie gibt es von
Sameer Singh (2001), eine Untersuchung zu sprachlichen Unterschieden in der Schriftsprache sowohl in Sachtexten als auch in fiktionalen Texten von
Koppel et. al. (2002).
Bei Konversationen kommt zudem noch eine eventuelle Interaktion mit dem Geschlecht des Gesprächspartners dazu, also: Passen wir unsere Sprache dem Geschlecht des Gesprächspartners an?
Boulis und Osterndort verschiedene maschinelle Lernverfahren mit einem umfangreichen Korpus von transkribierten Telefongespraechen trainiert. Die Gesprächspartner in diesen Telefongesprächen kannten sich vorher jeweils nicht.
Die Ergebnisse waren deutlich. In etwa 90% der Testfälle war des den so trainierten Textklassifizierern möglich, anhand einer Transkription einer Seite einer Konversation das Geschlecht der Person zu bestimmen. Support Vector Machines (SVM) stellten sich dabei als das am besten geeignete Verfahren heraus. Ausserdem ist die Erkennungsrate etwas besser, wenn man die Klassifizierer mit Paaren aufeinanderfolgender Wörter trainert, die Unterschiede zwischen Männern und Frauen liegen also nicht allein im Lexikon.
Es zeigt sich ausserdem, dass Personen ihre Sprache an das Geschlecht ihres Gespraechspartners anpassen. So sind die Klassifizierer einerseits weniger zuverlässig, wenn es darum geht, das Geschlecht eines Gesprächspartners in einer gemischtgeschlechtlichen Konversation zu bestimmen, andererseits ist es aber (mit ca. 60%iger Wahrscheinlichkeit) möglich allein anhand der Transkription und des Geschlechts von Sprecher A das Geschlecht von Sprecher B zu abstimmen.
Zum Abschluss noch die Frage, ob welche Wörter nun die stärksten Indikatoren für das Geschlecht des Sprechers sind. Hier trifft die Realität das Klischee: Unter den stärksten Indikatoren für weibliche Sprecher sind Wörter für familiäre Beziehungen (Kinder, Enkel, Großenkel), unter den besten Indikatoren für männliche Sprecher Schimpfwörter. Das gilt besonders stark für Konversationen, bei die Partner beide weiblich bzw. beide männlich sind.
Kommentare
Mo, 05.04.2010 11:17
Naja... Irgendwie bin ich n icht überrascht dass Microsoft Research rausbekommt dass IT- Sicherheit eigentlich to [...]
Mo, 29.03.2010 22:47
Eigentlich nicht. Ausser dass die ganzen me-too-Trackbacks inzwischen auf Twitter stattfi nden (ausser hier). Da [...]
Mo, 29.03.2010 09:06
hat sich deine meinung zu trac kbacks geändert in letzter zei t?
Mi, 21.01.2009 22:33
Aber es hätte auch sein Gutes: Eine Plattform weniger für e klige Linkspammer.
Mi, 21.01.2009 15:39
Ja manchmal hat man im Leben e infach so viele Sachen, denen man sich widmen möchte oder au ch muss, dass da gewisse [...]
Mo, 10.11.2008 14:17
Ich leihe mir ungern eine Fahr rad fahre lieber nur mein eige nes. Hatte mal ein negatives E rlebenis mit einen Leihr [...]
Fr, 25.07.2008 01:50
Schaust Du Wikipedia. «The first version of SQL was devel oped at IBM by Donald D. Chamb erlin and Raymond F. Boy [...]