ACL05 (28.6.): A Quantitative Analysis of Lexical Differences in Genders...

 |

flawed concepts

Suche

Archive

Februar 2012
Januar 2012
Dezember 2011
Das Neueste ...
Älteres ...

Kommentare

ixs zu Security Advice Is Wrong
Mo, 05.04.2010 11:17
Naja... Irgendwie bin ich n icht überrascht dass Microsoft Research rausbekommt dass IT- Sicherheit eigentlich to [...]


florian zu Die Interessantheit von Trackbacks
Mo, 29.03.2010 22:47
Eigentlich nicht. Ausser dass die ganzen me-too-Trackbacks inzwischen auf Twitter stattfi nden (ausser hier). Da [...]


Onlineproxy zu Die Interessantheit von Trackbacks
Mo, 29.03.2010 09:06
hat sich deine meinung zu trac kbacks geändert in letzter zei t?


florian zu Hallo 2009, tschüss Blog
Mi, 21.01.2009 22:33
Aber es hätte auch sein Gutes: Eine Plattform weniger für e klige Linkspammer.


Jan zu Hallo 2009, tschüss Blog
Mi, 21.01.2009 15:39
Ja manchmal hat man im Leben e infach so viele Sachen, denen man sich widmen möchte oder au ch muss, dass da gewisse [...]


Dirk zu Call A Bike
Mo, 10.11.2008 14:17
Ich leihe mir ungern eine Fahr rad fahre lieber nur mein eige nes. Hatte mal ein negatives E rlebenis mit einen Leihr [...]


Azundris zu
Fr, 25.07.2008 01:50
Schaust Du Wikipedia. «The first version of SQL was devel oped at IBM by Donald D. Chamb erlin and Raymond F. Boy [...]


Tags

acl05 auto bahn blogs cl clustering fun gemaule hardware java klassik krol linguistics metal musik ner new york city niagaracmt oboe php reisen remember twilight saxophon search semantics server sjbo solaris sun t1 uima

Kategorien

  • XML computing
  • XML english
  • XML german
  • XML life
  • XML meta
  • XML misc
  • XML music
  • XML studies


Alle Kategorien

Blog abonnieren

XML RSS 0.91 feed
XML RSS 1.0 feed
XML RSS 2.0 feed
ATOM/XML ATOM 0.3 feed
ATOM/XML ATOM 1.0 feed
XML RSS 2.0 Kommentare

Verwaltung des Blogs

Login

Powered by

Serendipity PHP Weblog

Dienstag, 28. Juni 2005

ACL05 (28.6.): A Quantitative Analysis of Lexical Differences in Genders...

Geschrieben von florian um 16:00
Nachgeholter Bericht von der ACL-Konferenz:
Counstantinos Boulis (Vortragender) und Mari Ostendorf von der University of Washington: "A Quantitative Analysis of Lexical Differences Between Genders in Telephone Conversations".
In dieser Präsentation ging es um eine Fragestellung aus der Soziolinguistik, das ist ein Teilgebiet der Linguistik, das sich mit Unterschieden in der Sprache einzelner sozialer Gruppen, Schichten, Minderheiten oder eben auch zwischen den Geschlechtern beschäftigt. Hier war die Frage: Verwenden Männer und Frauen unterschiedliche Wörter?
Lexikalische Unterschiede zwischen den Geschlechtern in Konversationen sind bislang nur wenig untersucht worden. Eine Pilotstudie gibt es von Sameer Singh (2001), eine Untersuchung zu sprachlichen Unterschieden in der Schriftsprache sowohl in Sachtexten als auch in fiktionalen Texten von Koppel et. al. (2002).
Bei Konversationen kommt zudem noch eine eventuelle Interaktion mit dem Geschlecht des Gesprächspartners dazu, also: Passen wir unsere Sprache dem Geschlecht des Gesprächspartners an?

Boulis und Osterndort verschiedene maschinelle Lernverfahren mit einem umfangreichen Korpus von transkribierten Telefongespraechen trainiert. Die Gesprächspartner in diesen Telefongesprächen kannten sich vorher jeweils nicht.

Die Ergebnisse waren deutlich. In etwa 90% der Testfälle war des den so trainierten Textklassifizierern möglich, anhand einer Transkription einer Seite einer Konversation das Geschlecht der Person zu bestimmen. Support Vector Machines (SVM) stellten sich dabei als das am besten geeignete Verfahren heraus. Ausserdem ist die Erkennungsrate etwas besser, wenn man die Klassifizierer mit Paaren aufeinanderfolgender Wörter trainert, die Unterschiede zwischen Männern und Frauen liegen also nicht allein im Lexikon.

Es zeigt sich ausserdem, dass Personen ihre Sprache an das Geschlecht ihres Gespraechspartners anpassen. So sind die Klassifizierer einerseits weniger zuverlässig, wenn es darum geht, das Geschlecht eines Gesprächspartners in einer gemischtgeschlechtlichen Konversation zu bestimmen, andererseits ist es aber (mit ca. 60%iger Wahrscheinlichkeit) möglich allein anhand der Transkription und des Geschlechts von Sprecher A das Geschlecht von Sprecher B zu abstimmen.

Zum Abschluss noch die Frage, ob welche Wörter nun die stärksten Indikatoren für das Geschlecht des Sprechers sind. Hier trifft die Realität das Klischee: Unter den stärksten Indikatoren für weibliche Sprecher sind Wörter für familiäre Beziehungen (Kinder, Enkel, Großenkel), unter den besten Indikatoren für männliche Sprecher Schimpfwörter. Das gilt besonders stark für Konversationen, bei die Partner beide weiblich bzw. beide männlich sind.
Kommentare (0) | Trackback (1)
Tags für diesen Artikel: acl05, cl
Artikel mit ähnlichen Themen:
Personality Mining
ACL05 (28.6.): Paraphrasing with Bilingual Parallel Corpora
ACL05 (27.6.) Using Emoticons [...] for Sentinent Classification
ACL05 (26.6.): Extracting Semantic Orientation using Spin Model
ACL05 (26.6.): Seeing Stars...
ACL05 (26.6.) Invited Talk: "Why you have a body and what it is used for"
Tags für diesen Artikel: acl05, cl
Artikel mit ähnlichen Themen:
Personality Mining
ACL05 (28.6.): Paraphrasing with Bilingual Parallel Corpora
ACL05 (27.6.) Using Emoticons [...] for Sentinent Classification
ACL05 (26.6.): Extracting Semantic Orientation using Spin Model
ACL05 (26.6.): Seeing Stars...

Trackbacks
Trackback für spezifische URI dieses Eintrags

Personality Mining
Martin Pyka schreibt über den Character-Reconstructor, eine fiktive Software, die anhand sprachlicher Eigenheiten in Texten wie Blogpostings ein Charakterprofil des Autors erstellt. Eine unheimliche Zukunftsvision, die ihre Wurzeln aber in ganz aktuelle
Weblog: flawed concepts
Aufgenommen: Jul 14, 01:46

Kommentare
Ansicht der Kommentare: (Linear | Verschachtelt)

Noch keine Kommentare

Kommentar schreiben

Umschließende Sterne heben ein Wort hervor (*wort*), per _wort_ kann ein Wort unterstrichen werden.
Standard-Text Smilies wie :-) und ;-) werden zu Bildern konvertiert.

Um maschinelle und automatische Übertragung von Spamkommentaren zu verhindern, bitte die Zeichenfolge im dargestellten Bild in der Eingabemaske eintragen. Nur wenn die Zeichenfolge richtig eingegeben wurde, kann der Kommentar angenommen werden. Bitte beachten Sie, dass Ihr Browser Cookies unterstützen muss um dieses Verfahren anzuwenden.
CAPTCHA

 
 
 
Powered by Serendipity | Template by Perun