Seite 1 von 1

Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 11:20
von Hexodus
Eine verrückte Idee: man nehme einen Klappentext+Titel und analysiert die Wortwahl, um das Genre zu erkennen. Der Hintergrund dazu ist der, dass ich gerne ein Script schreiben möchte, das in der Lage sein wird anhand des Klappentextes das Genre vorher zu sagen :ugeek:

Gibt es bestimmte Begriffe, die eine automatische Zuordnung zu einem Bestimmten Genre erlauben? Lasst uns mal kurz die Köpfe zusammen stecken.

Ich probiere das mal aus. Ein Buch ist einem bestimmten Genre zuzuordnen, wenn es ein oder mehrere der folgenden Schlagworte enthält (alles Einzahl).

FANTASY:
Drache, Schwert, Fantasy, Zwerg, Elf, Magie, Zauberspruch, Imperium, Krieger, Prophezeiung, Tolkien, Labyrinth, Kaiser, Legende, Ritter

SCIENCE FICTION:
Raumschiff, Weltall, Sterne, Schleuse, Raumanzug, Plasma, Laser, Dimension, Vakuum, Jedi, Klon, Parallelwelt, Laptop, Computer, Elektronen, Physik, Wissenschaft, Zukunft, Galaxis, Planet, Universum

HORROR:
Horror, Zombie, Gedärme, Schädel, Vampir, Dämon, Hölle, höllisch, Werwolf, Jenseits, Kannibalismus, Teufel, Engel, Seele, Dunkelheit, Dunkel, Dunkle Gruft, Fluch, Stephen King, verdammt, Verdammten, Monster, Wolf


Könnt ihr mir weitere Keywords liefern und vielleicht auch auf andere Genres ausweiten?

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 11:31
von Hexodus
Hier noch die Liste der Genres zur Übersicht, die wir ausgearbeitet haben.
FANTASY
high, low (sword & sorcery), urban, animal, dark, all age, humoristische, social, gaslight
SCIENCE FICTION
hard, soft, utopie, dystopie, steampunk, cyberpunk, alternativwelt, military, space opera, zeitreise, social
HORROR
grussel, splatter/gore, gothic/schauerroman, paranormal, satanic, torture
ROMANCE
urban, dark, fantasy, sf, paranormal

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 12:01
von harakiri
da muss ich mal länger drüber nachdenken :geek:

zu Horror vielleicht mal: spritzendes Blut, Axt, Schreie

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 13:31
von Lanara
Fantasy:

Hexen, Hexer, Zauberei, Magie

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 15:03
von Shining
daa daa daa daada daaaa daada daaaa daaaa.... also Imperium definitiv zu SF.

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 15:35
von Nazena
In Bezug auf Horror nicht einfach. Sehr viele Engel/ Seele etc. Bücher sind nämlich Romantic Fantasy und ganz klar kein Horror (wobei funkelnde Vampire ein ganz eigener Horror für sich sind...).
In Anbetracht des Buchmarktes sollte man vielleicht noch eine Sparte namens "Romantic Fiktion/ Romantasy" oder ähnlich einführen, egal ob Nackenbeißer, SF oder Fantasy. Dort ist nämlich die Romanze das Hauptgenre und Vampire, Werwölfe und Konsorten (wie neuerdings auch Aliens) eher schmückendes Beiwerk.

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 18:44
von Mystera
Fantasy: Sage, Mähr, Legende, Mythos, Kult, Ritus, Verwandlung, Bann
Horror: Mörder, Unheimlich, beängstigend, Tod, Panik, Geist, Phantom

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Fr 19. Okt 2012, 21:41
von Shining
wieso gehst Du das nicht von der anderen Seite an? Parse den ganzen Klappentext nach Wörtern, die länger als sagen wir 3 oder 4 Buchstaben sind (oder Wörter, die mit Großbuchstaben beginnen oder auf lich und end enden) und entscheide die ersten 100 Klappentexte (gut gemischt durch alle Genres) selbst. Anschliessend hast Du eine Wortgrundlage für jedes Genre, mit der Du das Programm entscheiden lassen kannst. Du greifst dann nur noch ein, wenn das Genre korrigiert werden muss... wobei das Programm die Grundlage immer mehr erweitert und zudem ab einer gewissen Korrekturrate Wörter selbständig einem anderen Genre zuordnet.


... und dann lernt es mit geometrischer Geschwindigkeit, entwickelt ein eigenes Bewusstsein, nennt sich Skynet und baut komische Roboter, die wie Arnold aussehen.

Shining
Cyberdyne Systems

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Sa 20. Okt 2012, 14:53
von Hexodus
Shining hat geschrieben: ... und dann lernt es mit geometrischer Geschwindigkeit, entwickelt ein eigenes Bewusstsein, nennt sich Skynet und baut komische Roboter, die wie Arnold aussehen.
Shining
Cyberdyne Systems
Genau wegen diesem Teil wollte ich das vermeiden :| Ich mache das tatsächlich in etwa so, wie Du das vorgeschlagen hast, nur abgewandelt. Ich schaue mir Klappentexte an
und versuche die vorhandenen Keywords heraus zu finden, die mich zu einer Genrezuordnung bewegen würden. Diese wandern in eine Tabelle und bekommen je nach Eindeutigkeit einen Wert zwichen 0.1 bis 1.0 zugeordnet. Habe ich genug Keywords zusammen, kann ich die Wertigkeit der Einzelnen Keywords pro Genre ermitteln und miteinander vergleichen. Sicherlich kommen dabei ebenfalls Mischergebnisse heraus z.B. 60%Fantasy zu 40% Romance = Romantasy. Ob das so eindeutig sein wird, werde ich im Test ermitteln müssen.

Re: Das Experiment: Genres an der Wortwahl erkennen

Verfasst: Sa 20. Okt 2012, 19:50
von Shining
ahh... interessant. Wieso so kompliziert und nicht einfach zählen wie oft ein Wort in einem Genre vorkommt? Die Gewichtung für die Genres würde dann doch automatisch ermittelt werden. Natürlich dürfte man nicht alle Wörter nehmen, da das System sonst irgendwann nicht mehr performant arbeiten kann - wieviele Wörter hat die deutsche Sprache? - , aber dafür kann man ja ein Filter vorschalten, der nur Nomen, Adjektive, Adverben etc. durchlässt. Der Vorteil liegt meines Erachtens darin, dass Du Dir wegen Keywörtern gar keine Gedanken machen musst, die enstehen beim Verarbeiten der Klappentexte von allein.