29 März 2009
Zusammenfassen von Texten
Jeder kennt das Problem. Man hat nur eine kurze Zeit zur Verfügung und muss aber einen langen Text in dieser Zeit lesen. Dazu gibt es eigene Lesetechniken die erlernt werden können (zB: Querlesen) und auch Software Programme die versuchen das Wichtigste aus einem Dokument herauszufinden. Jedoch ist mir keines bekannt dass dieses Problem auch nur annähernd gut löst, und wenn, dann nur in einer Sprache gut. Als Beispiel dazu möchte ich hier kurz das Programm "Zusammenfassung" auf allen Mac OSX Rechnern erwähnen dass sich im Dienste Programm Menü in jedem Programm finden lässt, sobald ein Textstück markiert ist. Darin wird nach Einstellung eins Granularitäts-Sliders nach Sätzen oder Absätzen zusammengefasst. Eine Idee dazu die ich vor langer Zeit hatte, wie man das mit beliebigen Texten in beliebigen Sprachen machen kann, wäre Google Suche dazu zu verwenden. Das Zusammenfassungsprogramm zerlegt das Textstück in Wortteile oder Sätze, und schickt die alle nach Google. Zurück kommt ein Haufen an Suchergebnissen, die oft vorkommen, wenig vorkommen, gar nicht vorkommen, nur in Zusammenhang mit anderen Begriffen vorkommen, und so weiter. Mit dieser Information der Häufigkeit und Rankingrelevanz kann man proportional (oder verkehrt proportional) schon eine gute Aussage treffen ob diese Sätze für Menschen wichtig sind weil oft aufgetaucht oder neu weil nicht erwähnt, unrelevant weil oft erwähnt, oder interessant weil mit vielen Emotions-Wörtern in Verbindung gefunden. Natürlich muss man sich in einer genauen Umsetzung wirklich noch mehr Gedanken machen, die Sprache erkennen und dazu passende Wortlisten abgleichen, die Wortfrequenz berücksichtigen... aber diese Methode bringt eine riesen Menge an zusätzlicher Information über den Inhalt des Textes im Zusammenhang mit Texten von Millionen anderer Menschen.
Labels:
Forschungsfrage,
Google,
Idee,
Text,
Übersetzung,
Zusammenfassen
Abonnieren
Kommentare zum Post (Atom)
Keine Kommentare:
Kommentar veröffentlichen