Implementierung einer erweiterbaren Anwendung zur sprachübergreifenden Metadaten- und Volltextsuche in einer serviceorientierten Architektur

Front Cover
GRIN Verlag, Dec 15, 2008 - Computers - 109 pages
Masterarbeit aus dem Jahr 2006 im Fachbereich Informatik - Angewandte Informatik, Note: 1, Fachhochschule Bonn-Rhein-Sieg, 31 Quellen im Literaturverzeichnis, Sprache: Deutsch, Abstract: Durch die sich weiter verdichtende, weltweite Vernetzung entsteht das Bedürfnis, die sprachübergreifende Verständigung zwischen verschiedenen Ländern und Kulturen zu vereinfachen. Eine sprachtransparente Nutzung des Internets ist mangels ausgereifter maschineller Übersetzungssysteme noch nicht möglich. Das Cross-language Information Retrieval (CLIR) stellt einen Kompromiss dar: Der Anwender formuliert eine Suchanfrage in seiner Muttersprache und erhält als Ergebnis auch fremdsprachliche Trefferdokumente. Im Rahmen dieser Master Thesis wurde ein Protoyp eines Cross-language Retrieval System entwickelt, das die Sprachen Deutsch, Englisch und Japanisch unterstützt. Als Architektur kommt das Interlingual Retrieval zum Einsatz, bei dem sowohl die Dokumente als auch die Anfragen in eine gemeinsame Interlingua übersetzt werden, innerhalb derer die eigentliche Suche durchgeführt wird. Die für das System gewählte Interlingua ist konzeptbasiert und weist dadurch keine Mehrdeutigkeiten auf. Damit Dokumente mittels des richtigen Konzeptnamens indexiert werden, wird eine automatische Sprach- und Konzepterkennung durchgeführt, die auf Basis von Kontextwörtern das korrekte Konzept eines mehrdeutigen Wortes berechnet. Bei der Suchanfrage wird das richtige Konzept für einen mehrdeutigen Begriff durch Interaktion mit dem Benutzer festgelegt. Neben der konzeptbasierten Suche wird auch die Phrasensuche unterstützt. Alternativ zu dem Zugriff über eine Weboberfläche steht das System als Web Service zur Verfügung.
 

What people are saying - Write a review

We haven't found any reviews in the usual places.

Contents

I
5
II
10
III
22
IV
32
V
42
VI
60
VII
71
VIII
96
IX
100

Other editions - View all

Common terms and phrases

Abbildung Analyse Anfrage Anfragesprache Anfrageterme anhand Anschließend Apache Lucene automatisiert Bank bench Benutzer CLIR CLIR-Systems CLRS cngram conceptAnalyzers concepts.db Cosinus-Maß Cross-language Retrieval dargestellt Datei Dateinamen definiert description Dienst Dienstnutzer Dokumentvektor Eclipse Eingabe Einsatz Eintrag enthält Entwurf erstellt erzeugt Feld FINANZINSTITUT folgenden Formular gesucht Gewähltes Konzept Highlighter Implementierung Index gespeichert Indexierung Indexterme Information Retrieval Interlingua Interlingua-Wörterbücher Internet IR-Systemen Japanisch JavaBeans Klasse Komponenten Kontextwörter kontrolliertes Vokabular konzeptbasierten Konzepterkennung Konzeptnamen Konzeptvektor korrekte Konzept Language Lucene maschinellen Ubersetzung mehrdeutigen Wörtern Metadaten Methode Mögliche Konzepte n-Gramme notwendig Nutzung Ontologie Operation ORT_IN_DER_NATUR Paket Parameter park Phase Phrase Phrasensuche Query relevanten Wörter SEARCH serviceorientierten Architektur Services SITZGELEGENHEIT SOAP soll sowie Sprache des Dokuments Sprachprofil sprachübergreifende Suche Standard Standardindex Standardsuche Stoppwörter Stoppwortliste String Suchanfragen Suchbegriffe Suchergebnisse Suchmaschine Suchterme System Systems Term Text Textauszügen Thesaurus Token TokenStream Trefferdokumente Ubersetzung Unicode Vektoren Vektorraummodell Verarbeitung verwendet Volltextindex Volltextindexierung Volltextsuche Web Services Weboberfläche Webseite WordNet Wörterbuch Wörterbucheinträge WSDL zunächst

Bibliographic information