004 Datenverarbeitung; Informatik
Refine
Has Fulltext
- yes (17)
Is part of the Bibliography
- yes (17)
Year of publication
- 2011 (17) (remove)
Document Type
- Preprint (10)
- Doctoral Thesis (5)
- Journal article (2)
Keywords
- Quran (7)
- Koran (6)
- Text Mining (6)
- Bayesian classifier (3)
- Textvergleich (3)
- Base text (2)
- Content Management (2)
- Gothenburg model (2)
- Knowledge Management (2)
- Maschinelles Lernen (2)
- Meta-model (2)
- Text mining (2)
- Textual alterations weighting system (2)
- Textual document collation (2)
- Visualisierung (2)
- Wissensmanagement (2)
- 26S RDNA Data (1)
- Approximationsalgorithmus (1)
- Aufwandsanalyse (1)
- Automatisierte Prüfungskorrektur (1)
- Barcodes (1)
- Bayes-Klassifikator (1)
- Bit Parallelität (1)
- Bodenstation (1)
- Boolean Grammar (1)
- Boolesche Grammatik (1)
- Causes of revelation (1)
- Chapters arrangement (1)
- Chronology of revelation (1)
- Clustering (1)
- Colonial volvocales chlorophyta (1)
- Cost Analysis (1)
- DNA (1)
- Dasycladales chlorophyta (1)
- Dienstgüte (1)
- Distributed Space Systems (1)
- Drahtloses Sensorsystem (1)
- Drahtloses vermaschtes Netz (1)
- Educational Measurement (I2.399) (1)
- Energieeffizienz (1)
- Energy efficiency (1)
- Fairness (1)
- Frames (1)
- Gothenburg Modell (1)
- Gothenburg model of collation process (1)
- Ground Station Networks (1)
- IEEE 802.11 (1)
- IEEE 802.15.4 (1)
- Information Retrieval (1)
- Information Visualization (1)
- Information-Retrieval-System (1)
- Invertierte Liste (1)
- Kleinsatellit (1)
- Knowledge Modeling (1)
- Knowledge representation (1)
- Komplexitätstheorie (1)
- Konzeptsuche (1)
- Land plants (1)
- Lawhul-Mahfuz (1)
- Link rate adaptation (1)
- Linkratenanpassung (1)
- Mehrkriterielle Optimierung (1)
- Modellierung (1)
- Molecular systematics (1)
- Multiple-Choice Examination (1)
- Multiple-Choice Prüfungen (1)
- Naïve Bayesian (1)
- Network Management (1)
- Network Virtualization (1)
- Netzwerkmanagement (1)
- Netzwerkvirtualisierung (1)
- Nuclear RDNA (1)
- Optimierung (1)
- Place of revelation (1)
- Profile distances (1)
- QoE (1)
- QoS (1)
- Quality of Experience (1)
- Quality of Service (1)
- RBCL Gene-sequences (1)
- Reconstruction of original text (1)
- Scatter Plot (1)
- Scheduling (1)
- Secondary structure (1)
- Self-Evaluation Programs (I2.399.780) (1)
- Small Satellites (1)
- Softwarearchitektur (1)
- Stages of Prophet Mohammad’s messengership (1)
- Statistical classifiers (1)
- Suchverfahren (1)
- Support Vector Machine (1)
- Text categorization (1)
- Text segmentation (1)
- Theoretische Informatik (1)
- Travelling-salesman-Problem (1)
- Verteiltes System (1)
- Visual Text Mining (1)
- Visualization (1)
- Volltextsuche (1)
- Wissensrepräsentation (1)
- XML (1)
- XML model (1)
- bit-parallel (1)
- concept search (1)
- distance-based classifier (1)
- full-text search (1)
- interactive collation of textual variants (1)
- n-Gramm (1)
- n-gram (1)
- q-Gramm (1)
- q-gram (1)
- service based software architecture (1)
- service brokerage (1)
- text categorization (1)
Der große Vorteil eines q-Gramm Indexes liegt darin, dass es möglich ist beliebige Zeichenketten in einer Dokumentensammlung zu suchen. Ein Nachteil jedoch liegt darin, dass bei größer werdenden Datenmengen dieser Index dazu neigt, sehr groß zu werden, was mit einem deutlichem Leistungsabfall verbunden ist. In dieser Arbeit wird eine neuartige Technik vorgestellt, die die Leistung eines q-Gramm Indexes mithilfe zusätzlicher M-Matrizen für jedes q-Gramm und durch die Kombination mit einem invertierten Index erhöht. Eine M-Matrix ist eine Bit-Matrix, die Informationen über die Positionen eines q-Gramms enthält. Auch bei der Kombination von zwei oder mehreren Q-Grammen bieten diese M-Matrizen Informationen über die Positionen der Kombination. Dies kann verwendet werden, um die Komplexität der Zusammenführung der q-Gramm Trefferlisten für eine gegebene Suchanfrage zu reduzieren und verbessert die Leistung des n-Gramm-invertierten Index. Die Kombination mit einem termbasierten invertierten Index beschleunigt die durchschnittliche Suchzeit zusätzlich und vereint die Vorteile beider Index-Formate. Redundante Informationen werden in dem q-Gramm Index reduziert und weitere Funktionalität hinzugefügt, wie z.B. die Bewertung von Treffern nach Relevanz, die Möglichkeit, nach Konzepten zu suchen oder Indexpartitionierungen nach Wichtigkeit der enthaltenen Terme zu erstellen.