Lucene Analyzer

Identificativo: org.eclipse.help.luceneAnalyzer

Descrizione: questo punto di estensione è utilizzato per registrare gli analizzatori di testo utilizzati dalla guida per indicizzare e ricercare la documentazione.

La guida sfrutta la funzionalità del motore di ricerca Lucene, che consente di indicizzare flussi di token (flussi di parole). Gli analizzatori creano token dal flusso di caratteri. Esaminano il contenuto del testo e forniscono token da utilizzare con l'indice. I token possono essere creati dal flusso di testo in molti modi univoci. Un analizzatore elementare può creare token dai flussi in presenza di uno spazio, un altro può eseguire il filtro dei token in base alle esigenze dell'applicazione. Poiché la maggioranza della documentazione è costituita di testo leggibile, gli analizzatori utilizzati dal sistema della guida devono creare token che riconoscono la lingua e la grammatica ed eseguire la normalizzazione del testo indicizzato. In alcune lingue la qualità della ricerca aumenta in maniera considerevole se sul testo indicizzato viene eseguita l'analisi dell'origine e la rimozione delle parole non significative.

L'analyzer fornito in questo punto di estensione sostituirà quello fornito dal sistema della guida Eclipse per una determinata locale.

Tag di configurazione:

   <!ELEMENT extension (analyzer*)>

   <!ATTLIST extension
     point CDATA #REQUIRED
     id    CDATA #IMPLIED
     name  CDATA #IMPLIED
   >

   <!ELEMENT analyzer EMPTY>

   <!ATTLIST analyzer
     locale CDATA #REQUIRED
     class  CDATA #REQUIRED
   >

Esempi: di seguito è riportato un esempio di configurazione di Lucene Analyzer:

 <extension id="com.xyx.XYZ" point="org.eclipse.help.luceneAnalyzer">
  <analyzer locale="ll_CC" class="com.xyz.ll_CCAnalyzer"/>
 </extension>

Informazioni API: il valore dell'attributo locale deve essere una stringa di 5 o 2 caratteri. Se un analizzatore viene configurato per una lingua mediante una designazione linguistica di due lettere, l'analizzatore verrà utilizzato per tutte le impostazioni locali di questa lingua. Se l'analizzatore è configurato per un'impostazione internazionale di cinque caratteri, sarà utilizzato alternativamente.

Il valore dell'attributo class deve rappresentare una classe che rappresenta un'estensione di org.apache.lucene.analysis.Analyzer. Per le lingue in cui è possibile aumentare il numero delle corrispondenze scegliendo come opzione di ricerca la distinzione tra maiuscolo/minuscolo, si consiglia di impostare il filtro in caratteri minuscoli.

Implementazione fornita: il sistema della guida Eclipse fornisce funzioni di analisi per tutte le lingue. Gli analizzatori di inglese e tedesco eseguono il filtro di parole non significative, il filtro di caratteri minuscoli e l'analisi dell'origine. Per tutte le altre lingue, gli analizzatori forniti eseguono solo il filtro dei caratteri minuscoli.

Copyright (c) 2000, 2003 IBM Corporation e altri.
Tutti i diritti riservati. Questo programma e il materiale di accompagnamento sono disponibili secondo i termini della Common Public License v1.0 che sono distribuiti con il prodotto, e disponibili all'indirizzo http://www.eclipse.org/legal/cpl-v10.html