Analizador Lucene

Identificador: org.eclipse.help.luceneAnalyzer

Descripción: este punto de extensión permite registrar analizadores de texto para que los utilice el sistema de ayuda al indexar la documentación y hacer búsquedas en ella.

La ayuda explota las posibilidades del motor de búsqueda Lucene, que permite la indexación de corrientes de símbolos (corrientes de palabras). Los analizadores crean símbolos a partir de la corriente de caracteres. Examinan el contenido del texto y suministran símbolos para utilizarlos con el índice. Existen numerosas maneras exclusivas de convertir en símbolos la corriente de texto. En función de las necesidades de la aplicación, un analizador trivial puede, por ejemplo, simbolizar las corrientes en espacios en blanco, mientras que otro puede realizar el filtro de símbolos. Dado que la documentación consiste principalmente en texto legible por personas, es aconsejable que los analizadores utilizados por el sistema de ayuda realicen una simbolización que detecte el idioma y la gramática y la normalización del texto indexado. En algunos idiomas, la calidad de la búsqueda mejora significativamente si se realizan la eliminación de palabras de relleno y la indicación de temas relacionados en el texto indexado.

El analizador suministrado a este punto de extensión alterará temporalmente el que suministra el sistema de ayuda de Eclipse para un entorno local determinado.

Códigos XML de configuración:

   <!ELEMENT extension (analyzer*)>

   <!ATTLIST extension
     point CDATA #REQUIRED
     id    CDATA #IMPLIED
     name  CDATA #IMPLIED
   >

   <!ELEMENT analyzer EMPTY>

   <!ATTLIST analyzer
     locale CDATA #REQUIRED
      class  CDATA #REQUIRED
   >

Ejemplos: a continuación figura un ejemplo de configuración del analizador de Lucene:

 <extension id="com.xyx.XYZ" point="org.eclipse.help.luceneAnalyzer">
  <analyzer locale="ll_CC" class="com.xyz.ll_CCAnalyzer"/>
 </extension>

Información sobre las API: el valor del atributo locale debe representar una serie de entorno local de cinco o de dos caracteres. Si el analizador se ha configurado para un idioma especificando la designación de idioma de dos letras, el analizador se utilizará para todos los entornos locales de ese idioma. Si el analizador se ha configurado para que coincida con un entorno local de cinco caracteres, este es el que se utilizará, en vez del otro.

El valor del atributo class debe representar una clase que amplíe org.apache.lucene.analysis.Analyzer. Es aconsejable que este analizador realice el filtrado de minúsculas para aquellos idiomas en los que es posible aumentar el número de aciertos de búsqueda haciendo que la búsqueda detecte las mayúsculas/minúsculas.

Implementación suministrada: el sistema de ayuda de Eclipse proporciona analizadores para todos los idiomas. Para los idiomas inglés y alemán, los analizadores realizan el filtrado de palabras de relleno, el filtrado de minúsculas y la indicación de temas relacionados. Para todos los demás idiomas, el analizador suministrado sólo realiza el filtrado de minúsculas.

Copyright (c) 2000, 2003 IBM Corporation y otros.
Reservados todos los derechos. Este programa y sus materiales adjuntos están disponibles bajo los términos de la licencia pública común (Common Public License) v1.0 que acompaña a esta distribución, y está disponible en http://www.eclipse.org/legal/cpl-v10.html