Le système d'aide a recours à des capacités du moteur de recherche Lucene, ce qui permet d'indexer des flux de sèmes (mots). Les analyseurs créent des sèmes pour à partir du flux de caractères. Ils analysent le contenu et fournissent des jetons à utiliser avec l'index. Il est possible de segmenter le flux de texte en plusieurs sèmes. Un analyseur simple peut segmenter des flux où il y a des espaces, un autre peut filtrer les sèmes en fonction des besoins de l'application. La documentation étant conçue pour être lue, les analyseurs utilisés par le système d'aide doivent effectuer une segmentation linguistique et grammaticale du texte indexé. Pour certaines langues, la qualité de la recherche augmente de façon notable dans le cas de la suppression de mots types et de lemmisation.
L'analyseur de ce point d'extension remplace celui du système d'aide Eclipse d'un environnement local donné.
<!ELEMENT extension (analyzer*)>
<!ATTLIST extension
point CDATA #REQUIRED
id CDATA #IMPLIED
name CDATA #IMPLIED>
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale CDATA #REQUIRED
class CDATA #REQUIRED>
<extension id=
"com.xyx.XYZ"
point=
"org.eclipse.help.base.luceneAnalyzer"
>
<analyzer locale=
"ll_CC"
class=
"com.xyz.ll_CCAnalyzer"
/>
</extension>
La valeur de l'attribut class doit désigner une classe qui étend org.apache.lucene.analysis.Analyzer. Il est préférable que cet analyseur effectue un tri en minuscules pour les langues dont les résultats de recherche peuvent être améliorés en ne différenciant pas les majuscules des minuscules.
Copyright (c) 2000, 2003 IBM Corporation and others.
All rights reserved. Ce programme et les produits associés sont
distribués sous licence publique Eclipse v1.0 et disponibles à
l'adresse suivante :
http://www.eclipse.org/legal/epl-v10.html