Die Hilfefunktion nutzt das Leistungsspektrum der Suchmaschine "Lucene", die das Indexieren von Tokendatenströmen (Wortdatenströmen) zulässt. Analysefunktionen erstellen Token aus dem Zeichendatenstrom. Sie untersuchen den Textinhalt und stellen Token für die Verwendung mit dem Index zur Verfügung. Der Textdatenstrom kann auf vielen eindeutigen Wegen mit einem Token versehen werden. Eine ganz einfache Analysefunktion kann Datenströme an Leerzeichen mit einem Token versehen, wohingegen eine andere Analysefunktion Token gemäß den Anforderungen der Anwendung filtern kann. Da die Dokumentation zumeist in normalem Text vorliegt, ist es wünschenswert, dass Analysefunktionen, die durch die Hilfefunktion eingesetzt werden, bei der Tokenerstellung und Normalisierung von indexiertem Text Sprache und Grammatik beachten. Bei einigen Sprachen wird die Suchqualität erheblich verbessert, wenn Stoppwörter aus dem indexierten Text entfernt und eine Wortstammanalyse ausgeführt werden.
Die an diesem Erweiterungspunkt ergänzte Analysefunktion überschreibt die Funktion, die von der Eclipse-Hilfefunktion für eine bestimmte Ländereinstellung bereitgestellt wird.
<!ELEMENT extension (analyzer*)>
<!ATTLIST extension
point CDATA #REQUIRED
id CDATA #IMPLIED
name CDATA #IMPLIED>
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale CDATA #REQUIRED
class CDATA #REQUIRED>
<extension id=
"com.xyx.XYZ"
point=
"org.eclipse.help.base.luceneAnalyzer"
>
<analyzer locale=
"ll_CC"
class=
"com.xyz.ll_CCAnalyzer"
/>
</extension>
Der Wert des Attributs class muss eine Klasse darstellen, die org.apache.lucene.analysis.Analyzer erweitert. Es empfiehlt sich, dass diese Analysefunktion eine Kleinschreibungsfilterung bei Sprachen durchführt, bei denen dies in Betracht kommt.
Copyright (c) 2000, 2003 IBM Corporation und Andere.
Alle Rechte vorbehalten. Dieses Programm und sein Begleitmaterial werden gemäß den Bedingungen der "Eclipse Public License v1.0" zur Verfügung gestellt, die dieser Lieferung beiliegt und unter
http://www.eclipse.org/legal/epl-v10.html abgerufen werden kann.