ヘルプは、Lucene 検索エンジンの機能を活用し、トークン・ストリーム (ワードのストリーム) の索引付けを行うことができます。 アナライザーは、文字ストリームからトークンを作成します。アナライザーはテキストの内容を検査し、索引に使用するトークンを提供します。 テキスト・ストリームは、多くの固有の方法でトークン化することができます。普通のアナライザーではストリームを空白文字でトークン化できますが、 別のアナライザーではアプリケーションの必要性に基づいて、トークンのフィルタリングを実行できます。 文書の大部分は人間が判読可能なテキストであるため、ヘルプ・システムが使用するアナライザーには、 言語と文法を認識したトークン化、および索引付きテキストの正規化を実行することが望まれます。 言語によっては、索引付きテキストで停止ワードの除去とステミングを実行すると、 検索の質が非常に向上するものもあります。
この拡張ポイントに提供されるアナライザーは、Eclipse ヘルプ・システムが指定されたロケールに提供するアナライザーをオーバーライドします。
<!ELEMENT extension (analyzer*)>
<!ATTLIST extension
point CDATA #REQUIRED
id CDATA #IMPLIED
name CDATA #IMPLIED>
<!ELEMENT analyzer EMPTY>
<!ATTLIST analyzer
locale CDATA #REQUIRED
class CDATA #REQUIRED>
<extension id=
"com.xyx.XYZ"
point=
"org.eclipse.help.base.luceneAnalyzer"
>
<analyzer locale=
"ll_CC"
class=
"com.xyz.ll_CCAnalyzer"
/>
</extension>
class 属性の値は、org.apache.lucene.analysis.Analyzer を拡張するクラスを表す必要があります。 大/小文字を区別して検索を行うと検索ヒット・カウントを増加させることはできますが、このアナライザーに 小文字フィルターを実行させることを推奨します。
Copyright (c) 2000, 2003 IBM Corporation and others.
All rights reserved.
This program and the accompanying materials are made
available under the terms of the Eclipse Public License v1.0 which
accompanies this distribution, and is available at
http://www.eclipse.org/legal/epl-v10.html