Lucene 分析器

識別碼:org.eclipse.help.luceneAnalyzer

說明:這個延伸點用來登錄在索引和搜尋文件時,說明所使用的文字分析器。

說明會利用 Lucene 搜尋引擎的功能,容許製作記號串流(字組串流)的索引。 分析器從字元串流建立記號。它們查驗文字內容並提供記號供索引使用。 文字串流可使用許多獨特的方法來作記號。普通的分析器可以在空白空格處作記號,不同的分析器能夠依據應用程式所需過濾記號。 既然文件大多是可讀的文字,說明系統使用的分析器應可用來對索引文字執行察覺語言與文法的記號化和正常化。 對某些語言而言,如果在索引文字上執行停止字組移除和去除,搜尋品質將明顯的增加。

提供給這個延伸點的分析器將置換 Eclipse 說明系統所提供的分析器,供給定的語言環境使用。

配置標記:

   <!ELEMENT extension (analyzer*)>

   <!ATTLIST extension
     point CDATA #REQUIRED
     id    CDATA #IMPLIED
     name  CDATA #IMPLIED
   >

   <!ELEMENT analyzer EMPTY>

   <!ATTLIST analyzer
     locale CDATA #REQUIRED
     class  CDATA #REQUIRED
   >

範例:以下是「Lucene 分析器」配置的範例:

 <extension id="com.xyx.XYZ" point="org.eclipse.help.luceneAnalyzer">
  <analyzer locale="ll_CC" class="com.xyz.ll_CCAnalyzer"/>
   </extension> 

API 資訊:locale 屬性值必須代表 5 個或 2 個字元的語言環境字串。 如果指定兩個字元表示方式,來配置語言的分析器,則分析器將可以供此語言的所有語言環境使用。 如果配置了符合五個字元語言環境的分析器,將改用它。

class 屬性值必須代表一個延伸 org.apache.lucene.analysis.Analyzer 的類別。 我們建議這個分析器對語言執行小寫過濾,因而有可能藉由讓搜尋作業區分大小寫, 來增加搜尋命中數。

提供的實作方式:Eclipse 說明系統提供所有語言的分析器。若是英文和德文, 這些分析器將執行停止字過濾、小寫過濾,以及詞幹分析。若是其他語言,所提供的分析器僅執行小寫過濾。

Copyright (c) 2000, 2003 IBM Corporation and others.
All rights reserved. 這個程式和伴隨的素材可以根據伴隨這個分送,而且可在 http://www.eclipse.org/legal/cpl-v10.html 中取得的 Common Public License v1.0 的條款來使用