Analisador Lucene

Identificador: org.eclipse.help.luceneAnalyzer

Descrição: Este ponto de extensão é utilizado para registrar analisadores de textos que serão utilizados pela ajuda ao indexar e pesquisar a documentação.

A ajuda explora os recursos do mecanismo de pesquisa Lucene, que permite indexar fluxos de token (fluxos de palavras). Os analisadores criam tokens a partir do fluxo de caracteres. Eles examinam o conteúdo de textos e fornecem tokens para a utilização com o índice. O fluxo de textos pode ser indicado de várias maneiras exclusivas. Um analisador comum pode indicar os fluxos com espaços em branco, enquanto outro analisador pode executar a filtragem de tokens com base nas necessidades dos aplicativos. Como a documentação na maioria dos casos pode ser lida pelo usuário, é desejável que os analisadores utilizados pelo sistema de ajuda executem indicações e normalizações de idiomas e gramáticas de textos indexados. Em alguns idiomas, a qualidade da pesquisa aumentará significativamente se a remoção de palavras que indicam parada for executada em textos indexados.

O analisador que contribuiu com este ponto de extensão substituirá o analisador fornecido pelo sistema de ajuda do Eclipse em um determinado locale.

Marcação da Configuração:

   <!ELEMENT extension (analyzer*)>

   <!ATTLIST extension
     point CDATA #REQUIRED
     id    CDATA #IMPLIED
     name  CDATA #IMPLIED
   >

   <!ELEMENT analyzer EMPTY>

   <!ATTLIST analyzer
     locale CDATA #REQUIRED
      class  CDATA #REQUIRED
   >

Exemplos: A seguir, um exemplo de configuração do Analisador Lucene:

 <extension id="com.xyx.XYZ" point="org.eclipse.help.luceneAnalyzer">
  <analyzer locale="ll_CC" class="com.xyz.ll_CCAnalyzer"/>
 </extension>

Informações de API: O valor do atributo locale deve representar uma cadeia de locale de cinco ou dois caracteres. Se o analisador estiver configurado para um idioma através da especificação da designação de um idioma de duas letras, o analisador será utilizado por todos os locales desse idioma. Se o analisador configurado corresponder a um locale de cinco caracteres, ele será utilizado em seu lugar.

O valor do atributo class deve representar uma classe que estenda org.apache.lucene.analysis.Analyzer. É recomendável que esse analisador execute a filtragem de letras minúsculas para os idiomas nos quais é possível aumentar o número de ocorrências de pesquisa, ativando a distinção entre maiúsculas e minúsculas na pesquisa.

Implementação Fornecida: O sistema de ajuda do Eclipse fornece analisadores para todos os idiomas. Nos idiomas inglês e alemão, os analisadores executam a filtragem de palavras que indicam parada, a filtragem de letras minúsculas e a remoção. Em todos os outros idiomas, o analisador fornecido executa apenas a filtragem de letras minúsculas.

Copyright (c) 2000, 2003 IBM Corporation e outros.
Todos os direitos reservados. Este programa e os materiais que o acompanham são disponibilizados sob os termos da Common Public License v1.0 que acompanha esta distribuição e estão disponíveis no endereço http://www.eclipse.org/legal/cpl-v10.html