Analisador Lucene

org.eclipse.help.base.luceneAnalyzer

3.0 (incluído originalmente no release 2.0 como org.eclipse.help.luceneAnalyzer)

Esse ponto de extensão é utilizado para registrar analisadores de texto que serão utilizados pela ajuda ao indexar e pesquisar a documentação.

A ajuda explora os recursos do mecanismo de pesquisa Lucene, que permite indexar fluxos de token (fluxos de palavras). Os analisadores criam tokens a partir do fluxo de caracteres. Eles examinam o conteúdo de textos e fornecem tokens para a utilização com o índice. O fluxo de textos pode ser indicado de várias maneiras exclusivas. Um analisador comum pode indicar os fluxos com espaços em branco, enquanto outro analisador pode executar a filtragem de tokens com base nas necessidades dos aplicativos. Como a documentação na maioria dos casos pode ser lida pelo usuário, é desejável que os analisadores utilizados pelo sistema de ajuda executem indicações e normalizações de idiomas e gramáticas de textos indexados. Em alguns idiomas, a qualidade da pesquisa aumentará significativamente se a remoção de palavras que indicam parada for executada em textos indexados.

O analisador que contribuiu com este ponto de extensão substituirá o analisador fornecido pelo sistema de ajuda do Eclipse em um determinado locale.

<!ELEMENT extension (analyzer*)>

<!ATTLIST extension

point CDATA #REQUIRED

id    CDATA #IMPLIED

name  CDATA #IMPLIED>


<!ELEMENT analyzer EMPTY>

<!ATTLIST analyzer

locale CDATA #REQUIRED

class  CDATA #REQUIRED>


A seguir encontra-se um exemplo de configuração do Analisador Lucene:

 

<extension id=

"com.xyx.XYZ"

point=

"org.eclipse.help.base.luceneAnalyzer"

>

<analyzer locale=

"ll_CC"

class=

"com.xyz.ll_CCAnalyzer"

/>

</extension>

O valor do atributo locale deve representar uma cadeia de locale de cinco ou dois caracteres. Se o analisador estiver configurado para um idioma através da especificação da designação de um idioma de duas letras, o analisador será utilizado por todos os locales desse idioma. Se o analisador configurado corresponder a um locale de cinco caracteres, ele será utilizado em seu lugar.

O valor do atributo class deve representar uma classe que estenda org.apache.lucene.analysis.Analyzer. É recomendável que esse analisador execute a filtragem de letras minúsculas para os idiomas nos quais é possível aumentar o número de ocorrências de pesquisa, ativando a distinção entre maiúsculas e minúsculas na pesquisa.

O sistema de ajuda do Eclipse fornece analisadores para todos os idiomas. Nos idiomas inglês e alemão, os analisadores executam a filtragem de palavras que indicam parada, a filtragem de letras minúsculas e a remoção. Em todos os outros idiomas, o analisador fornecido executa apenas a filtragem de letras minúsculas.