Os resultados dos escores Lucene

votos
37

Em Lucene se você tivesse vários índices que cobriam apenas uma partição cada. Por que a mesma pesquisa em diferentes índices retornar resultados com pontuações diferentes? Os resultados de diferentes servidores corresponder exatamente.

ou seja, se eu procurava:

  • Nome - John Smith
  • DOB - 1934/11/11

Partição 0 voltaria uma pontuação de 0,345

Partição 1 poderia reverter um placar de 0,337

Ambos correspondem exatamente no nome e data de nascimento.

Publicado 02/08/2008 em 10:28
fonte usuário
Em outras línguas...                            


3 respostas

votos
19

A pontuação contém o Document Frequency Inverse (IDF). Se o termo "John Smith" está em uma partição, 0, 100 vezes e de partição 1, uma vez. A pontuação para a busca de John Smith seria maior pesquisa na partição 1 como o termo é mais escasso.

Para contornar isso você iria murchar tem que ter o seu índice de estar sobre todas as partições, ou seria necessário para substituir o IDF.

Respondeu 02/08/2008 em 10:51
fonte usuário

votos
13

Porque a pontuação é determinada no índice se não estou completamente enganado.

Se você tiver índices diferentes (mais ou menos diferente de dados / que foi indexada), a pontuação será diferente:

http://lucene.apache.org/core/3_6_0/scoring.html

(Aviso: Contém matemática :-))

Respondeu 02/08/2008 em 10:52
fonte usuário

votos
8

Você pode também estar interessado na saída do explain()método , eo resultando Explanationobjeto , o que lhe dará uma idéia de como as coisas são pontuados do jeito que são.

Respondeu 02/08/2008 em 21:03
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more