Lucene výsledky skóre

hlasů
37

V Lucene pokud jste měli více indexy, které se vztahuje pouze jeden oddíl každý. Proč totéž vyhledávání na různých indexech vrátí výsledky s různými skóre? Výsledky z různých serverů přesně shodovat.

tedy pokud jsem hledal:

  • Name - John Smith
  • DOB - 11.11.1934

Oblast 0 vrátí skóre 0,345

Oblast 1 vrátí skóre 0,337

Oba přesně odpovídat na jméno a DOB.

Položena 02/08/2008 v 10:28
zdroj uživatelem
V jiných jazycích...                            


3 odpovědí

hlasů
19

Skórování obsahuje inverzní frekvenčně Document (IDF). V případě, že termín „John Smith“ je v jednom oddílu, 0, 100 krát a v bloku 1, jednou. Skóre pro vyhledávání Nováku bude hledat vyšší v oddílu 1, termín je vzácnější.

Chcete-li obejít toto byste vadnou mít svůj index je nad všemi oddíly, nebo budete muset přepsat IDF.

Odpovězeno 02/08/2008 v 10:51
zdroj uživatelem

hlasů
13

Vzhledem k tomu, skóre je stanovena na indexu, pokud nejsem zcela mylný.

Pokud máte různé indexy (více / méně nebo odlišné data, která byla indexována), bude skóre se liší:

http://lucene.apache.org/core/3_6_0/scoring.html

(Upozornění: Obsahuje Math :-))

Odpovězeno 02/08/2008 v 10:52
zdroj uživatelem

hlasů
8

Také by vás mohlo zajímat výstupu explain()metody a výsledný Explanationobjekt , který vám poskytne představu o tom, jak věci jsou zaznamenány tak, jak jsou.

Odpovězeno 02/08/2008 v 21:03
zdroj uživatelem

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more