Plugin de commons

Collection de différentes classes de similitude, types de query, parsers de query au-dessus de Les élastiques.

Démarrer en élasticsearch

Exportation ES_HEAP_SIZE = 4g ./bin/elasticsearch -Dsecurity.manager.enabled=faux

Installation

./bin/plugin installer le fichier://es-commons-plugin-1.0-plugin.zip

Les réalisations Scoring

Unité IDF Modèle Similaire

Ajouter la ligne suivante à config/elasticsearch.yml index.similarity.default.type : unité-idf

Modèle similaire simple Cosine

Score chaque document par le produit de point entre le vecteur de requête et le document Vector. une question d'exemple est donnée ci-dessous

  {
    "query": {
      "cosine_query": {
        "query": [
          "5770",
          "2724"
        ],
        "field": "codes"
      }
    }
  }

Modèle de produit Vector Dot

Retrait des documents par le champ_retrieval et les score en prenant le produit de point du vecteur de requête avec le vecteur de document stocké dans le champ_scoring.

fields": [
    "pid",
    "codes"
  ],
  "query": {
    "stored_vector_product_query": {
      "query": [
        "5770",
        "2724"
      ],
      "field_scoring": "embedding",
      "field_retrieval": "codes",
      "field_magnitude": "magnitude"
    }
  }
 }`

Précédent Vector Dot Product Query

 {
  "fields": [
    "pid",
    "codes"
  ],
  "query": {
    "precomputed_vector_product_query": {
      "query": [
        "5770",
        "2724"
      ],
      "field_scoring": "embedding",
      "field_retrieval": "codes",
      "field_magnitude": "magnitude"
    }
  }
 }