Les Escripts

Les sources de données

  • https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/DE_Syn_PUF.html

gen_docs.py (pour générer des documents à partir de données primaires) gen_codes.py (génère un fichier contenant une liste sortée de tous les codes de diagnostic) gen_code_embeddings.py (génère un fichier avec la représentation vectorielle pour chacune du code)

update_docs.py (lise les entrées de code et les documents et les indexera en es avec les métadonnées)

gen_code_products.py (génère des produits de représentations vectorielles de tous les paires de codes)