dapurv5-es-scripts
Les Escripts
Les sources de données
- https://www.cms.gov/Research-Statistics-Data-and-Systems/Downloadable-Public-Use-Files/SynPUFs/DE_Syn_PUF.html
gen_docs.py (pour générer des documents à partir de données primaires) gen_codes.py (génère un fichier contenant une liste sortée de tous les codes de diagnostic) gen_code_embeddings.py (génère un fichier avec la représentation vectorielle pour chacune du code)
update_docs.py (lise les entrées de code et les documents et les indexera en es avec les métadonnées)
gen_code_products.py (génère des produits de représentations vectorielles de tous les paires de codes)