Ce papier est un résumé de l’article "Learning and Fine-Tuning a Generic Value-Selection Heuristic Inside a Constraint Programming Solver", publié dans la revue "Constraints" en novembre 2024. Notre contribution est une méthode pour apprendre des heuristiques de sélection de valeurs dans un solveur de programmation par contraintes (CP). Pour cela, nous utilisons (1) Une procédure d’appren- tissage basée sur des redémarrage avec de l’apprentissage par renforcement, (2) Une fonction de récompense capable d’attribuer des valeurs intermédiaires non nulles basées sur la propagation, et (3) une architecture neuronale basée sur un réseau de neurones à graphe hétérogène.
Marty, T., Boisvert, L., François, T., Tessier, P., Gautier, L., Rousseau, L.-M., & Cappart, Q. (2025). Apprentissage et calibrage d’une heuristique générique de choix de valeur dans un solveur de programmation par contraintes. Actes des 20es Journées Francophones de Programmation par Contraintes, 57-59. https://hdl.handle.net/2078.5/272755 (Original work published 2025)