Revenons sur ce qui a été vu dans le cours consacré à la récursivité. Voici normalement ce que vous avez dû obtenir pour utiliser une fonction récursive:
def fib(n) :
if n < 2 :
return n
else :
return fib(n-1)+fib(n-2)
Pour n=6, il est possible d'illustrer le fonctionnement de ce programme avec le schéma ci-dessous :
Vous pouvez constater que l'on a une structure arborescente (typique dans les algorithmes récursifs), si on additionne toutes les feuilles de cette structure arborescente (fib(1)=1 et fib(0)=0), on retrouve bien 8.
En observant attentivement le schéma ci-dessus, vous avez remarqué que de nombreux calculs sont inutiles, car effectué 2 fois : par exemple on retrouve le calcul de fib(4) à 2 endroits (en haut à droite et un peu plus bas à gauche) :
On pourrait donc grandement simplifier le calcul en calculant une fois pour toutes fib(4), en "mémorisant" le résultat et en le réutilisant quand nécessaire :
Après avoir étudié attentivement le programme ci-dessous, testez-le :
def fib_mem(n):
mem = [0]*(n+1) #permet de créer un tableau contenant n+1 zéro
return fib_mem_c(n,mem)
def fib_mem_c(n,m):
if n==0 or n==1:
m[n]=n
return n
elif m[n]>0:
return m[n]
else:
m[n]=fib_mem_c(n-1,m) + fib_mem_c(n-2,m)
return m[n]
En cas de difficultés, n'hésitez pas à poser des questions.
Dans le cas qui nous intéresse, on peut légitimement s'interroger sur le bénéfice de cette opération de "mémorisation", mais pour des valeurs de n beaucoup plus élevées, la question ne se pose même pas, le gain en termes de performance (temps de calcul) est évident. Pour des valeurs n très élevées, dans le cas du programme récursif "classique" (n'utilisant pas la "mémorisation"), on peut même se retrouver avec un programme qui "plante" à cause du trop grand nombre d'appels récursifs.
En réfléchissant un peu sur le cas que nous venons de traiter, nous divisons un problème "complexe" (calcul de fib(6)) en une multitude de petits problèmes faciles à résoudre (fib(0) et fib(1)), puis nous utilisons les résultats obtenus pour les "petits problèmes" pour résoudre le problème "complexe". Cela devrait vous rappeler la méthode "diviser pour régner" !
En faite, ce n'est pas tout à fait cela puisque dans le cas de la méthode "diviser pour régner", la "mémorisation" des calculs n'est pas prévue. La méthode que nous venons d'utiliser se nomme "programmation dynamique".
Comme nous venons de le voir, la programmation dynamique, comme la méthode diviser pour régner, résout des problèmes en combinant des solutions de sous-problèmes. Cette méthode a été introduite au début des années 1950 par Richard Bellman.
Il est important de bien comprendre que "programmation" dans "programmation dynamique", ne doit pas s'entendre comme "utilisation d'un langage de programmation", mais comme synonyme de planification et ordonnancement.
La programmation dynamique s'applique généralement aux problèmes d'optimisation. Nous avons déjà évoqué les problèmes d'optimisation lorsque nous avons étudié les algorithmes gloutons l'année dernière. N'hésitez pas, si nécessaire à vous replonger dans ce cours.
Comme déjà évoqué plus haut, à la différence de la méthode diviser pour régner, la programmation dynamique s'applique quand les sous-problèmes se recoupent, c'est-à-dire lorsque les sous-problèmes ont des problèmes communs (dans le cas du calcul de fib(6) on doit calculer 2 fois fib(4). Pour calculer fib(4), on doit calculer 4 fois fib(2)...). Un algorithme de programmation dynamique résout chaque sous-sous-problème une seule fois et mémorise sa réponse dans un tableau, évitant ainsi le recalcul de la solution chaque fois qu'il résout chaque sous-sous-problème (voir le "À faire vous-même 1").
Nous allons maintenant travailler sur un problème d'optimisation déjà rencontré l'année dernière : le problème du rendu de monnaie.
Petit rappel : vous avez à votre disposition un nombre illimité de pièces de 2 cts, 5 cts, 10 cts, 50 cts et 1 euro (100 cts). Vous devez rendre une certaine somme (rendu de monnaie). Le problème est le suivant : "Quel est le nombre minimum de pièces qui doivent être utilisées pour rendre la monnaie"
La résolution "gloutonne" de ce problème peut être la suivante :
Prenons un exemple :
nous avons 1 euro 77 cts à rendre :
L'algorithme se termine en renvoyant 6 (on a dû rendre 6 pièces)
Appliquez l'algorithme glouton vu ci-dessus avec la somme à rendre égale à 11 centimes.
Comme vous l'avez sans doute remarqué, si on applique l'algorithme glouton à cet exemple, nous ne trouvons pas de réponse. En effet :
Cet exemple marque une caractéristique importante des algorithmes glouton : une fois qu'une "décision" a été prise, on ne revient pas "en arrière" (on a choisi la pièce de 10 cts, même si cela nous conduit dans une "impasse").
Rappel : dans certains cas, un algorithme glouton trouvera une solution, mais cette dernière ne sera pas "une des meilleures solutions possible" (une solution optimale), voir le cours sur les algorithmes glouton.
Évidemment, le fait que notre algorithme glouton ne soit pas "capable" de trouver une solution ne signifie pas qu'il n'existe pas de solution...en effet, il suffit de prendre 1 pièce de 5 cts et 3 pièces de 2 cts pour arriver à 11 cts. Recherchons un algorithme qui nous permettrait de trouver une solution optimale, quelle que soit la situation.
Afin de mettre au point un algorithme, essayons de trouver une relation de récurrence :
Soit $X$ la somme à rendre, on notera $Nb(X)$ le nombre minimum de pièces à rendre. Nous allons nous poser la question suivante : Si je suis capable de rendre $X$ avec $Nb(X)$ pièces, quelle somme suis-je capable de rendre avec $1+Nb(X)$ pièces ?
Si j'ai à ma disposition la liste de pièces suivante : $p_1$, $p_2$, $p_3$, ..., $p_n$ et que je suis capable de rendre $X$ cts, je suis donc aussi capable de rendre :
(à condition que $p_i$ (avec $i$ compris entre 1 et $n$) soit inférieure ou égale à la somme restant à rendre)
Exemple : si je suis capable de rendre 72 cts et que j'ai à ma disposition des pièces de 2 cts, 5 cts, 10 cts, 50 cts et 1 euro, je peux aussi rendre :
Je ne peux pas utiliser de pièce de 1 euro.
Autrement dit, si $Nb(X - p_i)$ (avec $i$ compris entre 1 et $n$) est le nombre minimal de pièces à rendre pour le montant $X - p_i$, alors $Nb(X) = 1 + Nb(X - p_i)$ est le nombre minimal de pièces à rendre pour un montant $X$. Nous avons donc la formule de récurrence suivante :
si $X = 0$ : $Nb(X) = 0$
si $X > 0$ : $Nb(X) = 1 + min(Nb(X - p_i))$ avec $1 \leq i < n$ et $p_i \leq X$
Le "min" présent dans la formule de récurrence exprime le fait que le nombre de pièces à rendre pour une somme $X - p_i$ doit être le plus petit possible.
Étudiez attentivement le programme Python suivant :
def rendu_monnaie_rec(P,X):
if X==0:
return 0
else:
mini = 1000
for i in range(len(P)):
if P[i]<=X:
nb = 1 + rendu_monnaie_rec(P,X-P[i])
if nb<mini:
mini = nb
return mini
pieces = (2,5,10,50,100)
Comme vous l'avez sans doute remarqué, pour être sûr de renvoyer le plus petit nombre de pièces, on attribue dans un premier temps la valeur 1000 à la variable mini (cette valeur 1000 est arbitraire, il faut juste une valeur suffisamment grande : on peut partir du principe que nous ne rencontrerons jamais de cas où il faudra rendre plus de 1000 pièces), ensuite, à chaque appel récursif, on "sauvegarde" le plus petit nombre de pièces dans cette variable mini.
Testez le programme du "À faire vous-même 3" en saisissant dans la console Python "rendu_monnaie_rec(pieces,11)" (on recherche le nombre minimum de pièces à rendre pour une somme de 11 cts. Les pièces disponibles sont : 2 cts, 5 cts, 10 cts, 50 cts, 100 cts (1 euro))
Le programme du "À faire vous-même 3" n'est pas des plus simple à comprendre (même si on retrouve bien la formule de récurrence définit un peu au-dessus), voici un schéma (avec une somme à rendre de 11 centimes) qui vous permettra de mieux comprendre le principe de cet algorithme :
Plusieurs remarques s'imposent :
Testez le programme du "À faire vous-même 3" en saisissant dans la console Python "rendu_monnaie_rec(pieces,171)" (on recherche le nombre minimum de pièces à rendre pour une somme de 1,71 euro. Les pièces disponibles sont : 2 cts, 5 cts, 10 cts, 50 cts, 100 cts (1 euro)).
Comme vous pouvez le constater le programme ne permet pas d'obtenir une solution, pourquoi ? Parce que les appels récursifs sont trop nombreux, on dépasse la capacité de la pile.
Comme vous avez peut-être déjà dû le remarquer, même dans le cas simple évoqué ci-dessus (11 cts à rendre), nous faisons plusieurs fois exactement le même calcul. Par exemple on retrouve 2 fois la branche qui part de "4" :
Il va donc être possible d'appliquer la même méthode que pour Fibonacci : la programmation dynamique.
À noter que dans des cas plus "difficiles à traiter" comme 1,71 euro, on va retrouver de nombreuses fois exactement les mêmes calculs, il est donc potentiellement intéressant d'utiliser la programmation dynamique.
Étudiez attentivement le programme Python suivant :
def rendu_monnaie(s, pieces):
"""Version récursive avec mémoïsation"""
memo = [None] * (s + 1) # intialisation du tableau avec des None
return rendu_monnaie_memo(s, pieces, memo)
def rendu_monnaie_memo(s, pieces, memo):
if memo[s] is not None: # si on a déjà calculé le nombre optimal de pièces pour rendre la somme s
return memo[s] # on le renvoie directement
elif s == 0:
memo[s] = 0
return 0
else:
nb_pieces = s # nb_pieces = 1 + 1 + ... + 1 dans le pire des cas
for p in pieces:
if p <= s: # inutile de tester une pièce dont la valeur dépasse la somme s à rendre
nb_pieces_bis = 1 + rendu_monnaie_memo(s - p, pieces, memo)
nb_pieces = min(nb_pieces, nb_pieces_bis)
memo[s] = nb_pieces
return nb_pieces
Ce programme ressemble beaucoup à programme utiliser pour la suite de Fibonacci, il ne devrait donc pas vous poser de problème.
Testez le programme du "À faire vous-même 6" en saisissant dans la console Python "rendu_monnaie_mem(pieces,171)" (on recherche le nombre minimum de pièces à rendre pour une somme de 1,71 euro. Les pièces disponibles sont : 2 cts, 5 cts, 10 cts, 50 cts, 100 cts (1 euro)).
Comme vous pouvez le constater, au contraire du cas précédent (programme du "À faire vous-même 3"), il suffit d'une fraction de seconde pour que le programme basé sur la programmation dynamique donne une réponse correcte.
def rendu_monnaie(s, pieces):
"""Version itérative ascendante"""
# ÉTAPE 1 : création et initialisation du tableau
nb = [0] * (s+1) # nb[0] est ainsi bien initialisé
# ÉTAPE 2 : remplissage du reste du tableau par indice croissant
for n in range(1, s + 1):
nb[n] = n # nb[n] = 1 + 1 + ... + dans le pire des cas
for p in pieces:
if p <= n:
nb_bis = 1 + nb[n-p]
nb[n] = min(nb[n], nb_bis)
# ÉTAPE 3 : le résultat est dans la dernière case
return nb[n]
# ESSAI
rendu_monnaie(100, [1, 2])
D'après l'auteur : David Roche