Récursivité

Récursivité simple

Une fonction peut être appelée n'importe où dans un programme (après sa définition), y compris par elle-même.

Cours

Une fonction récursive est une fonction qui s'appelle elle-même¹.

Prenons pour exemple une fonction qui renvoie le produit de tous les nombres entiers entre 1 et \(n\). Ce produit est appelé factorielle de \(n\) et noté \(n!\).

\(n! = 1 \times 2 \times 3 \times 4 \times ... \times (n-1) \times n\)

Un programme itératif²: peut s'écrire simplement avec un boucle for qui multiplie tous les entiers allant de 1 à n entre eux :

def fact(n):
    f = 1
    for i in range(1, n + 1):
        f = f * i
    return f

Mais il est aussi possible de remarquer que \(n! = (n-1)! \times n\) et que \(1! = 1\), ce qui permet d'écrire un programme récursif suivant :

def fact(n):
    if n == 1:
        return 1
    return  fact(n-1) * n

On peut toujours transformer une fonction récursive en itérative et vice versa.

Importance de la clause d'arrêt

Cours

Une fonction récursive doit toujours comporter une clause d'arrêt, pour ne pas « boucler ».

La fonction suivante :

def fact(n):
    return fact(n-1) * n

ne s'arrêtera jamais car il manque une clause d'arrêt if n == 1 : … !

: warning: Il faut toujours prendre soin de bien définir la clause d'arrêt. Ici que se passe-t-il si on appelle fact(5.1) ou fact(-1) ? On préfèrera peut-être if n <= 1: … ou utiliser des assertions pour éviter ces cas.

En pratique un appel récursif doit obligatoirement comporter une instruction conditionnelle et une variable de contrôle : par exemple un entier naturel qui décroît strictement à chaque appel récursif jusqu'à atteindre la valeur d'un cas de base.

Récursivité croisée, multiple

Cours

Dans certains cas, une fonction appelle une autre fonction qui elle-même appelle la première. C'est une récursivité croisée.

Par exemple pour tester si un nombre est pair ou impair (sans utiliser l'opérateur %2)

def pair(n):
    if n == 0: return True
    else: return impair(n-1)
def impair(n):
    if n == 0: return False
    else: return pair(n-1)

Cours

Il arrive aussi qu'une fonction s'appelle plusieurs fois, c'est une récursivité multiple.

Par exemple la suite de Fibonacci est définie par \(u_0 = 0\), \(u_1 = 1\) et pour \(n > 1 : u_n = u_{n-1} + u_{n-2}\).

def fib(n):
    if n < 2:
        return n
    return fib(n–1) + fib(n-2)

Si la récursivité est plus élégante et facile à lire qu'un programme itératif, on atteint très vite ses limites en complexités³ spatiale et temporelle⁴.

Complexité spatiale et pile d'exécution

Analysons ce qu'il se passe si on appelle la fonction récursive fact(n) quand n devient relativement grand.

>>> fact(1000)
Traceback (most recent call last):
…
RecursionError: maximum recursion depth exceeded in comparison

Une erreur est levée , alors que le programme itératif fonctionne parfaitement !

Pour gérer des fonctions qui appellent d'autres fonctions, le système utilise une "pile d'exécution". Une pile d'exécution permet d'enregistrer des informations sur les fonctions en cours d'exécution dans un programme. C'est une pile, car les exécutions en attente "s'empilent" successivement les unes sur les autres.

La pile pour calculer fact(4) est la suivante :

1er appel de la fonction fact avec n = 4 : n n'est pas égal à 1, la fonction "empile" fact(4) et appelle fact(3).
2ème appel de la fonction fact avec n = 3 : n n'est pas égal à 1, la fonction "empile" fact(3) et appelle fact(2).
3ème appel de la fonction fact avec n = 2 : n n'est pas égal à 1, la fonction "empile" fact(2) et appelle fact(1).
4ème appel de la fonction fact avec n = 1 : n est égal à 1, la fonction renvoie 1.
fact(2) est "dépilé", il renvoie 2 x 1 = 2.
fact(3) est "dépilé", il renvoie 3 x 2 = 6.
fact(4) est "dépilé" et peut enfin être calculé, il renvoie 4 x 6 = 26.

Pile d'appels de fact(4)

Cours

Complexité spatiale : La récursivité utilise une pile d'appels qui est un espace mémoire particulièrement limité, cela génère rapidement des débordements de capacité, c'est le fameux stack overflow !

Complexité temporelle

La suite de Fibonacci est définie par \(u_0=0\) , \(u_1=1\) et pour \(n > 1\) : \(u_n=u_{n-1}+ u_{n-2}\).

Ce qui se traduit en une programmation itérative par :

def fib(n):
    if n < 2:
        return n
    else:
        fn, fn_1 = 1, 0
        for i in range(2, n+1):
            fn, fn_1 = fn + fn_1, f_n
    return b

Une programmation récursive est une simple traduction mot à mot de la définition :

def fib(n):
    if n < 2:
        return n
    return fib(n–1) + fib(n-2)

Plus facile à concevoir et à lire, la programmation récursive devient vite très lente à l'exécution. Comparons les temps d'exécution de ces deux programmes avec le module time.

from time import time

debut = time()
fib(30)
duree = time() - debut
print(duree, "secondes")

Les résultats obtenus sont les suivants (qui dépendent de la machine utilisée).

n	fib(n) itératif	fib(n) récursif
10	0.0 secondes	0.0 secondes
20	0.0 secondes	0.005 secondes
30	0.0 secondes	0.61 secondes
40	0.0 secondes	78.21 secondes
100	0.0 secondes	…

Alors que la fonction itérative est quasi instantanée pour toutes les valeurs de n testées, la fonction récursive devient très rapidement extrêmement lente, même pour des valeurs de n raisonnables, fib(40) demande plus d'une minute ! Ce n'est pas un problème de complexité spatiale, puisque fib(40) empile au plus 40 appels dans la pile d'appels, on est loin de la limite !

Regardons ce qui se passe pour calculer fib(5). La fonction fib s'appelle 15 fois juste pour calculer fib(5) !

et on peut tout de suite imaginer que ce nombre de calculs augmente très rapidement pour fib(30) ou fib(40). Ce n'est donc pas un problème de complexité spatiale mais plutôt un problème de nombre d'opérations effectuées pendant le calcul : c'est la complexité temporelle.

Cours

Complexité temporelle : Dans certains cas, la récursivité augmente le nombre d'opérations.

Essayons d'en savoir plus sur la complexité de cette fonction en affichant le nombre d'appels de la fonction avec un compteur qui s'incrémente à chaque appel.

def fib(n):
    global cpt
    cpt += 1
    if n < 2:
        return n
    return fib(n-1) + fib(n-2)

cpt = 0
fib(30)
print(cpt)

n	cpt
5	15
10	177
20	21 891
30	2 692 537
40	331 160 271

Il y a eu presque 3 millions d'appels alors que fib(30) ne nécessite, en théorie, que la connaissance de quelques dizaines de valeur ! Et fib(40) nécessite plus de 300 millions d'appels !

C'est une complexité qui semble de type exponentielle, en \(O(2^n)\) ⁵, c'est-à-dire qui ne peut pas être exécutée en temps acceptable pour n grand⁶ !

Rappel

Principales complexités temporelles :

Désignation	Notation	Exemples
constante	\(O(1)\)	Accès à un élément d'un tableau
logarithmique	\(O(log(n))\)	Recherche dichotomique (tableau trié)
linéaire	\(O(n)\)	Recherche dans un tableau
quasi linéaire	\(O(n\times log(n))\)	Tri fusion
quadratique	\(O(n^2)\)	Tri à bulle, parcours de matrice
exponentielle	\(O(a^n)\)	Sac à dos
factorielle	\(O(n!)\)	Voyageur de commerce

Mémoïsation

Nous avons vu qu'il y a eu presque 3 millions d'appels alors que fib(30) ne nécessite, en théorie, que la connaissance de quelques dizaines de valeur ! La fonction recalcule de nombreuses fois des valeurs qu'elle a déjà calculées mais qu'elle n'a pas gardé en mémoire. Par exemple fib(5) calcule 3 fois la valeur de fib(2). L'algorithme itératif n'a pas ce problème, il retient progresse en calculant les valeurs de la suite dans l'ordre les unes après les autres.

Une solution pour limiter le nombre de calcul consiste à ne calculer les termes de la suite qu'une seule fois et de les garder en mémoire. C'est la memoïzation.

Cours

La memoïsation consiste à garder en mémoire les valeurs déjà calculées.

Par exemple avec un dictionnaire déclaré en variable globale⁷ :

memoise = {} 
def fib(n):
    if n in memoise:
        return memoise[n]
    if n < 2:
        memoise[n] = n
    else :
        memoise [n] = fib(n-1) + fib(n-2)
    return memoise[n]

Ou plus court en renseignant les premières valeurs dans le dictionnaire:

memoise = {0: 0, 1: 1 } # fib(0) et fib(1)
def fib(n):
    if n not in memoise: 
        memoise[n] = fib(n-1) + fib(n-2)
    return memoise[n]

⁸

Exercice corrigé

En mathématiques, les coefficients binomiaux, définis pour tout entier naturel \(n\) et tout entier naturel \(k\) inférieur ou égal à \(n\), donnent le nombre de parties à \(k\) éléments d'un ensemble à \(n\) éléments. On les note \(C_{n}^{k}\) ou \(\begin{pmatrix}n\\k\end{pmatrix}\). Les coefficients binomiaux interviennent dans de nombreux domaines des mathématiques : développement du binôme en algèbre, dénombrements, développement en série, lois de probabilités, etc.

1 ) Écrire une fonction récursive C(n, k) qui renvoie la valeur des coefficients binomiaux en utilisant la formule du triangle de Pascal : \(C_{n}^{k} = C_{n-1}^{k-1} + C_{n-1}^{k}\)

Triangle de Pascal Pile d'appels de fact(4)

2) Ajouter la mémoisation à la fonction C(n, k).

Réponse

1)

def C(n, k):
    if k == 0 or k == n: return 1
    else: return C(n-1, k-1) + C(n-1, k)

for i in range (11):
    for j in range(i+1):
        print (C(i, j), end="\t")
    print ('')

2 )

def C(n, k):
    if (n, k) in memoire:
        return memoire[(n, k)]
    if k == 0 or k == n:
        coef =  1
    else: 
        coef =  C(n-1, k-1) + C(n-1, k)
    memoire[(n, k)] = coef
    return coef

memoire={(0, 0) : 1}
for i in range (11):
    for j in range(i+1):
        print (C(i, j), end="\t")
    print ('')

Note : La mémoisation est un exemple classique d'utilisation des décorateurs Python (hors programme)⁹. On pourra aussi explorer le décorateur @functools.lru_cache().

Complexité temporelle des fonctions récursives

Prenons l'exemple de la fonction récursive fact.

Si le calcul de fact(n-1) s'effectue en un nombre d'opérations connu, noté \(T_{n-1}\), alors le calcul de fact(n) s'effectue en effectuant cinq opérations élémentaires supplémentaires :

une instruction conditionnelle (if),
une comparaison (n == 1),
un appel de fonction (fact(n-1)) ,
une multiplication (n * fact(n-1) ) et
un return.

donc \(T_n = T_{n-1} + 5\).

Ce qui peut s'écrire en ordre de grandeur : \(T_n = T_{n-1} + O(1)\). La complexité temporelle de la fonction récursive fact est en \(O(n)\).

Cours

La complexité temporelle d'une fonction récursive se calcule en trouvant une relation entre le nombre d'opérations \(T_n\) d'un problème de taille \(n\) et \(T_{n-1}\). Cette relation (de récurrence) permet de déduire \(O(n)\).

Relation entre Tn et Tn-1	Complexité	Désignation
\(T_n = T_{n-1} + O(1)\)	\(O(n)\)	Linéaire
\(T_n = T_{n-1} + O(n)\)	\(O(n^2)\)	Quadratique
\(T_n = 2 \times T_{n-1} + O(1)\)	\(O(2^n)\)	Exponentielle

Comparons les complexités temporelles de la suite de Fibonacci avec nos trois programmes :

Programme itératifProgramme récursifProgramme récursif avec mémoïsation

def fib(n):
    if n < 2:                       # 1 condition + 1 comparaison
        return n
    else:
        a, b = 0, 1                 # 2 affectations
        for i in range(2, n+1):     # n-1 affectations
            a, b = b, a + b         # n-1 affectations x 2 
    return b                        # 1 return

Au total, il y a \(3(n-1) + 5\) opérations élémentaires. La complexité temporelle est linéaire en \(O(n)\).

def fib(n):
    if n < 2:
        return n               # 1 condition + 1 comparaison
    return fib(n-1) + fib(n-2)  # 1 addition + Tn-1 + Tn-2

En faisant l'hypothèse que \(T_{n-1} \approx T_{n-2}\), nous obtenons \(T_n \approx 2 \times T_{n-1} + 2\), donc la complexité temporelle est exponentielle en \(O(2^n)\)

memoise = {} 
def fib(n):
    if n in memoise:        # 1 condition + 1 recherche de clé dans un dictionnaire  
        return memoise[n]   # 1 accès au dictionnaire 
    if n < 2:               # 1 condition + 1 comparaison
        memoise[n] = n
    else :
        memoise[n] = fib(n-1) + fib(n-2)     # 2 appels et 1 addition répétés
    return memoise[n]                   # 1 return + 1 un accès au dictionnaire

Rappelons d'abord que l'accès à une valeur dans un dictionnairesa une complexité en \(O(1)\) (ainsi que l'ajout ou la modification d'une valeur associée à une clé qui sont aussi en \(O(1)\). Seule la recherche d'une valeur, qui consiste à parcourir toutes les clés les unes après les autres, a un coût en \(O(n)\), mais ce n'est pas le cas ici).

Grace à la mémoïsation, chaque valeur de fib n'est calculée qu'une seule fois. Si la valeur est déjà dans le dictionnaire, les deux premières lignes, if n in memoise:... réalisent 3 opérations qui s'effectuent en temps constant, donc ont une compléxité en \(O(1)\). Si la valeur n'est pas encore dans le dictionnaire, alors on effectue l'instruction qui suit le else, memoise[n] = fib(n-1) + fib(n-2), ce sont 3 opérations donc avec une compléxité en \(O(1)\). Toutes ces opérations sont répétées pour toutes les valeurs entre 3 et \(n\). Ainsi, le nombre total d'opérations est proportionnel à \(n\), ce qui donne une complexité linéaire en \(O(n)\).

Le mot "récursivité" en informatique a la même racine que "récurrence" utilisée pour les suites mathématiques. ↩
Une structure de contrôle est dite "itérative" qaund elle exécute plusieurs fois une séquence d'instructions (boucles for, while). ↩
Les mots "complexité" ou "coût" sont employés indifféremment. ↩
Attention à ne pas confondre les deux complexités : la complexité temporelle (ou en temps) mesure l'ordre de grandeur du nombre d'opérations élémentaires, la complexité spatiale (ou en espace) mesure l'espace mémoire requis par un programme. ↩
Plus exactement en \(O(r^n)\) ou \(r=(1+√5)/2≈1.6\). ↩
De manière générale, les algorithmes qui ont une complexité temporelle du type \(O(q^n)\) avec \(q > 1\), dits de type NP, ne peuvent pas être exécutés en temps acceptable pour \(n\) grand, contrairement à ceux en \(O(n^p)\) dits de type P qui peuvent l'être. ↩
Ici on peut modifier la variable globale memoise dans la fonction sans utiliser global memoise car elle est de type muable. ↩

Une technique pour ne pas garder de variable globale dans le reste programme consiste à transformer fib(n) en une fonction locale de fibo(n) :

def fibo(n):
    memoise = {} 
    def fib(n):
        if n in memoise:
            return memoise[n] …
        if n < 2:
            memo_fib[n] = n
        else:
            memo_fib[n] = fib(n-1) + fib(n-2)        
        return memo_fib[n]
    return fib(n)

↩

def memoised(fonction):
    memoise = {}
    def fonction_memo(*args):
        if args not in memoise:
            memoise[args] = fonction(*args)
        return memoise[args]
    return fonction_memo

@memoised
def fib(n):
    if n < 2:
        return n
    return fib(n-1) + fib(n-2)

↩