On considère un planificateur souhaitant utiliser de manière optimale une ressource naturelle
renouvelable (forêt, poissons...) sur T périodes. Le niveau de la ressource à l’instant t est noté P(t)
et son prélèvement sur la période [t,t + 1[ est noté h(t). On suppose que la ressource non extraite
à l’instant t se renouvelle à un taux de croissance R(t), ce qui donne la dynamique suivante
:
(1)
Le bien-être que le planificateur souhaite optimiser est représenté par la somme actualisée des
utilités de ses prélèvements successifs h(t) (supposés liés à la consommation par exemple) et du
niveau de la ressource finale P(t) :
où
ρ ∈ [0, 1] est un facteur d’actualisation et L(.) une fonction d’utilité.
2 Cas déterministe: croissance certaine
On suppose tout d’abord que la ressource naturelle est constituée d’une seule ressource de
croissance certaine et constante R:
(2)
Le planificateur souhaite optimiser le bien-être soit
(3)
On suppose maintenant que l’utilité est de type exponentiel
(4)
2.1 Résolution analytique par programmation dynamique
Question 1
Que vaut la fonction valeur V (T,P) à l’instant final ?
Quelle est la relation de récurrence liant les fonctions valeurs V (t − 1,.) et V (t,.)?
Montrer que, pour certaines valeurs de t et de P, le prélèvement optimal en boucle ferméeh♯(t,P) et la fonction valeur V (t,P) satisfont
(5)
où les paramètres a(t),b(t),f(t) sont définis par les récurrences
(6)
En déduire que les prélèvements optimaux en boucle fermée h(t) := h♯(t,P♯(t)) oùP♯(t + 1) = R(P♯(t) − h♯(t,P♯(t))) satisfont la relation :
(7)
Donner alors des conditions sur ρ et R pour que les prélèvements optimaux soient croissantsdans le temps. Que se passe-t-il en particulier si ρR = 1 ?
2.2 Programmation sous Scilab
Question 2Ouvrir un fichier nom_de_fichier.sce(par exemple, TP_renouv.sce) et yrecopier les paramètres suivants.
Y construire les vecteurs b et f donnés par l’équation (6), puis créer les vecteurs de stockset de prélèvements optimaux Popt et hopt en utilisant la dynamique (1) et l’équation (5)du feedback.
Tracer trajectoire et décisions optimales en fonction du temps, à l’aide de la commandeScilabplot2d2. On notera que le vecteur hopt est de taille (1,T), alors que Popt est detaille (1,T + 1) ; on rajoutera donc la dernière valeur Popt($) de Popt à hopt pour signifierque le dernier prélèvement consiste à épuiser totalement la ressource.
//paramètres Horizon=4; R=1.1; P0=10; rho=0.8; //rho=0.1 // Construction de b et f b=[]; b(Horizon+1)=1; for t=Horizon:-1:1do b(t)=R*b(t+1)/(1+R*b(t+1)); end; f=[]; f(Horizon+1)=0; for t=Horizon:-1:1do f(t)=(f(t+1)-log(rho*R))/(1+R*b(t+1)); end; // Prélèvements et ressource optimales Popt=[]; hopt=[]; Popt(1)=P0; for t=1:Horizondo hopt(t)=b(t)*Popt(t)+f(t); Popt(t+1)=R*(Popt(t)-hopt(t)); end, // Affichage xbasc(); plot2d2([0:(Horizon+1);0:(Horizon+1)]',[[hopt;Popt($);0]';[Popt;0]']', ... rect = [0,0,Horizon+2,Popt(1)+1])
Question 3Répéter l’opération précédente pour différentes valeurs du taux d’actualisationρ entre 0.5 et 1. Quel résultat analytique retrouve-t-on ?
2.3 Résolution par dynoptim, routine d’optimisation dynamique
On introduit, pour des facilités de programmation, une nouvelle commande u ∈ [0, 1] telle que
h = uP. On considère alors le problème
(8)
comme un problème d’optimisation en la variable (P(0),...,P(T),u(0),...,u(T − 1)) ∈ ℝT+1× [0, 1]T
sous les contraintes d’égalité P(t + 1) = R(t)(1 − u(t))P(t) et d’inégalité 0 ≤ u(t) ≤ 1.
La macro dynoptim permet de traiter ce type de problèmes.
Question 4Charger dynoptim (menu toolboxes sous Scilab) et consulter le help. Définirla dynamique dyn et ses dérivées partielles dyn_Ppar rapport à l’état et dyn_upar rapportà la commande. Faire de même avec le coût instantané et le coût final. Écrire les contraintessur les commandes.
help dynoptim //////////////////////// //dynamique //////////////////////// function z=dyn(u,P,t) z=R*P*(1-u),endfunction; function D=dyn_P(u,P,t) D=R*(1-u),endfunction; function D=dyn_u(u,P,t) D=-R*P,endfunction; //////////////////////// // Fonction d'utilité //////////////////////// function z=Utilite(h) z=1-exp(-h),endfunction; function D=DUtilite(h) D=exp(-h),endfunction; //////////////////////// // cout instantané (à minimiser !) //////////////////////// function z=L(u,P,t) z=-(rho^t)*Utilite(u*P),endfunction; function D=L_P(u,P,t) D=-(rho^t)*DUtilite(u*P)*u,endfunction; function D=L_u(u,P,t) D=-(rho^t)*DUtilite(u*P)*P,endfunction; //////////////////////// // cout final (à minimiser !) //////////////////////// function z=g(P,t) z=-(rho^t)*Utilite(P),endfunction; function D=g_P(P,t) D=-(rho^t)*DUtilite(P),endfunction; //////////////////////// // contrainte controles //////////////////////// u_min=zeros(1,Horizon); u_max=ones(1,Horizon);
Question 5Choisir un niveau initial de ressource S0 et un horizon T. Initialiserl’algorithme d’optimisation dynamique dynoptim avec un vecteur u_init. Faire un appel àdynoptim et tracer les solutions. Vérifier dans quels cas les solutions coïncident avec cellesdes questions précédentes.
Question 6Que constatez-vous en faisant varier le facteur d’actualisation ρ ?
3 Cas aléatoire: croissance incertaine
On suppose maintenant que la ressource totale P(t) est constituée de deux ressources P1(t) et
P2(t). Le taux de croissance de la première ressource, supposé aléatoire, est notée M(t), tandis
que la seconde ressource a une croissance certaine, de taux noté N. On appelle α(t) la proportion
de la ressource P2 dans le total des ressources P(t) à la période t. Ainsi, le taux de croissance
total, aussi aléatoire, s’écrit:
(9)
Pour simplifier, on suppose que les variables aléatoires (M(t))t=0,...,T−1 sont indépendantes et de
même loi.
On considère aussi le niveau de prélèvement agrégé h(t) comme décision, ce qui donne la
dynamique
(10)
On suppose que le planificateur optimise l’espérance de la somme actualisée des utilités de ses
prélèvements successifs et de la ressource finale
(11)
où h(t) et α(t) correspondent à une stratégie de prélèvement et de répartition.
On se restreint ici au cas dit isoélastique correspondant à une utilité
(12)
3.1 Résolution analytique par programmation dynamique
Question 7
Montrer que l’équation de Bellman s’écrit, pour t = 0,...,T − 1,
(13)
où M est une variable aléatoire de même loi que la loi commune des (M(t)).
Montrer, par récurrence, que le prélèvement optimal h♯(t,P), la proportion optimale α♯(t) etla fonction valeur V (t,P) satisfont
(14)
et
(15)
Montrer que l’équation de récurrence satisfaite par b(t) est
(16)
où on utilise, l’équivalent certain de croissance optimale, c’est-à-dire
(17)
et le terme
(18)
3.2 Programmation sous Scilab
On suppose que
Question 8Ouvrir un fichier nom_de_fichier.sceet y recopier les paramètresprécédents. Écrire une fonction scilab util(x) pour la fonction d’utilité puissance.
//paramètres puis=0.5; Horizon=10; N=1.1;rho=1/N; P0=10; // Fonction d'utilité puissance function u=util(x) u=x^puis,endfunction;
On suppose aussi que le taux de croissance risqué M suit une loi du type
(19)
Question 9Montrer que la solution de (15) est donnée par
(20)
Prendre les paramètres suivants pour p,q,M♭,M♯. Calculer la proportion optimale α♯de laressource 1.
Question 10Construire le vecteur b donné par l’équation (14) en utilisant l’équivalentcertaindéfini en (17) et le paramètre a défini en (18).
//Construction de Rstar, Rchap et a function R=R_OPT(M) R=alpopt*N+(1-alpopt)*M,endfunction; Rchap=(p*util(R_OPT(Mb))+q*util(R_OPT(M#)))^(1/puis); a=(rho*util(Rchap))^(1/(puis-1)); //Construction de b b=[]; b(Horizon+1)=1; for t=Horizon:-1:1do b(t)=a*b(t+1)/(1+a*b(t+1)); end;
Question 11Écrire une fonction Scilab qui, à un niveau global de ressource ressource P età une valeur M de taux de croissance, associe le niveau total de la ressource au pas de tempssuivant résultant de l’application de la commande optimale (h♯(t,P),α♯).
// Prélèvement et ressource optimaux function h=PREL_OPT(P,t) h=b(t)*P,endfunction; function x=DYN_OPT(P,M,t) x=R_OPT(M)*(P-PREL_OPT(P,t)),endfunction;
Question 12Écrire une procédure de simulation de la variable aléatoire M.
// Simuler variable aléatoire M z=rand(1,Horizon,'uniform'); for t=1:Horizondo if (z(t) <=p)then Msimu(t)=Mb; else Msimu(t)=M#; end; end;
Question 13À partir de P0, générer une trajectoire optimale stochastique P♯(t) deressources. Tracer les trajectoires t(P♯(t),h♯(t)) pour une réalisation de M.
Popt(1)=P0;J=0; for t=1:Horizondo hopt(t)=PREL_OPT(Popt(t),t); Popt(t+1)=DYN_OPT(Popt(t),Msimu(t),t); J=J+rho^(t-1)*util(hopt(t)); end, J=J+rho^(Horizon)*util(Popt(Horizon+1)); xbasc();plot(hopt);plot(Popt);
Question 14Écrire une procédure Scilab fournissant S réalisations des variables aléatoiresJ(h♯(.)), P♯(t) et h♯(t). En déduire des valeurs approchées pour leur moyenne et variance.Donner un histogramme de J(h♯(.)).