Question 1Saisir le fichier de données de température.
Extraire les moyennes annuelles.
Tracer la courbe tT(t) donnant l’évolution de ces dernières.
//saisie de données de température Tg=fscanfMat('temperatures_globe.txt') //on extrait la dernière colonne qui contient les moyennes annuelles y=Tg(:,$) // t représente le temps (années) [m,n]=size(Tg);t=[1:m]'; // graphique des données xbasc();plot2d(t',y');
Question 2Calculer les coefficients de la droite de régression y = 𝜃1 + 𝜃2t qui est la plusproche de la courbe des températures au sens des moindres carrés.
//on programme une régression linéaire //formule de régression a la main x=[ones(t),t]; M=(x'*x)^(-1); theta=M*x'*y; // On peut remarquer que Scilab effectue la résolution // au sens des moindres carrés si x est << tall >> // i.e. est une matrice qui a plus de lignes que de colonnes // Le problème est bien posé si son rang estégalà son nombre de colonnes, // sinon Scilab donne une solution parmi les solutions possibles theta=x\y // on peut aussi utiliser reglin // [a,b,sig]=reglin(t',y')
Question 3Superposer la courbe des données et la droite de régression.
//superposition graphique des données et de la droite de régression xbasc(); plot2d(t,y); plot2d(t,(x*theta),2,"000");
Question 4La température T(t) est supposée être une réalisation du modèle T(t) =
𝜃1 + 𝜃2t + 𝜀t, où 𝜀1, 𝜀2... est une suite de variables aléatoires indépendantes de même loinormale 𝒩(0,σ2).
Interpréter en terme de paramètres l’hypothèse (H0) ¡¡ la température est stationnaire¿¿. Tester cette hypothèse. (On pourra consulter la section3a la fin de ce document).
On calcule l’estimateur de σ2 appellé s2
p=2 Res=y-x*theta; s2=Res'*Res/(n-p);
On calcule l’écart type de 2 à partir de la covariance de :
sigtheta2=sqrt(s2*M(2,2))
Alors theta(2)/sigtheta2 suit une loi de Student à (n − 2) degrés de liberté :
T=theta(2)/sigtheta2 // Utiliser la fonction cdft pour calculer la // probabilite qu'une v.a suivant une loi de Student a (n-2) // degré de liberté dépasse T
Question 5Examiner graphiquement la courbe des résidust = T(t) −1−2t.
Subsiste-t-il une structure dans les résidus ?
Tracer la courbe t( t,T(t)).
À l’examen de l’histogramme des résidus, l’hypothèse de normalité vous semble-t-elleraisonnable ?
//examen des résidus r=y-x*theta plot(r) histplot(10,r)
2 À quelle date le changement climatique a-t-il commencé ?
2.1 Modèle statistique
(1)
On suppose les 𝜀t indépendants et identiquement distribués (i.i.d.) suivant une loi normale
𝒩(0,σ2).
Le vecteur des paramètres est noté
(2)
2.2 Position du problème
On estime les quatre paramètres par la méthode du maximum de vraisemblance.
Définition de la fonction de vraisemblance
La fonction de vraisemblance de la loi normale est définie comme suit :
(3)
Pour calculer le maximum de vraisemblance, c’est-à-dire les valeurs de 𝜃1, 𝜃2, σ2 et τ qui
maximisent log L(ϕ,Y ), on choisit de :
fixer d’abord τ ∈{1,...,n} ;
calculer les valeurs 1∗(τ), 2∗(τ) et ∗(τ) qui maximisent log L(ϕ,Y ) ;
calculer enfin la valeur τ∗ qui maximise log L∗(τ) = log L( 1∗(τ),2∗(τ),∗(τ),τ) .
On effectue donc les opérations dans l’ordre suivant :
Calcul de 1∗(τ), 2∗(τ) et ∗(τ)
Question 6Montrer, par dérivation de (3), que1∗(τ) et2∗(τ) sont solution de
(4)
et que
(5)
Calcul de τ∗
Question 7Programmer en Scilab le calcul de τ∗solution de
function [ttheta1,ttheta2,ssigma2]=rupture(tau,y) n=size(y,"*");// taille de y A=[n,sum(1:n-tau);sum(1:n-tau),sum((1:n-tau)^2)] B=[sum(y);(1:n-tau)*y(tau+1:$)']; x=A\B; ttheta1=x(1,:); ttheta2=x(2,:); ssigma2=1/n* ... (sum((y(1:tau-1)-ttheta1)^2)+sum((y(tau+1:$)-ttheta1-ttheta2*(1:n-tau))^2)); endfunction
3 Test de nullité d’un coefficient dans un modèle de régression linéaire simple
Soient n couples de réels (x1,Y1),..., (xn,Yn) où seule la seconde composante Yt est aléatoire,
supposés suivre le modèle
(6)
où 𝜀1, 𝜀2... est une suite de variables aléatoires indépendantes de même loi normale
𝒩(0,σ2).
En notations vectorielles, on pose
soit
On appelle estimateur de Gauss-Markov (ou estimateur des moindres carrés)
(7)
où on a supposé X de rang plein égal à 2. On note
(8)
qui satisfait aux relations
(9)
On a
(10)
si bien que
(11)
On note le vecteur des résidus
(12)
On a
(13)
si bien que
(14)
Comme X′D( )X = 0, D( ) est de rang n − 2 car on a supposé X de rang plein égal à 2.
Donc
(15)
On pose
(16)
dont on peut vérifier 𝔼() = σ2.
Les vecteurs = Y − X et 𝜃 − sont indépendants, car le couple
(17)
est gaussien décorrélé (propriété de la projection).
Donc le rapport
(18)
suit une loi de Student à n − 2 degrés de liberté.