La séance de TP se fait sous environnement Linux. Pour commencer la séance, ouvrir un shell, créer un répertoire ’tp_scilab’ (mkdir tp_scilab) puis se placer sous ce répertoire (cd tp_scilab). Lancer un navigateur, par exemple Mozilla (mozilla &), et aller sur la page web suivante :
Lancer ensuite Scilab depuis ce répertoire ’tp_scilab’ (scilab) et ouvrir une fenêtre d’un éditeur, par exemple emacs (emacs &).
Pour chacune des questions, vous pouvez soit utiliser un “copier-coller”, soit télécharger le programme correspondant.
Pour un rappel sur les opérations élémentaires de Scilab, on renvoie à l’Introduction générale à Scilab pour les travaux pratiques à l’enpc :
Introduction à Scilab / Manipulations vectorielles
Introduction à Scilab / Graphiques, fonctions Scilab, programmation, saisie de données
On rappelle que pour avoir de l’aide sur une commande Scilab, il suffit de taper sur la ligne de commande Scilab :
On dispose de données concernant l’âge (r1), le kilométrage en milliers de kms (r2), et le prix en milliers d’euros (X) pour un échantillon de voitures d’occasion d’un même type:
Si l’on veut étudier la liaison entre les variables potentiellement explicatives et la variable à expliquer (le prix X), on peut commencer par visualiser les nuages de points (r1,X) et (r2,X):
Télécharger tp_reg_donnees.sce
Question 1 Que suggèrent les deux nuages?
La fonction regression(M,X,alpha) calcule, à partir de la donnée du modèle sous la forme X = Mγ + 𝜀, où X est la variable à expliquer et M la matrice définissant le modèle, les éléments usuels:
Pour obtenir le code de la fonction, télécharger tp_reg_regression.sce, le sauvegarder sous le nom tp_reg_regression.sce dans le répertoire où vous utilisez scilab. Pour charger la fonction, utiliser la commande: exec tp_reg_regression.sce.
On propose tout d’abord le modèle simple:
Question 2 L’âge a-t-il une influence significative sur le prix ?
Pour le modèle simple, où on explique le prix en fonction de l’âge, on utilise les commandes suivantes:
Télécharger tp_reg_mod_simp.sce
On représente la droite de régression sur le nuage:
Télécharger tp_reg_trace_mod_simp_1.sce
Question 3 Même question pour le kilométrage en considérant le modèle
Parmi les deux sous-modèles à un seul régresseur, lequel explique le mieux le prix ?
On propose d’essayer à présent le modèle complet
Question 4 Donner, à l’aide de la fonction regression des estimations sans biais des paramètres (β0,β1,β2) et σ2.
On représente le plan de régression sur le nuage:
Télécharger tp_reg_trace_mod_mult.sce
Question 5 Test de l’utilité d’un régresseur: tester, au niveau 5%, l’hypothèse nulle “le kilométrage n’a pas d’effet sur le prix” contre “c’est faux”.
La fonction regression n’effectue pas le test demandé (quel test effectue-t-elle ?). Calculer la statistique et la p-valeur du test demandé, et conclure.