Journées MAS et Journée en l'honneur de Jacques Neveu

31 août - 3 septembre 2010 à Bordeaux

 
 
 

Méthodes adaptatives pour les séries chronologiques (pdf)

Session organisée par Olivier Wintenberger (CEREMADE)

Cette session présente des méthodes adaptatives dans le cadre de données dépendantes. Dans un contexte iid les méthodes adaptatives telles que le seuillage, la validation croisée, la sélection de modèle pénalisée et la méthode PAC-Bayésienne sont bien comprises. L'outil commun à toutes ces méthodes est la concentration de la mesure produit. Dans un contexte dépendant, ces mêmes méthodes adaptatives sont moins étudiées, du fait qu'une mesure dépendante se concentre "moins bien". Sous des hypothèses de type mélange fort ou dans le cas Markovien, il est possible d'obtenir la concentration de la mesure et d'étendre les méthodes classiques. Outre l'extension de méthodes adaptatives classiques dans un cadre dépendant, il est envisageable de développer des méthodes adaptatives nouvelles (différentes du cas iid) dans un cadre dépendant où la mesure se concentre "bien". Cette session regroupe 4 présentations de travaux récents dans ce domaine où de nombreuses questions restent ouvertes.

Exposé de 40 minutes Aurélien Garivier (Télécom ParisTech) Choix de modèle pour les chaînes de Markov d'ordre variable transparents

Introduits par Rissanen au début des années 1980 en théorie de l'information, les modèles à arbres de contextes (également appelés Chaînes de Markov d'ordre Variable ou VLMC) ont été depuis utilisés avec succès pour modéliser des processus dont la mémoire peut avoir une profondeur variable selon les situations.
On montrera dans cet exposé que l'utilisation de modèles VLMC n'est pas plus coûteuse que celle des chaînes de Markov, et on présentera l'étude de divers algorithmes adaptatifs permettant l'estimation de ces modèles de mémoire. On montrera en particulier comment utiliser les similarités d'échantillons provenant de sources qui partageant certains pans de leur mémoire pour améliorer l'estimation de chacune de ces sources.

Exposé de 20 minutes Claire Lacour (Orsay) en collaboration avec Fabienne Comte et Yves Rozenholc Estimation adaptative pour un modèle à volatilité stochastique à temps discret transparents

On s'intéresse au modèle à volatilité stochastique à temps discret Y_i=\exp(X_i/2)\eta_i, X_{i+1}=b(X_i)+\sigma(X_i)\xi_{i+1}, où l'on n'observe que Y_i.
Ce modèle peut-être réécrit comme un modèle de Markov caché
Z_i=X_i+\varepsilon_i,\qquad X_{i+1}=b(X_i)+\sigma(X_i)\xi_{i+1}
où (\xi_i) et (\varepsilon_i) sont des suites indépendantes de bruit i.i.d. On suppose également que les suites (X_i) et (\varepsilon_i) sont indépendantes et que la loi de \varepsilon_i est connu. Le but est d'estimer les fonctions b et \sigma^2 lorsque seules les observations Z_1,...,Z_n sont disponibles. Pour cela, on commence par construire des estimateurs par projection de bf et (b^2+\sigma^2)f. On utilise des techniques de sélection de modèles pour obtenir des estimateurs adaptatifs. Par quotient, on en déduit des estimateurs de b et \sigma^2$dont on étudie le risque intégré et la vitesse de convergence. Des simulations complètent cet exposé.

Exposé de 20 minutes Pierre Alquier (LPMA) en collaboration avec Olivier Wintenberger Selection et aggrégation de modèles pour la prédiction de séries temporelles faiblement dépendantes transparents

Dans ce travail, on applique le paradigme de la théorie de l'apprentissage statistique au problème de la sélection d'un bon modèle pour la prédiction d'une série temporelle faiblement dépendante. Après avoir déterminé un estimateur dans chacun des modèles possibles, on agrège ces modèles, ou on en sélectionne un, de façon déterministe ou randomisée, en utilisant des variantes d'inégalités PAC-Bayesiennes de (Catoni 2007). Dans les deux cas, on donne une inégalité d'oracle sur l'estimateur obtenu. On montre aussi que la méthode peut être implémentée en pratique en utilisant des méthodes de Monte-Carlo, avec de bons résultats numériques.

Exposé de 20 minutes Vincent Lefieux (RTE \ DMA) en collaboration avec Laurence Teyssier-Maillard Sélection de variables explicatives pour une modélisation non-paramétrique de la consommation d'électricité française transparents

Une prévision correcte de la consommation d'électricité est fondamentale pour le bon fonctionnement du réseau électrique français, dont RTE (Réseau de Transport d'Electricité) a la charge. Les prévisions utilisées quotidiennement sont issues d'un modèle alliant une régression paramétrique non linéaire et un modèle SARIMA. Dans l'idée d'obtenir un modèle de prévision adaptatif, nous testons des méthodes de prévision non-paramétriques, notamment la méthode IBR (Iterative Bias Reduction) qui pallie le fléau de la dimension dont souffrent communément les modèles non-paramétriques. Nous présentons dans cette communication la procédure de sélection de variables explicatives et son application à la consommation d'électricité française pour laquelle cette méthode se révèle performante.