MINES ParisTech CAS - Centre automatique et systèmes

Sur quelques structures d'information intervenant en jeux, dans les problèmes d'équipe ou de contrôle et en filtrage

Author: Jean Lévine.
Ce mémoire est consacré a I' étude de certains aspects de la prise de décision ou de la commande avec information incomplète sur l'environnement déterministe ou aléatoire,
Dans la Ière partie, on présente des structures d'information classique déterministe . comprenant la boucle ouverte, la structure de Stackelberg, la boucle fermée et la boucle fermée sur Le futur. On compare, sur un exemple de duopole dynamique issu de la théorie de la firme, les équilibres en boucle ouverte et fermée Puis on étudie la structure feedforward et on montre, en généralisant I.a méthode des caractéristiques pour les systèmes d'équations d'Hamilton-Jacobi-Bellman, une condition nécessaire d' existence locale, suggérant qu'il existe une infinité d'équilibres dans certains cas
Dans la 2eme partie, on étudie I' information non classique pour les problèmes d'équipe stochastiques dans le cas de décideurs multiples ayant des observations différentes et une mémoire limitée. On généralise la méthode de programmation dynamique en prenant La loi des trajectoires jusqu'à l'instant présent comme variable d' état.. On obtient une équation d 'Hamilton-Jacobi-Bellman sous des hypothèses de régularité , donnant une définition rigoureuse de la notion de "signalisation". Ces hypothèses de régularité sont vérifiées dans Le cas du contrôle des diffusions avec observations partielles.
La 3eme partie est consacrée à l'étude d'une cals s e de systèmes nonLinéaires admettant. des filtres de dimension finie. Les systèmes à considérés, à temps discret au continu, sont, caractérisés par Le fait que les bruits n'agissent pas sur La dynamique du système , mais seulement, sur les observations. On donne La condition nécessaire et suffisant.e de l' existence d'un filtre de dimension finie ainsi que sa réalisation minimale, et on montre Le lien entre dimension finie du filtre et Immersion dans un système linéaire. Un exemple concretpermet d' évaluer les performances de la méthode de filtrage, et, de La comparer au filtre de Kalman étendu.
La 4eme partie, enfin, propose un algorithme rapide pour Le calcul des commandes réalisant le découplage ou Le rejet des perturbations d'un système non linéaire (commandes pouvant, servir à définir une sous-optimalité raisonnable pour certains problèmes contrôle stochastique) Cet algorithme nécessite la dérivation formelle (et peut et.re programmé dans un lanqaqe cornme REDUCE ou MACSYMA) et utilise l'interprétation des nombres dits "caractéristiques" comme la longueur de chemins minimaux dans le graphe du système • Cette méthode est appliquée au calcul des commandes qui découplent; la dynamique d I un bras de robot.
Download PDF
BibTeX:
@phdthesis{,
author = {Lévine, Jean},
title = {Sur quelques structures d’information Intervenant en jeux, dans les Problèmes d’équipe ou de contrôle et en filtrage},
school = {MINES ParisTech},
address = {},
pages = {},
year = {1984},
abstract = {Ce mémoire est consacré a I’ étude de certains aspects de la prise de décision ou de la commande avec information incomplète sur l’environnement déterministe ou aléatoire,
Dans la Ière partie, on présente des structures d’information classique déterministe. comprenant la boucle ouverte, la structure de Stackelberg, la boucle fermée et la boucle fermée sur Le futur. On compare, sur un exemple de duopole dynamique issu de la théorie de la firme, les équilibres en boucle ouverte et fermée Puis on étudie la structure feedforward et on montre, en généralisant I.a méthode des caractéristiques pour les systèmes d’équations d’Hamilton-Jacobi-Bellman, une condition nécessaire d’ existence locale, suggérant qu’il existe une infinité d’équilibres dans certains cas
Dans la 2eme partie, on étudie I’ information non classique pour les problèmes d’équipe stochastiques dans le cas de décideurs multiples ayant des observations différentes et une mémoire limitée. On généralise la méthode de programmation dynamique en prenant La loi des trajectoires jusqu’à l’instant présent comme variable d’ état. On obtient une équation d ‘Hamilton-Jacobi-Bellman sous des hypothèses de régularité, donnant une définition rigoureuse de la notion de “signalisation”. Ces hypothèses de régularité sont vérifiées dans Le cas du contrôle des diffusions avec observations partielles.
La 3eme partie est consacrée à l’étude d’une cals s e de systèmes nonLinéaires admettant. des filtres de dimension finie. Les systèmes à considérés, à temps discret au continu, sont, caractérisés par Le fait que les bruits n’agissent pas sur La dynamique du système, mais seulement, sur les observations. On donne La condition nécessaire et suffisant.e de l’ existence d’un filtre de dimension finie ainsi que sa réalisation minimale, et on montre Le lien entre dimension finie du filtre et Immersion dans un système linéaire. Un exemple concretpermet d’ évaluer les performances de la méthode de filtrage, et, de La comparer au filtre de Kalman étendu.
La 4eme partie, enfin, propose un algorithme rapide pour Le calcul des commandes réalisant le découplage ou Le rejet des perturbations d’un système non linéaire (commandes pouvant, servir à définir une sous-optimalité raisonnable pour certains problèmes contrôle stochastique) Cet algorithme nécessite la dérivation formelle (et peut et.re programmé dans un lanqaqe cornme REDUCE ou MACSYMA) et utilise l’interprétation des nombres dits “caractéristiques” comme la longueur de chemins minimaux dans le graphe du système • Cette méthode est appliquée au calcul des commandes qui découplent; la dynamique d I un bras de robot.},
keywords = {}}