Doctorant Employeur Université Marie et Louis Pasteur de Franche Comté à Besançon - Algorithmique Sobre et Conviviale pour l'Allocation des Ressources dans un Data Center H/F - INRIA
- CDD
- INRIA
Les missions du poste
A propos d'Inria
Inria est l'institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l'interface d'autres disciplines. L'institut fait appel à de nombreux talents dans plus d'une quarantaine de métiers différents. 900 personnels d'appui à la recherche et à l'innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'eorce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.
Doctorant F/H Employeur Université Marie et Louis Pasteur de Franche Comté à Besançon - Algorithmique sobre et conviviale pour l'allocation des ressources dans un data center
Type de contrat : CDD
Niveau de diplôme exigé : Bac +5 ou équivalent
Fonction : Doctorant
A propos du centre ou de la direction fonctionnelle
Université Marie et Louis Pasteur de Franche Comté à Besançon.
Contexte et atouts du poste
Contexte
Cette thèse s'inscrit dans le cadre du projet ANR SOCLOUD, qui vise à étudier les possibilités de conception d'un data center sobre et ouvert, respectueux des limites planétaires et socialement équitable envers ses utilisateur·ices. L'objectif est d'aller au-delà des simples questions d'efficacité énergétique, dont les gains sont quasi-systématiquement gommés par les effets négatifs indirects de premier ordre ou d'ordre supérieur, tels que l'effet rebond.
Encadrement et localisation
La personne recrutée sera encadrée par Fanny Dufossé, Chargée de Recherche Inria au Laboratoire d'Informatique de Grenoble, Anthony Dugois, Maître de Conférences à l'Université Marie et Louis Pasteur à Besançon, et Jean-Marc Nicod, Professeur des Universités à SUPMICROTECH, également à Besançon. Le ou la doctorant·e sera intégré·e au département AS2M de l'institut FEMTO-ST à Besançon, mais sera aussi amené·e à se déplacer ponctuellement à Grenoble.
Porté par le projet SOCLOUD, ce sujet de thèse correspond à l'un des workpackages du projet. Ainsi, les travaux de la personne recrutée ne s'inscriront pas uniquement dans le périmètre du sujet mais participeront au projet dans son ensemble ; des collaborations se tisseront au fur et à mesure avec les autres membres du projet, et en particulier avec les deux autres thèses prévues dans le projet. Des ateliers seront organisés régulièrement chez les partenaires du consortium (Besançon, Grenoble et Toulouse) afin de faire avancer le projet dans sa globalité.
Mission confiée
Comme de nombreux secteurs économiques, les Technologies de l'Information et de la Communication contribuent à exercer une pression considérable sur les limites planétaires, une tendancequi ne fait que s'accentuer. Les data centers sont particulièrement concernés : leur consommation enénergie, et aussi en eau et en métaux via le renouvellement des machines, ne cesse de croître. De nombreux travaux, aussi bien académiques qu'industriels, se sont penchés sur leur efficacité énergétique,que ce soit au niveau hardware, en améliorant progressivement chacun des composants individuels,ou au niveau software, par exemple en optimisant l'allocation des ressources. Pourtant, les effetsnégatifs indirects et systémiques, tels que l'effet rebond, conduisent à une augmentation de laconsommation énergétique malgré tous ces efforts.
Le projet ANR SOCLOUD cherche à dépasser cette vision purement technosolutionniste en étudiant les conditions de mise en oeuvre d'un data center sobre. La sobriété ne se limite pas à l'aspecttechnique : elle englobe également la dimension des usages, en impliquant et en responsabilisant lesutilisateur·ices vis-à-vis des problématiques de gestion des ressources. Une manière d'appréhender un tel data center est de s'appuyer sur le concept d'« outil convivial » proposé par le philosopheIvan Illich dans les années 70 : un tel outil est respectueux des limites planétaires avec desrègles d'utilisation intelligibles et facilement explicables, ouvert et transparent dans ses décisions etcompromis, équitable dans les usages, et enfin il ne génère pas de dépendance irréversible.
Parmi les composants de la pile logicielle d'un data center, les gestionnaires de ressources (qu'ils'agisse d'ordonnanceurs ou d'orchestrateurs) font l'objet d'une recherche intensive, visant à déterminer la meilleure manière d'allouer CPU/GPU, RAM ou bande passante selon un ouplusieurs critères objectifs. Les problèmes d'ordonnancement, qui constituent une classe particulièrede problèmes d'allocation de ressources, sont ainsi étudiés depuis les années 60. Dans le contextedes data centers, la majorité des travaux se concentrent sur l'efficacité et la qualité de service, quipeuvent prendre différentes formes (e.g., minimisation du makespan, du flow time moyen, ou dunombre de tâches en retard vis-à-vis d'une date butoire), mais dont la finalité reste identique :allouer des tâches ou des requêtes de manière à maximiser l'utilisation de la plateforme tout ensatisfaisant au mieux les besoins des utilisateur·ices. La question de l'efficacité énergétique est parfois prise en compte, mais généralement comme critère secondaire, et sans jamais remettre enquestion les usages qui se cachent derrière l'exécution des requêtes.
Plusieurs études ont cherché à s'affranchir de cette vision purement utilitariste en questionnantla pertinence de la recherche systématique d'une solution optimale, une démarche extrêmementcoûteuse pour des gains rarement spectaculaire comparés à des approches plus simples-et de toutefaçon gommés par la variabilité des conditions d'opération d'un système aussi complexe qu'un datacenter. Ainsi la recherche d'une solution robuste plutôt qu'optimale est à privilégier. Il s'agitd'établir des garanties sur la qualité de la solution compte tenu des incertitudes sur les paramètresd'entrée du problème. Classiquement on considère un ensemble de scénarios possibles et onrecherche une solution qui ne sera jamais mauvaise, même pour le pire des scénarios.
D'autres études s'intéressent à la question de l'équité, qu'elle porte sur les tâches elles-mêmes(e.g., critère de minimisation du ralentissement) ou sur les utilisateur·ices, en adaptant destechniques de théorie des jeux à l'ordonnancement. Certains travaux se sont ainsi penchés sur l'ordonnancement « multi-acteurs », où plusieurs agents cherchent à exécuter leurs tâches en optimisantchacun un critère qui leur est propre, l'objectif étant de trouver un compromis satisfaisantpour une majorité d'entre eux. D'autres travaux envisagent des agents coopératifs, disposés à mettreen commun leurs ressources afin d'améliorer la qualité de service de chacun d'entre eux.Objectifs de la thèseLe but de cette thèse est de concevoir des mécanismes d'allocation de ressources, présentant des garanties formelles sur des propriétés traduisant ou étendant le concept de \og convivialité\fg\ (au sens d'Illich) au contexte des data centers: efficience, équité, résilience, explicabilité, robustesse, etc. Pour ce faire, de nombreuses techniques de conception et d'analyse issues de l'optimisation combinatoire et de la théorie algorithmique des jeux pourront être mobilisées ; on pourra par exemple s'inspirer des algorithmes d'approximation (étude de compétitivité, augmentation de ressources, analyse primale-duale, etc.), de l'\textbf{optimisation stochastique ou robuste} (objectif en moyenne, caractérisation de scénarios, optimisation du min-max regret, etc.), de l'optimisation multi-objectifs}(recherche de l'ensemble Pareto-optimal) ou encore des \textbf{mécanismes d'allocation équitable} (recherche de solutions envy-free, étude du Price of Fairness, etc.). Dans un premier temps, des approches simples---telles que des algorithmes gloutons---seront étudiées sur des problèmes d'ordonnancement basiques et peu contraints, afin d'établir un cadre théorique permettant de valider, quantifier ou estimer dans quelle mesure un algorithme est \og convivial\fg\ vis-à-vis d'une communauté d'utilisateur·ices. Si l'on peut raisonnablement supposer qu'aucune approche ne satisfera simultanément l'ensemble des critères de convivialité, certaines stratégies seront vraisemblablement plus à même d'en vérifier certains plutôt que d'autres. L'un des objectifs est donc de concevoir un outil analytique (prenant par exemple la forme d'une matrice de propriétés) permettant de classer les algorithmes d'allocation selon ces critères. Dans un second temps, il s'agira de trouver comment exploiter un ensemble d'indicateurs liés à l'état de la plateforme (e.g., mix énergétique disponible, vieillissement des machines, congestion ou charge instantanée, etc.) dans la prise de décision, mais également d'étudier l'impact de ceux-ci sur le comportement et les usages des utilisateur·ices. Ces indicateurs pourront par exemple être traduits en recommandations, quotas, ou incitations, dans l'objectif d'impliquer directement les utilisateur·ices dans les choix d'allocation. Ce faisant, on cherchera à rendre visibles les conséquences de l'utilisation du data center.
Principales activités
Principales activés :
- Concevoir des algorithmes de gestion de ressources satisfaisant des propriétés de convivialité, et identifier les classes d'algorithmes associées à chaque combinaison de propriétés vérifiées;
- Identifier et quantifier les compromis inévitables entre certaines paires de propriétés;
- Comparer des algorithmes simples avec des approches plus sophistiquées, mais potentiellement moins flexibles ou moins résilientes;
- Étudier comment intégrer la notion d'usage au sein de l'analyse algorithmique, dans le but de prévenir les externalités négatives et les effets rebond;
- Exploiter des indicateurs sur l'état de la plateforme afin d'enrichir la prise de décision et/ou la modélisation du comportement des utilisateur·ices.
Avantages
Contacter le recruteur.