Dans cet article, je vais expliquer une petite partie des concepts utilisés dans l’article source (1), publié en 2015. Ce travail s’intéresse à certaines théories quantiques qualifiées de « supersymétriques ». Mais la véritable héroïne de l’histoire qui y est contée est une dualité que l’on peut relier à certaines ressemblances entre les champs électrique et magnétique usuels. C’est de cette dualité que nous allons parler, et la supersymétrie ne sera évoquée qu’à la marge — elle pourra faire l’objet d’un article ultérieur. Commençons donc par quelques notions d’électromagnétisme.
Naissance de la dualité électromagnétique
Au début du XIX\(^e\) siècle, les physiciens étaient intrigués par une série d’observations qui semblaient relier des phénomènes physiques en apparence totalement distincts, comme le fonctionnement des aimants et des boussoles, la nature des éclairs, ou encore la propagation de la lumière. Chacun de ces phénomènes était supposé régi par ses lois propres, parfois complexes, et que l’on comprenait plus ou moins bien. Il était alors impensable que tous ces phénomènes puissent être différentes réalisations d’une seule et même théorie sous-jacente, à la fois beaucoup plus puissante et beaucoup plus simple. C’est pourtant le tour de force qui fut accompli au cours du demi-siècle suivant, et qui culmina en 1873 avec la publication par Maxwell de sa théorie de l’électromagnétisme, au prix, il est vrai, de l’introduction de notions mathématiques plus avancées. Le rôle central y est joué par deux champs, les champs électrique \(\vec{E}\) et magnétique \(\vec{B}\). Lorsqu’on parle d’unification des phénomènes électriques et magnétiques, cela ne signifie pas que les deux champs sont les mêmes, ce qui n’aurait pas de sens — que deux aimants s’attirent et que les pointes métalliques favorisent la foudre sont bien deux phénomènes distincts. En revanche, une propriété stupéfiante de la théorie de Maxwell est que les deux champs y jouent des rôles symétriques : par exemple, un champ magnétique variable donne naissance à un champ électrique (ainsi, agiter un aimant devant un fil électrique fait circuler un courant dans le fil), et réciproquement un champ électrique variable donne naissance à un champ magnétique (l’aiguille d’une boussole s’agite à proximité d’un fil parcouru par un courant alternatif). Ceci est décrit par deux des équations de Maxwell dans le videa :
$$
\begin{cases}
\frac{\partial \vec{E}}{\partial t} = \vec{\mathrm{rot}} \, \vec{B} \\
\frac{\partial \vec{B}}{\partial t} = -\vec{\mathrm{rot}} \, \vec{E} \end{cases}$$
Cette symétrie, qui échange les champs électrique et magnétique, est appelée dualité. Pendant longtemps, cette dualité ne fut considérée que comme une curiosité de la dynamique de l’électromagnétisme, c’est-à-dire la façon dont les champs électrique et magnétique évoluent dans le vide en s’influençant mutuellement. Car pour qu’une telle dynamique ait lieu, il faut bien que ces champs soient créés en premier lieu, ce qui n’est pas décrit par les équations de Maxwell dans le vide. En l’occurrence, il existe dans la nature des particules qui sont chargées électriquement (comme l’électron, chargé négativement, ou le proton, chargé positivement), c’est-à-dire qu’elles créent naturellement autour d’elles un champ électrique. Quand ces particules se mettent en mouvement, elles forment d’un point de vue macroscopique un courant électrique, capable de générer un champ magnétique. Ceci permet de comprendre tout un tas de phénomènes, de l’électricité statique aux dynamos, en passant par le chauffage par induction. Mais du point de vue de la dualité, c’est un désastre ! En effet, les champs électrique et magnétique y jouent des rôles très distincts — pour rétablir la symétrie, il faudrait qu’existent des particules chargées magnétiquement, qui créeraient un champ magnétique autour d’elles, et qui, en se déplaçant, formeraient un courant magnétique susceptible de générer à leur tour un champ électrique. Ce type de particule est assimilable à un aimant avec un seul pôle, par exemple le pôle \(+\), d’où le nom qu’on lui donne : monopôle. Las, en dépit de recherches intensives,b jamais tel énergumène n’a pu être observé dans la nature et on comprend que la dualité visible dans les équations (1) soit consignée au rang de curiosité esthétique sans grand intérêt. Certes, ce genre d’argument pourrait laisser de marbre les physiciens théoriciens, prêts à postuler l’existence des monopôles dans le but de comprendre les implications de cette hypothèse — on pourra toujours arguer que les monopôles sont une espèce très rare, disons un par galaxie, et que c’est pour cela que nous n’en avons pas trouvé ! Mais nous allons voir que des obstacles plus formidables les attendent et vont les forcer à emprunter une route bien plus exotique que tout ce qu’ils avaient pu imaginer.
Quand la physique quantique s’en mêle
Dans les années 1920, les physiciens durent se faire à l’idée : le monde est bien plus complexe — on peut même dire, sans trop s’avancer, étrange — qu’ils ne l’avaient imaginé : le monde est quantique. Mon propos n’est pas ici de m’étendre à ce sujet ; disons simplement qu’une des conséquences de la physique quantique est qu’à très petite échelle, il n’est pas possible de connaître avec précision à la fois la vitesse et la position d’une particule de masse \(m\) donnée. Plus précisément, l’incertitude sur la vitesse \(\Delta v\) et sur la position \(\Delta x\) doivent respecter l’inégalité d’Heisenberg, \(m \Delta v \Delta x \geq \frac{\hbar}{2}\), où \(\hbar\) est la constante de Planck (réduite), qui vaut environ \(\hbar = 1,1 \times 10^{-34} \, \textrm{J}\cdot \textrm{s}\). Cette constante quantifie donc l’échelle à partir de laquelle on doit utiliser la mécanique quantique pour décrire la physique. Pour tenir compte de ces différences de comportement en fonction de l’échelle, introduisons une grandeur sans dimension \(g\), rapport entre \(\hbar\) et la l’échelle caractéristique du système.c Comme \(\hbar\) est très petit dans les unités qui nous sont adaptées (le joule, la seconde), \(g \ll 1\) et les phénomènes quantiques ne se manifestent qu’à des échelles très petites par rapport à nous. À l’échelle atomique, \(g\) est plus proche de \(1\), et les phénomènes quantiques comme l’effet tunnel sont omniprésents. Un monde où \(\hbar\) serait nul (et donc \(g\) aussi) ne serait pas quantique du tout, et donc beaucoup plus simple.
Cette dernière observation est absolument cruciale, et forme la base de l’immense majorité des travaux en physique quantique. L’idée est de commencer par traiter le problème en faisant comme si \(g\) était nul, autrement dit en physique classique, ce qui est normalement beaucoup plus simple. Puis, il faut introduire les effets liés à \(g\). Cependant, comme \(g\ll 1\), on a \(g^2\ll g\), et on va d’abord ne considérer que les effets qui dépendent linéairement de \(g\). Après avoir obtenu le résultat, on fait de même avec \(g^2\), \(g^3\), etc, jusqu’à épuisement du physicien. Le résultat s’écrit alors sous la forme d’une série
$$
\textrm{Résultat} = \dots \times g^0 + \dots \times g + \dots \times g^2 + \dots \times g^3 +\cdots
$$
Ceci est appelé développement perturbatif. Par exemple, si le résultat s’écrit \(\exp (-2 \pi g)\), le développement perturbatif sera
$$
\exp (-2 \pi g) = 1 – 2 \pi \times g + 4 \pi^2 \times g^2 – 8 \pi^3 \times g^3 + \cdots\qquad\qquad\qquad(1)
$$
Le plus souvent, ce type de réponse est suffisant, mais il arrive que certaines fonctions ne puissent pas être développées de la sorte de façon efficace. Par exemple, si le résultat que l’on cherche à développer est \(\exp (-2 \pi /g)\), la procédure donne
\begin{equation}\label{equation1}
\exp \left(- \frac{2 \pi}{g}\right) = 0 + 0 \times g + 0 \times g^2 + 0 \times g^3 + \cdots
\end{equation}
ce qui est absurde ! En fait, dans un certain sens \(\exp (-2 \pi/g)\), plus toutes les fonctions que l’on peut en déduire par somme et produit, est la seule qui pose ce problème. Cela mérite donc de lui donner un nom particulier, et nous posons
$$
q= \exp \left(- \frac{2 \pi}{g}\right) \, .
$$
C’est cette variable qui est omniprésente dans l’article . Comme \(q\) n’admet pas de développement perturbatif, une expression polynomiale en \(q\) est qualifiée de non-perturbative, et c’est en général une gageure que d’obtenir ce genre d’expression.
Théorie quantique de l’électromagnétisme et de l’interaction forte
Revenons maintenant au sujet original, l’électromagnétisme, qui est une théorie classique de champs, et qui doit être corrigée à très petite échelle par des corrections quantiques, c’est-à-dire des termes contenant la constante de Planck. C’est plus facile à dire qu’à faire, et bien que les principes de base de la physique quantique aient été maîtrisés depuis les années 1920, il fallut attendre la fin des années 1940 pour que de formidables difficultés techniques soient surmontées et qu’une vision cohérente soit à portée de main, bien que de façon perturbative, sous le nom d’électrodynamique quantique (QED). Les résultats s’y expriment toujours sous une forme perturbative comparable à (1). En dépit d’incroyables succès expérimentaux, deux observations gâchent en partie la fête:
- Il n’est pas possible de faire de calculs exacts, et en outre les contributions faisant intervenir \(q\) définit plus haut sont systématiquement ignorées, même si elles existent.
- Les corrections quantiques violent la dualité électromagnétique, c’est-à-dire que les champs électrique et magnétique se comportent de façon réellement différente.
En apparence, rien de bien grave ici : en effet, dans la théorie QED où \(g\) est très petit, les termes de (1) décroissent rapidement, et un calcul qui s’arrêterait au troisième ordre, par exemple, donne déjà des résultats très précis. De surcroît, on peut évaluer que les corrections non-perturbatives restent toujours très petites, on peut donc les négliger. Quant au deuxième point, notre jugement esthétique n’a pas à interférer avec les lois de la Nature, et si la dualité n’existe pas, nous n’avons rien à ajouter. Et pourtant, l’histoire ne s’arrête pas là, il existe d’autres forces dans la nature, par exemple l’interaction forte qui agit à l’intérieur des noyaux atomiques, celle qui lie ensemble trois quarks pour former les protons et neutrons qui nous sont familiers. A priori, une théorie similaire à la QED permet de comprendre cette interaction, sauf qu’ici \(g\) est grand,d les coefficients dans le développement deviennent très grands, et les termes non-perturbatifs sont tout aussi importants ! Autrement dit, la recette qui fonctionnait peu ou prou pour la QED est inutilisable pour l’interaction forte. Il faut trouver autre chose, et le concept de dualité peut nous y aider. En mécanique quantique, les monopôles magnétiques — sous réserve d’existence — sont soumis à ce que l’on appelle la condition de quantification de Dirac, qui s’écrit, en notant \(g_e\) la grandeur \(g\) associée à l’électron et \(g_m\) celle associée au monopôle,e
$$
g_e g_m = 1 \, .
$$
Autrement dit, \(g_m = 1/g_e\). Échanger électrons et monopôles revient à changer \(g\) en \(1/g\). Or, on sait que les électrons produisent généralement des termes du type \(\exp (-2 \pi g_e)\), donc d’après la dualité, les monopôles magnétiques produiront en général des termes en \(\exp (-2 \pi g_m) = \exp (-2 \pi / g_e) = q\). Autrement dit, les monopôles magnétiques contrôlent les termes non-perturbatifs, et vice-versa.
Ainsi, dans une théorie où la dualité est exacte, si l’on comprend bien les électrons, il suffit d’appliquer la dualité, qui les transforme en monopôles, et théorie étant invariante, on comprend aussi les monopôles, et par conséquent les aspects non-perturbatifs ! Mieux encore, les résultats finaux des calculs doivent rester identiques si l’on effectue \(g \mapsto 1/g\), ce qui est une contrainte extrêmement forte. Dans certains cas, il existe un seul type de résultats satisfaisant cette contrainte, et on peut alors conclure sans faire de calcul. Cela ressemble à un tour de passe-passe, mais ça marche… à condition de connaître une théorie où la dualité est exacte. Il se trouve que nous connaissons une telle théorie, construite à partir d’un ingrédient supplémentaire, la supersymétrie. Elle ne décrit pas le monde dans lequel nous vivons, il s’agit simplement d’un modèle-jouet dans lequel il est possible de mettre en pratique le plan d’attaque évoqué au paragraphe précédent. Comme ce modèle-jouet ressemble par certains aspects à la réalité, l’espoir est qu’en le comprenant, nous pourrons progresser dans notre compréhension des lois physiques. Dans l’article , nous utilisons à de nombreuses reprises les formes modulaires afin d’élucider la structure de cette théorie-jouet. Un exemple de telles fonctions est la fonction \(j(q)\) de l’équation (C.1) de , appelée invariant de Klein,
$$
j(q) = \frac{1}{q}+744+196884 q+21493760 q^2+864299970 q^3+20245856256 q^4 + \dots
$$
dont le lecteur pourra vérifier numériquement qu’elle est bien invariante sous \(g \mapsto 1/g\), en se souvenant que \(q=\exp (-2 \pi/g)\). Mieux, un théorème garantit que les seules fonctions admettant un développement en puissances de \(q\) et vérifiant cette invariance sont les rapports de polynômes en \(j(q)\). Il suffit alors d’en connaître le comportement asymptotique (par exemple dans la limite classique \(q \rightarrow 0\), ce qui est en général assez facile) pour en déduire l’intégralité du résultat.
En guise de conclusion
Les dualités jouent depuis la fin du XX\(^e\) siècle un rôle central en physique théorique, bien au-delà du prototype qu’est la dualité électromagnétique présentée ici. L’idée sous-jacente est comme ici de décrire de deux façons différentes un seul et même système, ce qui permet au physicien de combiner plusieurs angles d’attaque pour résoudre des questions difficiles, et lui fournit parfois l’opportunité d’utiliser des outils radicalement nouveaux, comme les formes modulaires, souvent à l’origine de percées difficilement imaginables sans l’aide des dualités.
D’une certaine façon, nous pouvons être presque certains que la compréhension des phénomènes à fort couplage comme l’interaction forte à basse énergie devra faire appel à une dualité, sous une forme ou une autre, puisqu’il nous faudra dépasser les méthodes traditionnelles héritées de la QED dont nous avons évoqué l’inefficacité.
Notes
a. | ↑ | Nous utilisons dans tout cet article les unités de Planck, qui sont définies de telle sorte que la vitesse de la lumière dans le vide, la constante de Planck réduite et la permittivité électrique du vide soient normalisées à \(c = \hbar = 4 \pi \epsilon_0 = 1\). Comme nous sommes dans le vide, il n’y a ni densité de charge, ni densité de courant. |
b. | ↑ | À ce propos, on pourra consulter le chapitre intitulé Magnetic Monopoles dans la bible de la physique des particules (2). |
c. | ↑ | Ce point est subtil. Ce que j’appelle échelle caractéristique n’est pas lié uniquement à la taille du système (elle doit avoir la même unité que \(\hbar\)). Il s’agit plutôt de prendre en compte comment le système agit sur son environnement. Pour un électron, par exemple, la grandeur pertinente est la charge électrique, exprimée dans les unités de Planck. La charge de Planck étant \(e_{\textrm{Planck}} = \sqrt{4 \pi \epsilon_0 \hbar c} \approx 1,88 \times 10^{-18}\) coulombs, on a ici \(g = e/e_{\textrm{Planck}} \approx 0,085 \). En physique des particules, on utilise plus fréquemment le carré de \(g\), qui est alors appelé pour des raisons historiques la constante de structure fine, et vaut environ \(\alpha = g^2 \approx \frac{1}{137}\). |
d. | ↑ | Du point de vue physique, la différence peut se voir sur le comportement de la force en fonction de la distance. Entre un électron et un proton, la force décroît comme \(1/d^2\), où \(d\) est la distance qui les sépare. Entre deux quarks en revanche, la force est indépendante de la distance ! Pour séparer complètement deux quarks, il faudrait donc une énergie infinie. |
e. | ↑ | Pour être plus précis, Dirac a montré qu’en général, on doit avoir \(g_e g_m \in \mathbb{Z}\). La condition de quantification de Dirac s’applique donc à des monopôles de charge minimale. |