GCC optimization/fr

Ce guide est une introduction à l'optimisation de code compilé en recourant à des variables CFLAGS et CXXFLAGS saines. Il présente aussi la théorie sousjacente à l'optimisation en général.

Introduction
Que sont les variables CFLAGS et CXXFLAGS ?

CFLAGS et CXXFLAGS sont des variables d'environnement utilisées pour dire aux compilateurs de la collection GNU,, quels types de commutateurs utiliser lors de la compilation du code source. CFLAGS concerne le code écrit en C, tandis que CXXFLAGS concerne le code écrite en C++.

Elles peuvent être utilisées pour diminuer le nombre de messages de débogage pour un programme, augmenter le niveau d'alerte, et bien-sûr, optimiser le code produit. Le manuel de gcc (en anglais) tient à jour une liste exhaustive des options disponibles et de leurs objectifs.

Comment sont-elles utilisées ?
Les variables CFLAGS et CXXFLAGS peuvent être utilisées de deux façons. Premièrement, elles peuvent être utilisées par programme dans des Makefiles générés par automake.

Cependant, ceci ne devrait pas être fait lors de l'installation de paquets provenant de l'arbre de Portage. Au lieu de cela, définissez vos variables CFLAGS et CXXFLAGS dans le fichier. De cette manière, tous les paquets seront compilés en utilisant les options que vous y aurez définies.

CFLAGS in /etc/portage/make.conf

Comme vous pouvez le voir, CXXFLAGS est définie pour utiliser toutes les options présentes dans CFLAGS. C'est ce que vous devriez faire sans risque la plupart du temps. Vous ne devriez jamais spécifier des options additionnelles dans CXXFLAGS.

Erreurs de conception
ALors que CFLAGS et CXXFLAGS peuvent être un moyen efficace de produire des binaires plus compacts et/ou plus rapides, elles peuvent aussi empêcher votre code de fonctionner, augmenter sa taille, ralentir son exécution et même causer des erreurs de compilation.

Les options de CFLAGS ne sont pas une baguette magique ; elles ne feront pas tourner votre système plus vite ou ne réduiront pas la taille de vos binaires automatiquement. Ajouter de plus en plus d'options dans l'espoir d'optimiser votre système est une recette garantie d'échec. Il y a un point à partir duquel les retours seront négatifs.

Malgré toute la vantardise que vous trouverez sur Internet, des options de  CFLAGS et CXXFLAGS agressives créeront du tort à vos programmes plus qu'elles ne leur feront de bien. Souvenez-vous que ces options ont été conçues pour être employées à des endroits précis pour des  objectifs précis. La simple raison qu'une option particulière de CFLAGS est profitable à un morceau de code, ne signifie pas qu'elle convient à n'importe quelle programme  que vous installerez sur votre machine !

Prêt ?
Maintenant que vous avez pris conscience des risques potentiels, jetons un coup d'œil à quelques optimisations saines et sûres pour votre ordinateur. Elles vous maintiendront en bons termes avec les développeurs la prochaine fois que vous rapporterez un problème sur Bugzilla. (Les développeurs vous demanderont généralement de recompiler un paquet avec des options de la variable CFLAGS minimales, pour voir si le problème subsiste. Souvenez-vous que des options agressives peuvent causer du tort à votre code.)

Les bases
L'objectif derrière l'utilisation des options des variables CFLAGS et CXXFLAGS est de créer un code parfaitement adapté à votre système ; il devrait fonctionner parfaitement tout en étant aussi compact et rapide que possible. Parfois, ces conditions sont incompatibles entre elles, c'est pourquoi nous nous en tiendrons à des combinaisons réputées pour bien fonctionner. Idéalement, elles sont les meilleurs disponibles pour toute architecture de processeur. Nous parlerons des options agressives plus tard, ainsi vous saurez à quoi vous en tenir. Nous ne discuterons pas chacune des options listées dans le manuel de   (elles sont des centaines), mais nous couvrirons les options les plus basiques et courantes.

-march
La première, et la plus importante, option est. Elle dit au compilateur quel code il devrait produire pour votre architecture de processeur (ou arch) ; elle dit qu'il devrait produire du code pour un certain type de processeur. Des processeurs différents ont des aptitudes différentes, prennent en charge différents jeux d'instructions et ont des manières différentes d'exécuter le code. L'option  renseigne le compilateur pour qu'il produise le code spécifique à votre processeur, en tenant compte de toutes les aptitudes, fonctionnalités, jeux d'instructions, comportements, etc. de ce processeur.

Même si la variable CHOST dans le fichier spécifie l'architecture générale utilisée,   devrait quand même être utilisée pour que les programmes soient optimisés pour votre processeur spécifique. Les processeur x86 et x86-64 (parmi d'autres) devrait utiliser l'option.

De quel type de processeur disposez-vous ? Pour le trouver, exécutez la commande suivante :

Pour avoir plus de détails, y compris sur les valeurs march et mtune, utilisez :

Maintenant, regardons l'option   en action. Ceci est un exemple pour un ancien Pentium III :

/etc/portage/make.conf: Pentium III

En voici un autre pour un processeur AMD 64-bit :

/etc/portage/make.conf: AMD64

S'il vous reste un doute quand au type de votre processeur, vous pouvez utiliser l'option. Lorsque cette option est utilisée, GCC détecte automatiquement votre processeur et positionne lui-même les options appropriées pour ce processeur. Néanmoins, celle-ci ne devrait pas être utilisée si votre intention est de compiler des paquets pour un autre processeur !

Si vous compilez des paquets sur un ordinateur, mais avez l'intention les exécuter sur un autre (comme c'est parfois le cas lorsqu'on compile sur un ordinateur récent et rapide pour un ordinateur plus ancien et plus lent), alors n'utilisez pas l'option. Native signifie que ce code s'exécutera seulement  sur ce type de processeur. Les applications compilées avec l'option  sur un processeur AMD Athlon 64 ne pourront pas tourner sur un ancien processeur VIA C3.

Sont aussi disponibles, les options  et. Ces options sont normalement utilisées quand il n'y a pas d'option  disponible ; certaines architecture de processeur peuvent demander les options  ou même. Malheureusement, le comportement de  n'est pas très cohérent sur la manière d'interpréter une option d'une architecture à une autre.

Sur les processeurs x86 et x86-64,  produira un code spécifique pour ce type de processeur en utilisant tout le jeu d'instructions disponibles et l'ABI (Application Binary Interface) correcte ; il n'y aura pas de rétrocompatibilité pour des processeurs plus anciens ou différents. Si vous n'avez pas besoin d'exécuter le code sur autre chose que le système sur lequel vous faites tourner Gentoo, continuez à utiliser. Vous devriez seulement considérer l'utilisation de   pour le cas où vous avez besoin de générer du code pour un processeur plus ancien comme les i386 et I486. produit un code plus générique que march  ; bien qu'il adapte le code pour un certain processeur, il ne prend pas en compte l'ensemble du jeu d'instructions et de l'ABI. N'utilisez pas   sur des systèmes x86 ou x86-64,  car cette option est maintenant déconseillée pour ces architectures.

Seuls les processeurs non x86/x-86-64 (comme Sparc, Alpha et PowerPC) peuvent nécessiter  ou   plutôt que. Sur ces architectures, /   donneront parfois des résultats identiques à ceux fournis par   (sur x86/x86-64)... mais avec un nom d'option différent. Là encore, le comportement de   et le nommage des options n'est pas cohérent à travers les différentes architectures, c'est pourquoi, vous devez consulter le des options  de    pour déterminer laquelle utiliser pour votre système.

-O
Vient ensuite l'option. Elle contrôle le niveau global d'optimisation. Ceci rend le temps de compilation quelque peu plus long, et peut nécessiter plus de mémoire, en particulier si vous augmentez le niveau d'optimisation.

Il y a 5 réglages de  :  ,   ,   ,   ,  ,  , and. Vous ne devriez en utiliser qu'un dans.

À l'exception de  ,les réglages de   activent chacun une série d'options additionnelles, c'est pourquoi vous devriez lire le chapitre sur les  options d'optimisation dans le manuel de  gcc, pour connaître les options qui sont activées par chacun des niveaux de   , et des explications sur ce qu'elles font.

Examinons les différents niveaux d'optimisation :


 * : ce niveau (la lettre O suivi du chiffre 0 ) supprime complètement toute optimisation et est la valeur par défaut si un aucune option  n'est précisée dans  CFLAGS ou CXXFLAGS. Ceci diminue le temps de compilation et peut améliorer les informations de débogage, mais quelques applications ne fonctionneront pas correctement sans que l'optimisation ne soit activée. Cette option n'est pas recommandée sauf dans un but de débogage.


 * : C'est le niveau d'optimisation le plus basique. Le compilateur va essayer de produire un code plus rapide et plus compact sans prendre trop de temps de compilation. C'est très basique mais ça fait toujours le travail.


 * : Un échelon au-dessus de   . C'est le niveau recommandé d'optimisation  si vous n'avez de besoin  spécifique.    active quelques options de plus que   . Avec  , le compilateur va essayer d'augmenter la performance sans compromettre la taille et sans prendre trop de temps en compilation.


 * : C'est le plus haut niveau d'optimisation possible. Il active des optimisations qui sont coûteuses en terme de temps de compilation et d'usage de la mémoire. Compiler tous vos paquets avec  ne garantit pas une amélioration de la performance. En réalité, dans de nombreuses situation, cela ralentit le système  à cause des binaires plus volumineux qui réclament plus de mémoire. De plus cette option est réputé casser de nombreux paquets. C'est pourquoi  utiliser     n'est pas recommandé.

4.x.'''


 * : Cette option optimise la taille de votre code. Elle active toutes les options activée par   qui n'augmentent pas la taille du code. Elle peut être utile pour des machines qui ont un espace disque très limité et/ou ont des processeurs avec un cache de petite taille.


 * : In gcc 4.8, un nouveau niveau d'optimisation général, -Og a été introduit.Il répond au besoin d'une compilation rapide et une amélioration du débogage tout en procurant un niveau de performance en exécution raisonnable.  Le ressenti en développement devrait être meilleur qu'avec le niveau d'optimisation  . Notez que   n'implique pas  , il se contente de désactiver les optimisations qui pourrait interférer avec le débogage.


 * : nouveau dans GCC 4.7, consiste en   plus ,  . Cette option brise la conformité stricte avec les normes, et n'est pas recommandée en utilisation.

Comme mentionné précédemment,  est le niveau d'optimisation recommandé. Si des erreurs de compilation se produisent, vérifiez que vous n'utilisez pas. Comme option de repli, essayez de définir un niveau d'optimisation plus faible dans CFLAGS et CXXFLAGS, comme    ou même   (pour le rapport des erreurs et la vérification de problèmes possibles) et recompilez le paquet.

-pipe
Une option commune est. Celle-ci n'a aucun effet sur le code produit, mais réduit le temps de compilation. Elle indique au compilateur d'utiliser des pipelines pendant la compilation à la place de fichiers temporaires qui requièrent plus de mémoire. Sur les systèmes avec peu de mémoire, gcc peut se retrouver tué. Dans un tel cas, n'utilisez pas cette option.

-fomit-frame-pointer
This is a very common flag designed to reduce generated code size. It is turned on at all levels of  (except  ) on architectures where doing so does not interfere with debugging (such as x86-64), but you may need to activate it yourself by adding it to your flags. Though the  manual does not specify all architectures it is turned on by using , you will need to explicitly activate it on x86, with   up to version 4.6 or when using. However, using this flag will make debugging hard to impossible.

En particulier, cela rend le dépannage des applications écrites en Java beaucoup plus difficile, même si Java n'est pas le seul code affecté par l'utilisation de cette option. C'est pourquoi même si l'option apporte des bénéfices, elle rend le débogage plus difficile ; les backtraces en particulier seront inutiles. Cependant, si vous n'envisagez pas de faire beaucoup de débogage, et n'avez pas ajouté d'autres options en rapport avec le débogage à CFLAGS comme, alors vous pouvez essayer d'utiliser.

-msse, -msse2, -msse3, -mmmx et -m3dnow
Ces options activent les jeux d'instructions SSE, SSE2 , SSE3 , MMX et  3DNow! pour les architectures x86 and x86-64. Ils sont utiles avant tout dans le multimedia, les jeux et autres applications utilisant les calculs en virgule flottante de manière intensive, bien qu'ils incluent aussi plusieurs autres améliorations mathématiques. Ces jeux d'instructions se rencontrent dans les processeurs les plus modernes.

Vous n'avez normalement pas besoin d'ajouter ces options à  tant que vous utilisez l'option   (par exemple,   implique   ). Quelques exceptions notables sont les processeurs plus récents VIA et AMD64 qui prennent en charge des instructions qui ne découlent pas de l'utilisation de    (telles que SSE3). Pour de tels processeurs, vous devrez activer des options additionnelles là ou c'est approprié après avoir vérifié la sortie de.

Mais j'obtiens de meilleures performance avec -funroll-loops -fomg-optimize !
Non, vous le pensez uniquement parce que quelqu'un vous a convaincu qu'utiliser plus d'options agressives est mieux. Les options agressives ne feront qu'endommager vos applications quand elles sont utilisées à l'échelle du système entier. Même le manuel de   dit qu'utiliser   et   rend le code plus volumineux et plus lent. Néanmoins, pour quelques obscures raisons, ces deux options, ainsi que ,  ,   et d'autres options similaires, continuent à être très populaires parmi ceux qui désirent avoir les droits les plus grands à la vantardise.

La vérité sur ce sujet, c'est qu'il y a des options dangereusement agressives. Jetez donc un coup d'œil aux forums Gentoo et à Bugzilla pour savoir ce que ces options font réellement : rien de bon !

Vous n'avez pas besoin d'utiliser ces options globalement dans CFLAGS ou CXXFLAGS. Cela ne fera que dégrader la performance. Elles peuvent vous faire penser que vous avez une haute performance en fonctionnant à la limite, mais elles ne font que faire grossir votre code et vous apporter des bogues marquées INVALID ou WONTFIX.

Vous n'avez pas besoin de telles options dangereuses. Ne les utilisez pas !. Contentez-vous de vous en tenir aux basiques : ,   et.

Que dire des niveaux -O supérieurs à 3 ?
Quelques utilisateurs se vantent même d'obtenir une meilleure performance en utilisant ,    et plus, mais en réalité, une option   d'un niveau supérieur à 3 n'a aucun effet. Le compilateur peut accepter des options telles que   pour CFLAGS, mais il n'en fait rien. Il ne cherche à optimiser que jusqu'à , rien de plus.

Vous avez besoin de preuves ? Jetez un coup d'œil au code source de    :

-O source code

Comme vous pouvez le constater, aucune valeur supérieure à  n'est prise en compte.

What about compiling outside the target machine?
Some readers might wonder if compiling outside the target machine with a strictly inferior CPU or GCC sub-architecture will result in inferior optimization results (compared to a native compilation). The answer is simple: No. Regardless of the actual hardware on which the compilation takes place and the CHOST for which GCC was built, as long as the same arguments are used (except for ) and the same version of GCC is used (although minor version might be different), the resulting optimizations are strictly the same.

To exemplify, if Gentoo is installed on a machine whose GCC's CHOST is i686-pc-linux-gnu, and a Distcc server is setup on another computer whose GCC's CHOST is i486-linux-gnu, then there is no need to be afraid that the results would be less optimal because of the strictly inferior sub-architecture of the remote compiler and/or hardware. The result would be as optimized as a native build, as long as the same options are passed to both compilers (and the  parameter doesn't get a   argument). In this particular case the target architecture needs to be specified explicitly as explained in Distcc and -march=native.

The only difference in behavior between two GCC versions built targeting different sub-architectures is the implicit default argument for the  parameter, which is derived from the GCC's CHOST when not explicitly provided in the command line.

Que dire des options redondantes ?
Très souvent des options CFLAGS et CXXFLAGS qui sont activées par des niveaux de   sont spécifiées de manière redondante dans. Quelques fois cela est fait par ignorance, mais c'est aussi fait pour éviter le filtrage d'options ou le remplacement d'options.

Le filtrage/remplacement d'options est fait dans de nombreux ebuilds de l'arbre de Portage. C'est généralement fait parce que la compilation de certains paquets échoue à certains niveaux de , ou quand le code source est trop sensible pour que des options supplémentaires soient ajoutées. L'ebuild soit filtrera quelques options de CFLAGS et CXXFLAGS, soit remplacera le niveau de   par un autre.

Le Manuel du développeur de Gentoo indique quand et comment le filtrage/remplacement d'options  fonctionne.

Il est possible de contrecarrer le filtrage de    en listant de manière redondante les options d'un certain niveau, (tel que   )  en faisant ceci :

Specifying redundant CFLAGS

Néanmoins, ce n'est pas très élégant de le faire. Les options de CFLAGS sont filtrées pour une raison ! Quand des options sont filtrées, cela signifie que ce n'est pas sûr de compiler un paquet avec de telles options. Clairement, ce n'est pas  sûr de compiler tout votre système avec l'option  si quelques unes des options activées par ce niveau sont susceptibles de provoquer des problèmes à certains paquets. En conséquence, vous ne devriez pas essayer d'être plus intelligent que les développeurs qui maintiennent ces paquets. Faites confiance aux développeurs''' ! . Le filtrage et le remplacement d'options est fait pour votre intérêt ! Si un ebuild spécifie des options alternatives, n'essayez pas de l'éviter.

Vous continuerez probablement à rencontrer des problèmes si vous compilez un paquet avec des options inacceptables. Quand vous rapportez vos problèmes sur Bugzilla, les options que vous utilisez dans  seront pleinement visibles et on vous demandera de recompiler le paquet sans ces options. Évitez d'avoir à recompiler en n'utilisant pas ces options redondantes dès l'origine ! Ne supposez pas de manière automatique que vous en savez plus que les développeurs.

Que dire de LDFLAGS ?
Les développeurs de Gentoo ont déjà défini des options de base sûres de la variable LDFLAGS dans les profils de base. Vous n'avez donc pas besoin de les changer.

Puis-je utiliser des options par paquet ?
Une information sur comment utiliser les variables d'environnement par paquet (y compris CFLAGS) est fournie dans le manuel de Gentoo, "Variables d'environnement par paquet".

Ressources
Les ressources suivantes vous seront utiles pour aller plus loin dans la compréhension de l'optimisation :


 * La documentation en ligne sur gcc


 * Le chapitre 5 du manuel d'installation de Gentoo




 * Wikipedia


 * Les forums de Gentoo