GCC optimization/es

This guide provides Article description::an introduction to optimizing compiled code using safe, sane CFLAGS and CXXFLAGS . It also as describes the theory behind optimizing in general.

¿Qué son CFLAGS y CXXFLAGS?
Las variables de entorno CFLAGS y CXXFLAGS son las que se utilizan convencionalmente para especificar opciones de compilación en un sistema de construcción cuando se compila código C y C++. Aunque estas variables no están estandarizadas, su utilización es esencialemente ubicua y cualquier construcción escrita correctamente debería interpretarlas de forma adecuada para el paso de opciones extra o personalizadas cuando se invoca el compilador. Leer la página info de GNU make para obtener una lista de las variables más comúnmente utilizadas en esta categoría.

Debido a que gran parte de los paquetes que se utilizan en los sistemas Gentoo están escritos en C y C++, existen dos variables que los administradores definitivamente querrán configurar adecuandamente ya que tienen gran influencia en la forma en que se construye el sistema.

Pueden usarse para disminuir la cantidad de mensajes de depuración de un programa, aumentar los niveles de aviso de errores, y por supuesto, optimizar el código producido. El manual de GCC ofrece una lista completa opciones disponibles y sus aplicaciones.

¿Cómo se utilizan?
Normalmente, se deberían definir CFLAGS y CXXFLAGS en el entorno cuando se invoque un guión o en los ficheros makefile generados por el programa. En los sistemas basados en Gentoo, se la variables CFLAGS y CXXFLAGS se definen en. Las variables definidas en este fichero se exportarán al entorno de los programas invocados por portage de modo que todos los paquetes se compilarán usando estas opciones como base.

Como se puede observar en el ejemplo de arriba, CXXFLAGS se define para usar todas las opciones presentes en CFLAGS. La mayoría de los sistemas se configurarán de este modo. Las opciones adicionales de CXXFLAGS son menos comunes y normalmente no se aplican de modo tan general como para ser definidas globalmente.

Confusiones
Aunque el hecho de activar algunas optimizaciones de la compilación en CFLAGS puede ser muy efectivo a la hora de producir binarios pequeños o más rápidos, pueden también deteriorar la función del código, inflar su tamaño, ralentizar su tiempo de ejecución o simplemente causar un fallo en la construcción. El momento en el que se empieza a notar la bajada en el rendimiento se alcanza más rápidamente cuando se modifica CFLAGS. No ajuste estas opciones de forma arbitraria.

Recuerde, la variable global CFLAGS configurada en se aplicará a todo paquete del sistema de modo que los administradores normalmente definirán opciones generales de amplia aplicación. Los paquetes individuales modificarán a continuación estas opciones bien en su ebuild o en el propio ebuild del sistema para generar el conjunto de ajustes que se utilizarán cuando se lance el compilador.

¿Preparado?
Conociendo los riesgos involucrados, echemos un vistazo a algunas optimizaciones sanas y seguras para su computadora. Esto le será útil y también alentador para los desarrolladores la próxima vez que se informe de un problema en Bugzilla. (Los desarrolladores suelen pedir al usuario que recompile un paquete con los CFLAGS mínimos para ver si el problema persiste. Recuerde: ¡Las opciones agresivas pueden arruinar el código!)

Conceptos básicos
El objetivo de usar CFLAGS y CXXFLAGS es crear código específico para el sistema; debería funcionar perfectamente y ser ligero y rápido, si es posible. Algunas veces estás condiciones son mutuamente excluyentes, de modo que esta guía trabaja con combinaciones que se sabe que funcionan bien. Idealmente, las mejores están disponibles para cada arquitectura de CPU. Se cubren más adelante, a modo de información, ajustes más agresivos. No se discuten todas las opciones listadas en el manual de GCC, sin embargo se revisarán las opciones más comunes.

-march
The first and most important option is. This tells the compiler what code it should produce for the system's processor architecture (or arch); it tells GCC that it should produce code for a certain kind of CPU. Different CPUs have different capabilities, support different instruction sets, and have different ways of executing code. The  flag will instruct the compiler to produce specific code for the system's CPU, with all its capabilities, features, instruction sets, quirks, and so on provided the source code is prepared to use them. For instance, to take benefit from AVX instructions, the source code needs to be adapted to support it.

is an ISA selection option; it tells the compiler that it may use the instructions from the ISA. On an Intel/AMD64 platform with  or lower OPT level, the code will likely end up with AVX instructions used but using shorter SSE XMM registers. To take full advantage of AVX YMM registers, the,   or   options should be used as well.

is an optimization option (default at  and  ), which attempts to vectorize loops using the selected ISA if possible. The reason it isn't enabled at  is that it doesn't always improve code, it can make code slower as well, and usually makes the code larger; it really depends on the loop etc.

Even though the CHOST variable in specifies the general architecture used,   should still be used so that programs can be optimized for the system specific processor. x86 and x86-64 CPUs (among others) should make use of the  flag.

¿Qué tipo de CPU tiene el sistema? Para averiguarlo, ejecute la siguiente orden:

or even install and add the available CPU-specific options to the  file, which the tool does through e.g. the CPU_FLAGS_X86 variable:

Para obtener más detalles, incluyendo valores  y   se pueden utilizar dos órdenes.


 * La primera orden le indica al compilador que no realice ningún enlazado y en lugar de interpretar la opción   para clarificar las opciones de la línea órdenes, ahora muestra si ciertas opciones están habilitadas o deshabilitadas . En este caso, las opciones mostradas son las que se han habilitado para el objetivo seleccionado


 * La segunda orden muestra las directivas de compilación para construir el fichero cabecera pero sin realmente realizar los pasos y en su lugar mostrarlos en pantalla . La línea de salida final es la orden que mantiene todas las opciones de optimización y selección de arquitectura:

Ahora veamos a  en acción. Este ejemplo es para un antiguo Pentium III:

Aquí hay otro para una CPU AMD de 64 bits:

Si no se puede determinar el tipo de CPU o si e usuario no sabe que ajustes elegir, es posible utilizar el ajuste. Al usarla, GCC intentará detectar el procesador y automáticamente usará las opciones apropiadas. ¡Sin embargo, no se debe utilizar esto si se quiere compilar paquetes para CPUs diferentes!

Si se está compilando paquetes en una computadora, para ejecutarlos en una computadora diferente (usando, por ejemplo, una computadora rápida para construir paquetes para una máquina más antigua y lenta), entonces no utilice la opción. La palabra "native" significa que el código producido podrá ejecutarse solamente en ese tipo de CPU. Las aplicaciones construidas con  en una CPU AMD Athlon 64 CPU no podrán ejecutarse en una CPU VIA C3 más antigua.

También están disponibles las opciones  y. Cada una de ellas solo se usará cuando no haya otra opción  disponible. Ciertas arquitecturas de procesador pueden requerir  o incluso de. Desgraciadamente, el comportamiento de GCC no es muy consistente con la manera que cada opción se comporta de una arquitectura a otra.

En CPUs x86 y x86-64,  se generará código específico para esa CPU usando sus instrucciones disponibles y el ABI correcto; no tendrá compatibilidad hacia atrás para CPUs antiguas o diferentes. Se puede considerar el uso de  cuando se genere código para CPUs antiguas como i386 e i486. produce un código más genérico que ; aunque afinará el código para cierta CPU, no se tendrán en cuenta los conjuntos de instrucciones disponibles y ABI. No utilice la opción  en sistemas x86 o x86-64, ya que es obsoleto para estas arquitecturas.

Only non-x86/x86-64 CPUs (such as SPARC, Alpha, and PowerPC) may require  or   instead of. On these architectures,  /   will sometimes behave just like   (on x86/x86-64) but with a different flag name. Again, GCC's behavior and flag naming is not consistent across architectures, so be sure to check the GCC manual to determine which one should be used.

-O
Hablaremos ahora de la variable. Esta variabe controla el nivel de optimización de todo el código. Al cambiar este valor, la compilación de código tomará algo más de tiempo, y utilizará mucha más memoria, especialmente al incrementar el nivel de optimización.

There are seven  settings: ,  ,  ,  ,  ,  , and. Only use one of them in.

A excepción de, la configuración de   activa varias opciones adicionales, así que asegúrese de leer el capítulo del manual de gcc en opciones de optimización para aprender qué opciones se activan en cada nivel  , así como algunas explicaciones sobre lo que hacen.

Examinemos cada nivel de optimización:


 * : Este nivel (que consiste en la letra "O" seguida de un cero) desconecta por completo la optimización y es el predeterminado si no se especifica ningún nivel  en CFLAGS o CXXFLAGS . El código no se optimizará. Esto, normalmente, no es lo que se desea.


 * : El nivel de optimización más básico. El compilador intentará producir un código rápido y pequeño sin tomar mucho tiempo de compilación. Es básico, pero conseguirá realizar correctamente el trabajo.


 * : A step up from . The recommended level of optimization unless the system has special needs.   will activate a few more flags in addition to the ones activated by  . With , the compiler will attempt to increase code performance without compromising on size, and without taking too much compilation time. SSE or AVX may be be utilized at this level but no YMM registers will be used unless   is also enabled.


 * : the highest level of optimization possible. It enables optimizations that are expensive in terms of compile time and memory usage. Compiling with   is not a guaranteed way to improve performance, and in fact, in many cases, can slow down a system due to larger binaries and increased memory usage.   is also known to break several packages. Using   is not recommended. However, it also enables   so that loops in the code get vectorized and will use AVX YMM registers.


 * : Optimizará el tamaño del código. Activa todas las opciones de  que no incrementan el tamaño del código generado. Es útil para máquinas con capacidad limitada de disco o con CPUs que tienen poca caché.


 * : En GCC 4.8 aparece un nuevo nivel del optimización general: . Trata de solucionar la necesidad de realizar compilaciones más rápidas y obtener una experiencia superior en la depuración a la vez que ofrece un nivel razonable de rendimiento en la ejecución. La experiencia global en el desarrollo debería ser mejor que para el nivel de optimización  . Observe que   no implica , éste simplemente deshabilita optimizaciones que podrían interferir con la depuración.


 * : Nuevo en GCC 4.7. Consiste en el ajuste  más las opciones ,   y  . Esta opción rompe el cumplimiento de estándares estrictos y no se recomienda su utilización.

Como se comentó anteriormente,  es el nivel de optimización recomendado. Si un paquete muestra errores de compilación, se debe comprobar que no se está usando. Como otra opción se puede probar a configurar CFLAGS y CXXFLAGS a un nivel de optimización inferior, como  o incluso   (para informar de errores y comprobar posibles problemas).

-pipe
Una opción común es. No tiene efecto sobre el código que se produce, pero hace que el proceso de compilación sea más rápido. Indica al compilador que use tuberías en lugar de archivos temporales durante los diferentes estados de compilación, lo cual usa más memoria. En sistemas con poca memoria, el proceso GCC se podría terminar por el sistema En estos casos no se debe utilizar esta opción.

-fomit-frame-pointer
Esta es una opción muy común diseñada para reducir el tamaño del código generado. Está activada para todos los niveles de  (excepto  ) en arquitecturas donde no interfiera con la depuración (como x86-64), pero puede que haga falta activarla. En ese caso, se debe añadir a las opciones. Aunque el manual de GCC no especifica todas las arquitecturas, se activa mediante la opción. Todavía es necesario habilitar explícitamente la opción. Para activarla en una arquitectura x86-32 con GCC hasta la versión 4.6 o cuando se utilice  en x86-32 con cualquier versión de GCC. Sin embargo, al usar  la depuración será algo difícil o incluso resultará imposible.

En particular, provoca que la localización de problemas en aplicaciones escritas en Java sea mucho más complicada, aunque Java no es el único código afectado al usar esta opción. Así, aunque esta opción puede ayudar, la depuración será complicada. En particular, las trazas de ejecución (backtraces) no servirán de mucho. Cuando no se haga depuración de software y no se ha añadido ninguna otro ajuste CFLAGS relacionado con la depuración como  entonces intente usar.

-msse, -msse2, -msse3, -mmmx, -m3dnow
These flags enable the Streaming SIMD Extensions (SSE), SSE2, SSE3, MMX, and [https://en.wikipedia.org/wiki/3DNow! 3DNow!] instruction sets for x86 and x86-64 architectures. These are useful primarily in multimedia, gaming, and other floating point-intensive computing tasks, though they also contain several other mathematical enhancements. These instruction sets are found in more modern CPUs.

Normalmente no se necesita añadir ninguna de estas opciones a mientras el sistema esté utilizando la   correcta (por ejemplo,   implica  ). Algunas excepciones notables son las nuevas CPUs VIA y AMD64 que soportan instrucciones no implicadas por  (como SSE3). Para CPUs como estas, se necesita habilitar opciones adicionales donde sea necesario después de verificar la salida de.

Sin embargo, ¡Consigo mejor rendimiento con -funroll-loops -fomg-optimize!
No, la gente piensa que lo hacen porque alguien les ha convencido de que es mejor utilizar el mayor número de opciones. Las opciones agresivas solo dañarán las aplicaciones cuando use un sistema completo. Incluso el manual de GCC dice que usar  y   hará que el código ocupe más espacio y que corre más lento. Aunque por alguna razón, estas dos opciones, junto con,  ,  , y similares, continúan siendo muy populares entre pardillos que creen saber más que nadie.

La verdad es que son opciones peligrosamente agresivas. Eche un vistazo a los Foros de Gentoo y a Bugzilla para ver que hacen estas variables: ¡Nada bueno!

Estos ajustes no son necesarios globalmente en CFLAGS o en CXXFLAGS. Solo dañarán el rendimiento. Podría incluso dar pie a pensar de que se está corriendo un sistema de alto rendimiento con el software más actual, pero no hará más que inflar el código y marcar sus informes de error como INVALID o WONTFIX.

No se necesitan opciones peligrosas como estas. No las utilice. Quédese con las básicas:,   y.

¿Qué pasa con los niveles -O mayores que 3
Algunos usuarios alardean de que obtienen mejor rendimiento usando,   y similares, pero la realidad es que niveles de   mayores que 3 no tienen efecto. El compilador puede aceptar CFLAGS como, pero realmente no hace nada con él. Solo realiza la optimización para, nada más.

¿Necesita más pruebas? Eche un vistazo al código fuente:

Como se puede observar, cualquier valor mayor que 3 se trata como.

¿Qué ocurre cuando compilamos fuera de la máquina destino?
Algunos lectores se pueden preguntar si el hecho de compilar fuera de la máquina destino usando una CPU estrictamente inferior o una subarquitectura en GCC generará unos resultados de optimización inferiores. La respuesta es simple: No. Independientemente del hardware en el que realmente se realiza la compilación y el CHOST con el que se construyó GCC, si se utilizan los mismos argumentos (excepto para ) y la misma versión de GCC (aunque la versión menor puede ser distinta), las optimizaciones resultantes son estrictamente las mismas.

Como ejemplo, si Gentoo se instala en una máquina en el que el CHOST de GCC es i686-pc-linux-gnu, y se utiliza un servidor Distcc/es en otro equipo en el que el CHOST de GCC es i486-linux-gnu entonces no hay porqué preocuparse de que los resultados sean menos óptimos ya que la subarquitectura del compilador o el hardware del equipo remoto son estrictamente inferiores. El resultado sería igual de óptimo que una construcción en una máquina nativa siempre que se pasen las mismas opciones a ambos compiladores (y no se defina el argumento  como  ). En este caso en particular se necesita especificar la aquitectura destinotal y como se indica en Distcc y -march=native.

La única diferencia en el comportamiento entre dos versiones de GCC construidas con diferentes subarquitecturas es el valor implícito por defecto para el parámetro  que se deriva del CHOST de GCC cuando no se ha indicado uno de forma explícita en la línea de órdenes.

¿Qué pasa con las opciones redundantes?
A menudo CFLAGS y CXXFLAGS que se han activado en varios niveles de  están especificadas de forma redundante en. A veces esto ocurre por ignorancia, pero también se hace para permitir el filtrado o el reemplazo de opciones.

El filtrado y el reemplazo de opciones se realiza en muchos ebuilds del árbol Portage. Normalmente se realiza debido a que algunos paquetes no compilan con determinados niveles  o cuando el código fuente es tan sensible que no se pueden utilizar opciones adicionales. El ebuild bien filtrará algunas opciones o todas las opciones CFLAGS y CXXFLAGS, bien reemplazará  con un nivel diferente.

El Manual del Desarrollador de Gentoo indica dónde y cómo funciona el filtrado y el reemplazo de opciones.

Es posible evitar el filtrado de  filtrando mediante el listado redundante de opciones para un cierto nivel, como , haciendo cosas como:

Sin embargo, hacer esto no es algo acertado. ¡Las CFLAGS se filtran por alguna razón! Cuando estas opciones se filtran es porque es inseguro construir paquetes con ellos. Claramente, no es seguro compilar el sistema completo con  si alguna de estas opciones está activada para este nivel causará problemas con ciertos paquetes. Por lo tanto, no intente "saber más" que los desarrolladores que mantienen estos paquetes. Confíe en ellos. ¡El filtrado y reemplazo se realiza para garantizar la estabilidad del sistema y de las aplicaciones!. Si un ebuild especifica opciones alternativas, entonces no intente evitarlas.

Si se construyen paquetes con ajustes inaceptables lo más probable es que aparezcan los problemas. Cuando se informe de problemas en Bugzilla, los ajustes que se utilizan en serán visibles rápidamente y los desarrolladores pedirán la recompilación sin esos ajustes. ¡Evite el engorro que supone recompilar no utilizando ajustes redundantes!. No asuma automáticamente que sabe más que los desarrolladores.

¿Qué pasa con LDFLAGS?
Los desarrolladores de Gentoo ya han configurado LDFLAGS básicas y seguras en los perfiles base, de tal manera que no se necesita cambiarlas.

¿Puedo usar opciones para cada paquete?
Puede encontrarse información acerca de como utilizar las variables de entorno por paquete (incluyendo CFLAGS ) en el manual de Gentoo "Variables de entorno por paquete".

External resources
Los siguientes recursos pueden ser de ayuda para comprender la optimización:


 * La documentación en línea de GCC




 * Wikipedia


 * Los Foros de Gentoo