Distcc/es

Distcc es un programa diseñado para distribuir tareas de compilación a través de la red hacia máquinas participantes. Consiste en un servidor, y un programa cliente,. Distcc puede trabajar de forma transparente con ccache, Portage y Automake realizando una sencilla configuración.

Cuando planee utilizar para ayudarle a realizar el bootstrap en una instalación Gentoo, asegúrese de leer Utilizar distcc para realizar el bootstrap.

Instalación
Antes de configurar, echémos un vistazo a la instalación del paquete  en todos los equipos.

Requisitos para todos los equipos
Para utilizar, todas las máquinas en la red deben tener la misma versión de GCC. Mezclar 3.3.x (variando la x) es correcto, pero mezclar 3.3.x y 3.2.x "puede" resultar en errores en tiempo de compilación o ejecución.

Instalar el software
Distcc incluye un monitor gráfico para monitorizar las tareas que un computador está enviando para compilación. Este monitor se habilita cuando el ajuste USE  está activado.

Después de configurar el ajuste USE, instale el paquete :

Auto iniciar el demonio distcc
Para que arranque de forma automática se debe seguir las instrucciones siguientes dependiendo del sistema de inicio utilizado.

Usar OpenRC
Modifique y asegúrarse de usar la directiva   para permitir únicamente máquinas cliente de confianza. Para mayor seguridad debería utilizar también la directiva  para indicarle al demonio  en qué dirección IP debe escuchar (en sistemas con más de una dirección IP). Se puede encontrar más información acerca de seguridad en en las notas sobre seguridad de distcc.

En el siguiente ejemplo se permite a los clientes distcc correr en  y   para conectarse al servidor  que corre en la máquina local:

Ahora inicie el demonio en todas las máquinas participantes:

Usar systemd
Editar y añadir los clientes permitidos en formato CIDR. A continuación se muestra un ejemplo:

Recargar los fichero de unidad después de realizar estos cambios:

Habilitar el auto arranque de y a continuación arrancar el servicio:

Configuración
Echemos un vistazo a la configuración de.

Especificar las máquinas participantes
Utilice la orden para indicar la lista de máquinas.

A continuación se muestra una lista ejemplo de definiciones de equipos. En la mayoría de los casos, serán suficientes variaciones de las líneas 1 y 2. La última utiliza la sintaxis  para informar a  sobre el máximo número de trabajos que se deben lanzar en este nodo. Se puede encontrar más información sobre la sintaxis de las líneas 3 y 4 en la página del manual de distcc.

Hay otras formas de configurar máquinas. Eche un vistazo a la página del manual de  para obtener más información.

Si se van a realizar compilaciones en la máquina local debería escribir  en la lista de máquinas. Contrariamente, si no se va a utilizar la máquina local para compilar, omítala de la lista de máquinas. En una máquina lenta usar localhost puede de hecho hacer las cosas más lentas. Asegúrese de comprobar los ajustes para mejorar el rendimiento.

Configuraremos para que usar los equipos mencionados en la primera línea del ejemplo:

Distcc también ofrece soporte a un modo bombeo (pump) cuando se invoca la orden. Esto puede reducir de forma significativa el tiempo de construcción cuando se compilan muchos ficheros en paralelo. Se cachean las cabeceras preprocesadas en el lado servidor y, como resultado, desaparece la continua carga y preprocesado de estos ficheros cabecera.

To configure a host for pump mode, add the  suffix to the hosts definitions. Pump mode requires both  and   flags (regardless of the files being C or C++).

Usar distcc con Portage
Configurar Portage para usar es fácil. Es cuestión de habilitar la característica y definir un valor correcto para el número de trabajos simultáneos (ya que así  incrementará la cantidad de recursos disponibles para la construcción)

Ajuste la variable MAKEOPTS y la variable FEATURES tal y como se describe abajo.

Una estrategia común es
 * Definir el valor de  al doble del número total (local + remotas) de núcleos de CPU + 1, y
 * Definir el valor de  al número de núcleos de CPU locales

El uso de  en la varialble MAKEOPTS evitará lanzar demasiadas tareas cuando alguno de los equipos del cluster de  no estén disponibles (incrementando la cantidad de trabajos simultáneos en el resto de los sistemas) o cuando se configure un ebuild para no permitir construcciones en remoto (como con gcc). Esto se logra rechazando el inicio de trabajos adicionales cuando la carga del sistema están en el valor de  o por encima de éste.

Por ejemplo, cuando hay dos equipos PC anfitriones con cuatro núcleos que corren y el equipo PC local tiene una CPU con doble núcleo entonces la variable MAKEOPTS podría ser:

Cuando edite el fichero, asegúrese de que no se ha definido  en las variables CFLAGS o CXXFLAGS. no distribuirá trabajos a otras máquinas si  está definido a. El valor adecuado para  se puede obtener lanzando la siguiente orden:

Lea en línea para distcc para ampliar la información.

Usar distcc con automake
Esto es más fácil de configurar en algunos casos que con Portage. Todo lo que se necesita hacer es actualizar la variable de entorno PATH para incluir  delante del directorio que contiene. No obstante, hay un problema. Si se utiliza, entonces deberá poner la localización de después de la de :

Coloque esto en el archivo del usuario  o fichero equivalente para tener configurada la variable PATH cada vez que que el usuario entre en el sistema o defínala globlamente en un fichero en

En lugar de llamar únicamente a, agregue  (donde   es un número entero). El valor de  depende de la red y de la tipología de los computadores que se utilizan para compilar. Una aproximación heurística a los valores correctos se ha dado anteriormente en este artículo.

Utilizar distcc para realizar el bootstrap
El uso de para el inicio (esto es, construir una cadena de herramientas antes de instalar el resto del sistema) requiere realizar algunas acciones adicionales.

Paso 1: Configurar Portage
Inicie la nueva máquina con un LiveCD de Gentoo Linux y siga las instrucciones de instalación mientras se siguen las instrucciones en las FAQ de Gentoo para obtener más información sobre el bootstrap. A continuación configure Portage para que utilice :

Actualice también la variable  en la sesión de instalación:

Paso 2: Obtener distcc
Instale :

Paso 3: Configurar distcc
Lance para configurar distcc. Sustituya la cadena  del ejemplo por las direcciones IP o nombres de los nodos participantes.

¡Distcc ya está configurado para hacer bootstrap! Continúe con las instrucciones de instalación adecuadas y no olvide lanzar después de lanzar. Esto asegurará que las dependencias necesarias también se instalarán.

Extras de distcc
La aplicación tiene características adicionales y aplicaciones para dar soporte al trabajo en un entorno.

Monitores de distcc
Distcc se distribuye con dos herramientas de monitorización. La basada en texto se construye siempre y se llama. Al lanzarlo la primera puede resultar confuso, pero es muy fácil de utilizar. Si el programa se lanza sin parámetros, correrá solo una vez. Sin embargo si se le pasa un número, actualizará la información cada  segundos, donde   es el argumento indicado.

La otra utilidad de monitorización solo se habilita cuando se habilita el ajuste USE. Esta herramienta está basada en GTK+, corre en un entorno X y es bastante encantador. En Gentoo, se ha cambiado el nombre a para evitar confusiones (originalmente se llamaba ).

Para monitorizar el uso de por parte de Portage:

Un truco consisten en definir DISTCC_DIR en variables de entorno:

Ahora actualice el entorno:

Para terminar, arranque la aplicación GUI:

Usar SSH para la comunicación de distcc
La configuración de distcc a través de SSH incluye algunos detalles. En primer lugar, genere un par de claves SSH sin contraseña. Observe que portage compila los programas con el usuario Portage (o como root si no se ha definido ). La carpeta de inicio del usuario Portage es lo que implica que las claves se deben almacenar en.

A continuación cree una sección para cada máquina en el fichero de configuración de SSH:

Envíe la clave pública a cada nodo de compilación:

También asegúrese de que todas las máquinas están listadas en el fichero :

Corrija el propietario del fichero como se muestra a continuación:

Para configurar los equipos  y , lance:

Por favor, observe que el símbolo, especifica las máquinas ssh para distcc.

Para terminar, indíquele a qué binario SSH debe utilizar:

No es necesario lanzar el guión de inicio  en los equipos cuando   se comunica a través de SSH.

Testing
To test, write a simple Hello distcc program and run in verbose mode to see if it communicates properly.

Next, turn on verbose mode, compile the program using and link the generated object file into an executable:

There should be a bunch of output about finding its configuration, selecting the host to connect to, starting to connect to it, and ultimately compile. If the output does not list the desired hosts, check the configuration.

Finally, ensure the compiled program works properly. To test each host, enumerate each compile host in the hosts file.

Solución a problemas
Si se produce cualquier problema mientras se utiliza, entonces esta sección puede ser de ayuda.

ERROR: failed to open
A partir del 22 de enero de 2015 la instalación no crea el fichero apropiado en. Esto afecta aparentemente solo a la versión 3.1-r8 de distcc. Esta incidencia está en proceso de solución (ver ). Es posible evitar este problema creando manualmente el fichero de registro, asignarle el propietario adecuado y reiniciando el demonio distccd:

A continuación actualice la ruta del fichero de configuración de  en  para definirla al directorio de  creado en el paso anterior:

Para terminar, reinicie el servicio distccd:

Algunos paquetes no utilizan distcc
A medida que se instalan algunos paquetes, los usuarios observarán que la construcción de algunos de ellos no se está realizando (y por tanto no se están construyendo en paralelo). Esto puede ocurrir porque el fichero del paquete no soporta operaciones en paralelo o el mantenedor del ebuild ha deshabilitado explícitamente dichas operaciones en paralelo debido un problema conocido.

En algunas ocasiones, puede causar que un paquete falle en su compilación. Si sucede esto, por favor informe de ello.

Versiones mezcladas de GCC
Si el entorno aloja versiones diferentes de GCC, probablemente tenga problemas extraños. La solución es asegurarse de que todas las máquinas tengan la misma versión.

Las actualizaciones de Portage más recientes utilizan  (menos gcc) en lugar de. Esto significa que si se mezclan máquinas i686 con otros tipos de máquina (i386, i586) entonces las construcciones darán problemas. Una solución temporal a esto es lanzar:

También es posible definir las variables CC y CXX en a los valores listados en la orden de arriba.

-march=native
A partir de la versión 4.3.0 de GCC, el compilador ofrece soporta para la opción  que habilita la detección automática de la CPU y de las optimizaciones que merece la pena activar en el procesador sobre el que está corriendo GCC. Esto es un problema cuando se utiliza, ya que permite mezclar código optimizado para diferentes procesadores. Por ejemplo, al correr con   en un sistema que tiene un procesador AMD Athlon y haciendo lo mismo en otro sistema que tiene un procesador Intel Pentium processor se mezclará el código compilado en ambos procesadores.

Preste atención a la siguiente advertencia:

Para conocer los ajustes que GCC habilitaría cuando se llama con, lance lo siguiente:

Get more output from emerge logs
It is possible to obtain more logging by enabling verbose mode. This is accomplished by adding DISTCC_VERBOSE to :

The verbose logging can then be found in.

Keep in mind that the first invocation visible in  isn’t necessary the first  call during a build process. For example a build server can get a one-minute backoff period during the configuration stage when some checks are performed using a compiler ( sets a backoff period when compilation on a remote server failed, it doesn’t matter whether it failed on local machine or not).

Dig into the directory to investigate such situations. Find other logs, or call explicitly from within the working directory.

Another interesting variable to use is DISTCC_SAVE_TEMPS. When set, it saves the standard output/error from a remote compiler which, for Portage builds, results in files in the directory.

Ver también

 * La guía de compilación cruzada de DistCC explica cómo se utiliza una arquitectura para construir programas para otra arquitectura mediante . Esto puede ser tan simple como utilizar una máquina Athlon (i686) para construir un programa para una K6-2 (i586) o utilizar una máquinaSPARC para construir un programa para una basada en PowerPC.

Recursos externos

 * Uso de  en línea para distcc
 * Página oficial de Distcc