Distcc/es

Distcc es un programa diseñado para distribuir tareas de compilación a través de la red hacia máquinas participantes. Consiste en un servidor, y un programa cliente,. Distcc puede trabajar de forma transparente con ccache, Portage y Automake realizando una sencilla configuración.

Cuando planee utilizar para ayudarle a realizar el bootstrap en una instalación Gentoo, asegúrese de leer el apartado para realizar la inicialización.

Instalación
Antes de configurar, echémos un vistazo a la instalación del paquete  en todos los equipos.

Requisitos para todos los equipos
Para utilizar, todas las máquinas en la red deben tener la misma versión de GCC. Mezclar 3.3.x (variando la x) es correcto, pero mezclar 3.3.x y 3.2.x "puede" resultar en errores en tiempo de compilación o ejecución.

Emerge
Distcc incluye un monitor gráfico para monitorizar las tareas que un computador está enviando para compilación. Este monitor se habilita cuando el ajuste USE  está activado.

Después de configurar el ajuste USE, instale el paquete :

Servicio
Para que arranque de forma automática se debe seguir las instrucciones siguientes.

OpenRC
Modifique y asegúrarse de usar la directiva   para permitir únicamente máquinas cliente de confianza. Para mayor seguridad debería utilizar también la directiva  para indicarle al demonio  en qué dirección IP debe escuchar (en sistemas con más de una dirección IP). Se puede encontrar más información acerca de seguridad en en las notas sobre seguridad de distcc.

En el siguiente ejemplo se permite a los clientes distcc correr en  y   para conectarse al servidor  que corre en la máquina local:

Ahora inicie el demonio en todas las máquinas participantes:

systemd
Editar el fichero para añadir los clientes permitidos en formato CIDR. El ejemplo añade todas las direcciones IP en el rango 192.168.1.xxx:

Recargar los fichero de unidad después de realizar estos cambios:

Habilitar el auto arranque de y a continuación arrancar el servicio:

Especificar las máquinas participantes
Utilice la orden para indicar la lista de máquinas.

A continuación se muestra una lista ejemplo de definiciones de equipos. En la mayoría de los casos, serán suficientes variaciones de las líneas 1 y 2. La última utiliza la sintaxis  para informar a  sobre el máximo número de trabajos que se deben lanzar en este nodo. Se puede encontrar más información sobre la sintaxis de las líneas 3 y 4 en la página del manual de distcc.

Hay otras formas de configurar máquinas. Eche un vistazo a la página del manual de  para obtener más información.

Si se van a realizar compilaciones en la máquina local debería escribir  en la lista de máquinas. Contrariamente, si no se va a utilizar la máquina local para compilar, omítala de la lista de máquinas. En una máquina lenta usar localhost puede de hecho hacer las cosas más lentas. Asegúrese de comprobar los ajustes para mejorar el rendimiento.

Configuraremos para que usar los equipos mencionados en la primera línea del ejemplo:

Distcc también ofrece soporte a un modo bombeo (pump) cuando se invoca la orden. Esto puede reducir de forma significativa el tiempo de construcción cuando se compilan muchos ficheros en paralelo. Se cachean las cabeceras preprocesadas en el lado servidor y, como resultado, desaparece la continua carga y preprocesado de estos ficheros cabecera.

Para configurar un equipo en modo bombeo, se debe añadir el sufijo  a las definiciones de los equipos. El modo bombero requiere de los ajustes  y   (independientemente de si los archivos son C o C++).

Con Portage
Configurar Portage para usar es fácil. Es cuestión de habilitar la característica y definir un valor correcto para el número de trabajos simultáneos (ya que así  incrementará la cantidad de recursos disponibles para la construcción)

Ajuste la variable MAKEOPTS y la variable FEATURES tal y como se describe abajo.

Una estrategia común es
 * Definir el valor de  al doble del número total (local + remotas) de núcleos de CPU + 1, y
 * Definir el valor de  al número de núcleos de CPU locales

El uso de  en la varialble MAKEOPTS evitará lanzar demasiadas tareas cuando alguno de los equipos del cluster de  no estén disponibles (incrementando la cantidad de trabajos simultáneos en el resto de los sistemas) o cuando se configure un ebuild para no permitir construcciones en remoto (como con gcc). Esto se logra rechazando el inicio de trabajos adicionales cuando la carga del sistema están en el valor de  o por encima de éste.

Por ejemplo, cuando hay dos equipos PC anfitriones con cuatro núcleos que corren y el equipo PC local tiene una CPU con doble núcleo entonces la variable MAKEOPTS podría ser:

Cuando edite el fichero, asegúrese de que no se ha definido  en las variables CFLAGS o CXXFLAGS. no distribuirá trabajos a otras máquinas si  está definido a. El valor adecuado para  se puede obtener lanzando la siguiente orden:

Lea en línea para distcc para ampliar la información.

Con automake
Esto es más fácil de configurar en algunos casos que con Portage. Todo lo que se necesita hacer es actualizar la variable de entorno PATH para incluir  delante del directorio que contiene. No obstante, hay un problema. Si se utiliza, entonces deberá poner la localización de después de la de :

Coloque esto en el archivo del usuario  o fichero equivalente para tener configurada la variable PATH cada vez que que el usuario entre en el sistema o defínala globlamente en un fichero en

En lugar de llamar únicamente a, agregue  (donde   es un número entero). El valor de  depende de la red y de la tipología de los computadores que se utilizan para compilar. Una aproximación heurística a los valores correctos se ha dado anteriormente en este artículo.

Para realizar la inicialización
El uso de para el inicio (esto es, construir una cadena de herramientas antes de instalar el resto del sistema) requiere realizar algunas acciones adicionales.

Paso 1: Configurar Portage
Inicie la nueva máquina con un LiveCD de Gentoo Linux y siga las instrucciones de instalación mientras se siguen las instrucciones en las FAQ de Gentoo para obtener más información sobre el bootstrap. A continuación configure Portage para que utilice :

Actualice también la variable  en la sesión de instalación:

Paso 2: Obtener distcc
Instale :

Paso 3: Configurar distcc
Lance para configurar distcc. Sustituya la cadena  del ejemplo por las direcciones IP o nombres de los nodos participantes.

¡Distcc ya está configurado para hacer bootstrap! Continúe con las instrucciones de instalación adecuadas y no olvide lanzar después de lanzar. Esto asegurará que las dependencias necesarias también se instalarán.

Extras
La aplicación tiene características adicionales y aplicaciones para dar soporte al trabajo en un entorno.

Utilidades de monitorización
Distcc se distribuye con dos herramientas de monitorización. La basada en texto se construye siempre y se llama. Al lanzarlo la primera puede resultar confuso, pero es muy fácil de utilizar. Si el programa se lanza sin parámetros, correrá solo una vez. Sin embargo si se le pasa un número, actualizará la información cada  segundos, donde   es el argumento indicado.

La otra utilidad de monitorización solo se habilita cuando se habilita el ajuste USE. Esta herramienta está basada en GTK+, corre en un entorno X y es bastante encantador. En Gentoo, se ha cambiado el nombre a para evitar confusiones (originalmente se llamaba ).

Para monitorizar el uso de por parte de Portage:

Un truco consisten en definir DISTCC_DIR en variables de entorno:

Ahora actualice el entorno:

Para terminar, arranque la aplicación GUI:

SSH para comunicaciones
La configuración de distcc a través de SSH incluye algunos detalles. En primer lugar, genere un par de claves SSH sin contraseña. Observe que portage compila los programas con el usuario Portage (o como root si no se ha definido ). La carpeta de inicio del usuario Portage es lo que implica que las claves se deben almacenar en.

A continuación cree una sección para cada máquina en el fichero de configuración de SSH:

Envíe la clave pública a cada nodo de compilación:

También asegúrese de que todas las máquinas están listadas en el fichero :

Corrija el propietario del fichero como se muestra a continuación:

Para configurar los equipos  y , lance:

Por favor, observe que el símbolo, especifica las máquinas ssh para distcc.

Para terminar, indíquele a qué binario SSH debe utilizar:

No es necesario lanzar el guión de inicio  en los equipos cuando   se comunica a través de SSH.

Pruebas
Para probar, escribir un simple programa Hola distcc y lanzar en modo hablador para comprobar si se está comunicando correctamente.

A continuación, en el modo hablador, compilar el programa utilizando y enlazar el fichero objeto generado en un ejecutable:

Debería haber un montón de información acerca de con su configuración, selección de la máquina con la que conectar, conexión a la misma y por último la compilación de. Se la salida no muestra las máquinas esperadas, se debe comprobar la configuración.

Por último, asegurarse de que el programa compilado funciona correctamente. Para probar cada máquina, enumerar las máquinas de compilación en el fichero de máquinas.

Solución a problemas
Si se produce cualquier problema mientras se utiliza, entonces esta sección puede ser de ayuda.

ERROR: failed to open
A partir del 22 de enero de 2015 la instalación no crea el fichero apropiado en. Esto afecta aparentemente solo a la versión 3.1-r8 de distcc. Esta incidencia está en proceso de solución (ver ). Es posible evitar este problema creando manualmente el fichero de registro, asignarle el propietario adecuado y reiniciando el demonio distccd:

A continuación actualice la ruta del fichero de configuración de  en  para definirla al directorio de  creado en el paso anterior:

Para terminar, reinicie el servicio distccd:

Algunos paquetes no utilizan distcc
A medida que se instalan algunos paquetes, los usuarios observarán que la construcción de algunos de ellos no se está realizando (y por tanto no se están construyendo en paralelo). Esto puede ocurrir porque el fichero del paquete no soporta operaciones en paralelo o el mantenedor del ebuild ha deshabilitado explícitamente dichas operaciones en paralelo debido un problema conocido.

En algunas ocasiones, puede causar que un paquete falle en su compilación. Si sucede esto, por favor informe de ello.

Versiones mezcladas de GCC
Si el entorno aloja versiones diferentes de GCC, probablemente tenga problemas extraños. La solución es asegurarse de que todas las máquinas tengan la misma versión.

Las actualizaciones de Portage más recientes utilizan  (menos gcc) en lugar de. Esto significa que si se mezclan máquinas i686 con otros tipos de máquina (i386, i586) entonces las construcciones darán problemas. Una solución temporal a esto es lanzar:

También es posible definir las variables CC y CXX en a los valores listados en la orden de arriba.

-march=native
A partir de la versión 4.3.0 de GCC, el compilador ofrece soporta para la opción  que habilita la detección automática de la CPU y de las optimizaciones que merece la pena activar en el procesador sobre el que está corriendo GCC. Esto es un problema cuando se utiliza, ya que permite mezclar código optimizado para diferentes procesadores. Por ejemplo, al correr con   en un sistema que tiene un procesador AMD Athlon y haciendo lo mismo en otro sistema que tiene un procesador Intel Pentium processor se mezclará el código compilado en ambos procesadores.

Preste atención a la siguiente advertencia:

See the with portage section and Inlining  for distcc for more information.

Obtener más información de los registros de emerge
Es posible obtener más información de registro si se habilita el modo hablador. Esto se consigue añadiendo DISTCC_VERBOSE al archivo :

Se puede encontrar el registro detallado en.

Se debe recordar que la primera invocación de visible en  no es necesariamente la primera llamada a  durante el proceso de construcción. Por ejemplo un equipo de construcción puede ausentarse por un periodo de un minuto durante la fase de configuración cuando se realizan algunas comprobaciones utilizando un compilador ( define un periodo de ausencia cuando falla la compilación de un servidor remoto, no importa si falló en la máquina local o no).

Consultar el directorio para investigar este tipo de situaciones. Buscar en otros registros o llamar a de forma explícita desde el propio directorio de trabajo.

Otra variable interesante que se puede utilizar es DISTCC_SAVE_TEMPS. Cuando se define, guarda la salida estándar y la de error de un compilador remoto que, para las construcciones de Portage, se generan en ficheros dentro del directorio.

Ver también

 * La guía de compilación cruzada de DistCC explica cómo se utiliza una arquitectura para construir programas para otra arquitectura mediante . Esto puede ser tan simple como utilizar una máquina Athlon (i686) para construir un programa para una K6-2 (i586) o utilizar una máquinaSPARC para construir un programa para una basada en PowerPC.

Recursos externos

 * Uso de  en línea para distcc
 * Página oficial de Distcc