Distcc/ru

Distcc — это программа, предназначенная для распределения по сети задач компиляции в рамках набора хостов. Она состоит из серверной части — и клиентской —. После небольшой настройки distcc может прозрачно работать с ccache, Portage и Automake.

Если планируется использовать для начальной сборки (bootstrap) установки Gentoo, обратите внимание на раздел использование distcc для начальной сборки Gentoo.

Установка
Перед настройкой сперва нужно установить пакет  на все хосты.

Требования для всех хостов
Для работы с все компьютеры в сети должны иметь GCC одной версии. К примеру, можно использовать на разных машинах 3.3.x (где x — разные), а смешивание 3.3.x с 3.2.x может привести к ошибкам при компиляции или выполнении.

Emerge
Distcc поставляется с графическим монитором для отслеживания заданий, отправляемых компьютером на компиляцию. Данный монитор включается, когда установлен USE-флаг.

После настройки USE-флагов установите пакет :

Service
В зависимости от того какая система инициализации используется, выполните необходимые инструкций, для того чтобы запускался автоматически.

Когда используется OpenRC
Отредактируйте и убедитесь, что с помощью директивы   разрешены только доверенные клиенты. Для усиления безопасности можно также добавить директиву, сообщив с её помощью демону , на каком IP ожидать соединений (для систем с несколькими адресами). Подробнее о безопасности в можно почитать в Distcc security notes.

Следующий пример разрешает distcc клиентам, работающим на  и , подключатся к локально запущенному серверу :

Теперь запустите демон на всех участвующих компьютерах:

Когда используется systemd
Отредактируйте файл и добавьте клиентов в CIDR формате. Ниже показан пример:

Reload the unit files after making such changes:

Enable auto-starting and then start the service:

Указание участвующих хостов
Для задания списка хостов используйте команду.

The following is an example list of host definitions. In most cases, variants of lines 1 and 2 suffice. The latter uses the  syntax to inform  about the maximum amount of jobs to be launched on this node. More information about the syntax used in lines 3 and 4 can be found in the distcc manual page.

Есть также несколько других методов для настройки хостов. За подробностями обратитесь к man-странице.

Если локальная машина должна участвовать в компиляции, поместите  в список хостов. Наоборот, если локальная машина не должна участвовать в компиляции, не включайте её в список хостов. Использование localhost на медленной машине может, как ни странно, замедлить процесс. Всегда проверяйте влияние настроек на производительность.

Настроим для компиляции на хостах из первой строчки примера:

Distcc also supports a pump mode, by invoking the command. This may significantly reduce build time when multiple files are compiled in parallel. It caches preprocessed headers on the server side and, as a result, gets rid of repeated uploading and preprocessing of these header files.

To configure a host for pump mode, add the  suffix to the hosts definitions. Pump mode requires both  and   flags (regardless of the files being C or C++).

Использование distcc для работы с Portage
Настроить Portage для работы с легко. Речь идет о включении функции, а также о настройки подходящего количества одновременно выполняемых задач (имея ввиду, что с становится больше ресурсов для компиляции).

Установите переменные MAKEOPTS и FEATURES как показано ниже.

Общепринятая стратегия
 * установите  в удвоенное значение от всех (локальных + удалённых) ядер CPU + 1,
 * установите  число равное количеству локальных ядер CPU.

Использование  в переменной MAKEOPTS предотвращает запуск чрезмерно большого количества заданий в случаях, когда некоторые  хосты кластера недоступны (увеличивая количество одновременных заданий для других систем) или когда ebuild настроен так, что устанавливаемый пакет запрещает удаленную компиляцию (например, gcc). Это достигается за счет отказа начинать новые задачи компиляции, если нагрузка на систему становится равной  или выше.

Например, если запущен на двух четырехъядерных хостах, а локальный компьютер оснащен двухъядерным процессором, то переменная MAKEOPTS может выглядеть так:

Не используйте  в переменных CFLAGS и CXXFLAGS файла. Если march установлен в, то  не сможет распределить работу по другим машинам. Подходящее значение для  можно получить с помощью следующей команды:

Подробности можно найти на странице Inlining  for distcc.

Использование distcc с automake
Иногда это проще настройки Portage. Всё, что нужно сделать, это обновить переменную PATH, добавив перед каталогом, содержащим. С одной оговоркой. Если используется, то нужно поместить путь к после пути к :

Поместите это в пользовательский или его эквивалент, чтобы переменная PATH устанавливалась при каждом входе пользователя в систему, либо задайте ее глобально через файл.

Instead of calling alone, add in   (where   is an integer). The value of  depends on the network and the types of computers that are used to compile. A heuristic approach to the right value is given earlier in this article.

Использование distcc для начальной сборки Gentoo
Using to bootstrap (i.e. build a working toolchain before installing the remainder of the system) requires some additional steps to take.

Шаг 1: настройка Portage
Boot the new box with a Gentoo Linux LiveCD and follow the installation instructions, while keeping track of the instructions in the Gentoo FAQ for information about bootstrapping. Then configure Portage to use :

Также обновите переменную  в установочном сеансе:

Шаг 2: установка Distcc
Установите :

Шаг 3: настройка distcc
Run to setup distcc; substitute the   in the example with the IP addresses or hostnames of the participating nodes.

Distcc is now set up to bootstrap! Continue with the proper installation instructions and do not forget to run after running. This is to make sure that all of the necessary dependencies are installed.

Расширения distcc
The application has additional features and applications to support working in a  environment.

Мониторы distcc
Distcc ships with two monitoring utilities. The text-based monitoring utility is always built and is called. Running it for the first time can be a bit confusing, but it is really quite easy to use. If the program is run with no parameter it will run just once. However, if it is passed a number it will update every  seconds, where   is the argument that was passed.

The other monitoring utility is only enabled when the  USE flag is set. This one is GTK+ based, runs in an X environment, and it is quite lovely. For Gentoo, the GUI monitor has been renamed to to make it less confusing (it is originally called ).

To monitor Portage's usage:

A trick is to set DISTCC_DIR in environment variables:

Now update the environment:

Finally, start the GUI application:

Using SSH for distcc communication
Setting up distcc via SSH includes some pitfalls. First, generate an SSH key pair without password setup. Be aware that portage compiles programs as the Portage user (or as root if  is not set). The home folder of the Portage user is, which means the keys need to be stored in

Во-вторых, сделайте для каждого хоста раздел в файле конфигурации SSH:

Send the public key to each compilation node:

Also make sure that each host is available in the file:

Fix the file ownership as follows:

To set up the hosts  and , run:

Please note the  (@ sign), which specifies ssh hosts for distcc.

Finally, tell which SSH binary to use:

It is not necessary to run the initscript on the hosts when  communicates via SSH.

Testing
To test, write a simple Hello distcc program and run in verbose mode to see if it communicates properly.

Next, turn on verbose mode, compile the program using and link the generated object file into an executable:

There should be a bunch of output about finding its configuration, selecting the host to connect to, starting to connect to it, and ultimately compile. If the output does not list the desired hosts, check the configuration.

Finally, ensure the compiled program works properly. To test each host, enumerate each compile host in the hosts file.

Устранение проблем
If a problem occurs while using, then this section might help in resolving the problem.

ERROR: failed to open
As of January 22nd, 2015 emerging fails to create the proper file in. This apparently only effects version 3.1-r8 of distcc. This bug is in the process of being corrected (see ). It is possible to work around this by manually creating the log file, giving it proper ownership, and restarting the distccd daemon:

Next update the path of the  configuration file in  to the  directory created in the step before:

Finally, restart the distccd service:

Некоторые пакеты не используют distcc
Можно заметить, что сборка некоторых пакетов не распределяется по хостам (и не происходит параллельно, т. е. в несколько процессов). Такое может происходить, когда пакета не поддерживает параллельные операции, или мейнтейнер ebuild’а явно отключил их, чтобы избежать известных проблем.

Иногда может вызывать сбой при компиляции пакета. Если такое происходит, пожалуйста, сообщите об этом.

Смешанные версии GCC
Если на взаимодействующих хостах разные версии GCC, то велика вероятность возникновения очень странных проблем. Решение — установить на все хосты одну версию GCC.

После недавных обновлений Portage стал использовать  (минус gcc) вместо. Это значит, что совместное использование i686-машин с машинами других типов (i386, i586) может вызвать проблемы со сборкой. Обходным решеним может быть запуск:

It is also possible to set the CC and CXX variables in to the values list in the command above.

-march=native
GCC, начиная с версии 4.3.0, поддерживает параметр, который включает автоматическое определение CPU, на котором запущен GCC, и оптимизаций, которые стоит включить для него. Это создает проблемы при использовании, так как допускает смешивание оптимизированного для разных процессоров кода. К примеру, запуск с   на системе с процессором AMD Athlon и на другой системе с процессором Intel Pentium приведет к смешиванию кода, скомпилированного на обоих процессорах.

Обратите внимание на следующее предупреждение:

To know the flags that GCC would enable when called with, execute the following:

Get more output from emerge logs
It is possible to obtain more logging by enabling verbose mode. This is accomplished by adding DISTCC_VERBOSE to :

The verbose logging can then be found in.

Keep in mind that the first invocation visible in  isn’t necessary the first  call during a build process. For example a build server can get a one-minute backoff period during the configuration stage when some checks are performed using a compiler ( sets a backoff period when compilation on a remote server failed, it doesn’t matter whether it failed on local machine or not).

Dig into the directory to investigate such situations. Find other logs, or call explicitly from within the working directory.

Another interesting variable to use is DISTCC_SAVE_TEMPS. When set, it saves the standard output/error from a remote compiler which, for Portage builds, results in files in the directory.

Смотрите также

 * The DistCC Cross-compiling guide explains how using one architecture to build programs for another architecture is done through . This can be as simple as using an Athlon (i686) to build a program for a K6-2 (i586), or using a SPARC to build a program for a PowerPC.

Ссылки

 * Inlining  for distcc
 * Distcc homepage