1 1 Конфигурация кластера LAM/MPI

LAM Logo Аббревиатура LAM в названии пакета расшифровывается как "Local Area Machine", что указывает на изначальную ориентацию пакета на использование его для кластера, построенного из сети рабочих станций.

Прежде чем MPI программы могут быть запущены на исполнение в систему кластера должна быть виртуальная машина LAM. Обычно этот процесс называется "загрузка LAM". Успешно выполненный процесс загрузки виртуальной машины устанавливает в системе операционную среду окружения, называемую "вселенная LAM" (LAM universe). Вселенная LAM может состоять как из нескольких машин, так и из одной машины. В последнем случае LAM может быть использована для симуляции параллельной машины, например для отладки программ.

Вселенная LAM описывается в файле схемы загрузки (boot schema file), который содержит информацию о том, какие рабочие станции входят в виртуальную машину. Файл схемы загрузки, которому в дальнейшем мы дадим имя hostfile, является простым текстовым файлом, содержащем адреса машин, один адрес в одной строке. Место расположения этого файла может быть любое. Содержание его может быть например таким:

# My boot schema
node1.cluster.example.com
192.168.1.123
node3.cluster.example.com cpu=2

Первая строчка - это комментарий. Остальные строчки - это перечисление машин, входящих в кластер. Первая машина задана доменным именем. Ссылка на вторую машину задана ее ip-адресом. Третья машина также описана доменным именем с параметром "cpu=2". Параметр этот означает, что машина node3 является двупроцессорным SMP компьютером.

Для загрузки вселенной LAM используется команда lamboot, запуск которрой выглядит следующим образом:

[yuri@server yuri]$ lamboot -v -ssi boot rsh ./hostfile

LAM 7.0.6/MPI 2 C++/ROMIO - Indiana University

n-1<29699> ssi:boot:base:linear: booting n0 (node1.cluster.example.com)
n-1<29699> ssi:boot:base:linear: booting n1 (192.168.1.123)
n-1<29699> ssi:boot:base:linear: booting n2 (node1.cluster.example.com)
n-1<29699> ssi:boot:base:linear: finished

Для успешного запуска LAM должны быть выполнены следующие условия:

  • все машины, описанные в hostfile должны быть включены и доступны по сети
  • пользователь должен иметь беспарольный доступ к этим машинам по протоколу SSH
  • бинарники системы LAM на этих машинах должны находится в каталогах, указанных в переменной окружения PATH
  • если машина описана доменным именем, то она должна быть прописана в системе DNS или в системном файле hosts

Посмотреть текущую конфигурацию кластера можно с помощью команды lamnodes:

[yuri@server yuri]# lamnodes
n0 node1.cluster.example.com:1
n1 192.168.1.123:1
n2 node3.cluster.example.com:2

Остановить работы LAM-вселенной можно командой lamhalt


Copyright © 1998-2011 Юрий Сбитнев