PARALLEL.RU

Дискуссионный клуб по параллельным вычислениям
Текущее время: 16 дек 18 1:33

Часовой пояс: UTC + 4 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 8 ] 
Автор Сообщение
 Заголовок сообщения: MPICH2 for Windows
СообщениеДобавлено: 3 авг 07 23:23 
Не в сети

Зарегистрирован: 2 авг 07 20:39
Сообщения: 10
Имеются две Windows-машины. На них установлен mpich2-1.0.5p2-win32-ia32.msi.
При запуске вычислений на двух хостах процессы просто висят не занимая процессорного времени. Запускались различные задачи, в том числе тестовая программа cpi.exe из пакета mpich2-1.0.5p2

Есть какие-нибудь идеи, в чем может быть дело? У кого-нибудь работает mpich2 на Windows?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: MPICH2 for Windows
СообщениеДобавлено: 6 авг 07 11:36 
Не в сети

Зарегистрирован: 11 дек 02 19:37
Сообщения: 872
Откуда: НИВЦ МГУ
Andrei писал(а):
Есть какие-нибудь идеи, в чем может быть дело? У кого-нибудь работает mpich2 на Windows?

Сервисы mpd запущены? Как делался запуск?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 6 авг 07 16:55 
Не в сети

Зарегистрирован: 2 авг 07 20:39
Сообщения: 10
Там smpd вместо mpd. Кстати на машинах висит и старый mpich-1.2.5, от которого работают mpd. Не могут ли они мешать друг другу?

В отличие от mpich-1 запуск ведется через mpiexec, вместо mpirun. Т.к. процессы запускаются, то с этим все нормально, далее видимо идут проблемы с транспортом у самого smpd.

Кстати при сборке и запуске через mpich-1 кластер работает. Захотелось проапгрейдить до второго, но не тут-то было...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 7 авг 07 12:09 
Не в сети

Зарегистрирован: 11 дек 02 19:37
Сообщения: 872
Откуда: НИВЦ МГУ
Andrei писал(а):
Там smpd вместо mpd. Кстати на машинах висит и старый mpich-1.2.5, от которого работают mpd. Не могут ли они мешать друг другу?

Точно не скажу, с smpd дела не имел. Посмотрите командой netstat какие порты открыты mpd и smpd. Или попробуйте отключить mpd.

Цитата:
Кстати при сборке и запуске через mpich-1 кластер работает. Захотелось проапгрейдить до второго, но не тут-то было...

Эх, по моему опыту от mpich2 проблем вообще больше, чем пользы :) С другой стороны mpich1 законсервировали совсем и поэтому в производительности он уже не котируется. Ну, кроме как по tcp/ip - тут они примерно равны.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 7 авг 07 21:34 
Не в сети

Зарегистрирован: 2 авг 07 20:39
Сообщения: 10
Кстати TCPView – хорошая программка для этих целей.
В состоянии ожидания mpd и smpd слушают разные порты. Т.е. с этим все нормально.
При запуске на счет возникает следующая картина (приведу только соединения которые находятся в состоянии ESTABLISHED)

MPICH-1
mpi-program (local) <---> mpi-program (remote)
mpirun (local) <---> mpirun (remote)
mpd (local) <---> mpirun (local)

MPICH-2
mpi-program (local) <---> smpd (local)
mpiexec (local) <---> smpd (local)
smpd (local) <---> smpd (remote)

Как видно, картина взаимодействия разная. Отличие лишь в том, что в первом случае система работает, во втором – нет.

mpich-1 работает более менее удовлетворительно для моих целей. Он лишь вызвал ряд проблем на MacOS-PPC и Windows-Xeon(EMT64), неразрешимых на уровне пользовательской настройки.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 8 авг 07 13:31 
Не в сети

Зарегистрирован: 11 дек 02 19:37
Сообщения: 872
Откуда: НИВЦ МГУ
Andrei писал(а):
mpich-1 работает более менее удовлетворительно для моих целей. Он лишь вызвал ряд проблем на MacOS-PPC и Windows-Xeon(EMT64), неразрешимых на уровне пользовательской настройки.


Могу посоветовать только:
1. убедиться, что smpd прописаны в исключения файрволла (или он отлючён совсем)
2. запускать mpiexec с опцией -delegate
3. попробовать переставить mpich2... Или обновить mpich1 до 1.2.7...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 8 авг 07 22:44 
Не в сети

Зарегистрирован: 2 авг 07 20:39
Сообщения: 10
1. Фаерволы не установлены. Антивирусы отключены. На машине с включенным фаерволом сразу вылетает с ошибкой, даже при запуске задачи только на локальном хоте.

2. –delegate отвергается как правильная, как ни странно, но процессы стартуют, и видимо дело не в авторизации. В конце концов правильные программы должны выдавать какую-то диагностику.

3. MPICH1 снесен, MPICH2 переставлен. Ситуация та же.
Распечатки показывают, что вызовы
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &rank);
MPI_Comm_size(MPI_COMM_WORLD, &p);
проходят. Виснет на первом вызове
MPI_Bcast(a_ptr, 1, MPI_DOUBLE, 0, MPI_COMM_WORLD);
После этого процессорное время не идет. Это для локального процесса. От удаленного распечатки не поступают, значит он стартуя сразу приостанавливается, и не достигает самого первого вызова в main() – MPI_Init(), поэтому не удивительно, что локальный виснет на MPI_Bcast()


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: MPICH2 for Windows
СообщениеДобавлено: 13 апр 11 0:27 
Не в сети

Зарегистрирован: 13 апр 11 0:21
Сообщения: 1
Можете помочь разобраться, почему у меня в MPICH2 не в состоянии соединиться с хостом. Проблема с IP-адресами, нет соединения, даже на одном компьютере.


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Часовой пояс: UTC + 4 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB