PARALLEL.RU

Дискуссионный клуб по параллельным вычислениям
Текущее время: 11 дек 17 7:18

Часовой пояс: UTC + 4 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 5 ] 
Автор Сообщение
 Заголовок сообщения: torque не параллелит
СообщениеДобавлено: 14 мар 14 10:35 
Не в сети

Зарегистрирован: 14 мар 14 10:25
Сообщения: 2
Добрый день,
установлен torque v.2.5.13
в конфиге nodes прописано пару нод
Код:
nod1 np=8
nod2 np=8

при запуске тестового задания:
Код:
echo ' ping ya.ru -c 50' | qsub -l nodes=2:ppn=1

задание запустится только на нод который стоит первым в списке node
если поменять их местами. также запустится на том который первый в списке
qstat показывает что используется две ноды как и указал в -l nodes=2:ppn=1
в чем проблема?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: torque не параллелит
СообщениеДобавлено: 14 мар 14 11:10 
Не в сети

Зарегистрирован: 11 дек 02 19:37
Сообщения: 871
Откуда: НИВЦ МГУ
Всё правильно. Torque выделяет задаче узлы, а уж как задачи с ними распорядится - её личное дело. ping понятия не имеет о том, что для него доступны два узла, поэтому делает что умеет - работает на первом.

Создайте скрипт для запуска и поставьте его в очередь. При запуске скрипта в переменной PBS_NODEFILE будет путь к файлу со списком выделенных узлов. А дальше - как нужно для задачи for i in `cat $PBS_NODEFILE`; do ssh $i ping ya.ru & done или mpirun -hostfile $PBS_NODEFILE ./my_mpi_task. Как-то так... Да, ещё в PBS_O_WORKDIR будет текущий каталог, не забудьте сделать в него переход в скрипте, если нужно будет читать-писать файлы...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: torque не параллелит
СообщениеДобавлено: 17 мар 14 15:29 
Не в сети

Зарегистрирован: 14 мар 14 10:25
Сообщения: 2
Спасибо прояснили.
Вот еще момент не понятный:
Код:
qsub my.qs -l nodes=5:ppn=1

будет выделен только один хост, а если в ручную задавать:
Цитата:
qsub my.qs -l nodes=host1+host2+host3+host4+host5:ppn=1

то все что задал, почему сам не выделяет хосты ?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: torque не параллелит
СообщениеДобавлено: 1 апр 14 12:19 
Не в сети

Зарегистрирован: 11 дек 02 19:37
Сообщения: 871
Откуда: НИВЦ МГУ
А ключи qsub не должны до имени скрипта идти? И вместо nodes=5 надо писать ncpus=5...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: torque не параллелит
СообщениеДобавлено: 14 ноя 14 15:19 
Не в сети

Зарегистрирован: 14 ноя 14 15:17
Сообщения: 1
думаю, стоит поступить так: собрать ядро из исходников в конфигурации специально для бездисковой числодробилки. оттуда можно выкинуть практически всё, кроме совершено необходимого: драйверов сетевых карт, NFS клиента, NFS root и тому подобного, причём скомпилировать всё это не модулями, а прямо в ядро -- тогда можно будет не городить initrd. полученный образ ядра сложить в /tftpboot. если используете пакет pxelinux, то в его конфигурации (например, /tftpboot/pxelinux.cfg/default) указать новое ядро и его параметры загрузки как-то примерно так:

_________________
Get fast success in 70-467 exam questions and 1Y0-A26 exam exam questions by using our latest exam yale.edu .We also offer up-to-date rasmussen and answers for your prep of www.usuhs.mil.


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 5 ] 

Часовой пояс: UTC + 4 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB