PARALLEL.RU

Дискуссионный клуб по параллельным вычислениям
Текущее время: 7 дек 19 21:48

Часовой пояс: UTC + 4 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 4 ] 
Автор Сообщение
 Заголовок сообщения: SGE. Что то не срабатывает при qdel.
СообщениеДобавлено: 7 июн 05 14:43 
Не в сети

Зарегистрирован: 11 апр 05 10:19
Сообщения: 14
Откуда: Новосибирск
Здравствуйте,
при запуске какой-нибудь программы с deadlock через
qsub -pe mpich N скрипт

пытаюсь убить задачу -
qdel NЗадачи

в резальтате
qstat -f
показывает что якобы задач нет в очереди и нет на исполнении.

Но! процессоры все загружены :(
т.е. делаю
rsh node1
потом
top либо ps -A
и убиваю этих зомбей. Но ведь это неправильно! Оно само должно.
Или нет?
заранее спасибо, Марина.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: ответ.
СообщениеДобавлено: 8 июн 05 17:53 
Это известная проблема с mpich работающей под Open PBS.
Есть два решения:

Первый неправильный:

Создать на ВЫЧИСЛИТЕЛЬНЫХ узлах в директории mom-ов
/var/spool/pbs/mom_priv/

скрипт epilogue

примерно следующего содержания.


#!/bin/sh

echo '---------------------------------------------'
echo "Running PBS epilogue script"
USER=$2
NODEFILE=/var/spool/pbs/aux/$1

#Killing processes of user $USER on the batch nodes for node in 'cat $NODEFILE'
for i in $(cat $NODEFILE) ; do
ssh -x $i /usr/local/bin/skill -v -9 -u $USER > /var/null 2>&1
done


И второй правильный, установить на узлах mpiexec использовать для запуска своих MPI программ его а не mpirun
http://www.osc.edu/~pw/mpiexec/
Второй путь еще и повышает безопасность кластера.

И все проблемы

Удачи
Good-new


Вернуться к началу
  
 
 Заголовок сообщения: Re: ответ.
СообщениеДобавлено: 8 июн 05 19:06 
Не в сети

Зарегистрирован: 28 май 05 21:12
Сообщения: 217
Откуда: Москва
good-new писал(а):
Это известная проблема с mpich работающей под Open PBS.

Вопрос был про SGE, а не про OpenPBS, но по идее должно сработать


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: действительно ...SGE :) (-)
СообщениеДобавлено: 8 июн 05 19:10 
Andrew Sapronov писал(а):
good-new писал(а):
Это известная проблема с mpich работающей под Open PBS.

Вопрос был про SGE, а не про OpenPBS, но по идее должно сработать


Вернуться к началу
  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Часовой пояс: UTC + 4 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB