PARALLEL.RU

Дискуссионный клуб по параллельным вычислениям
Текущее время: 23 июл 18 18:20

Часовой пояс: UTC + 4 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 7 ] 
Автор Сообщение
СообщениеДобавлено: 6 фев 12 20:56 
Не в сети

Зарегистрирован: 6 фев 12 20:42
Сообщения: 4
Здравствуйте. Стоит задача запуска заданий через qsub не с консоли, где запущен pbs_server, а с одного из вычислительных узлов, где соответственно запущен pbs_mom.
При этом возникает следующая ошибка:
Код:
qsub: Bad UID for job execution MSG=ruserok failed validating user/user from node-01
.
Возможно ли осуществить задуманное в принципе?


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 7 фев 12 14:39 
Не в сети

Зарегистрирован: 30 ноя 05 16:09
Сообщения: 130
Откуда: Ростов-на-Дону
Работает такая штука без проблем.
Возможно, Вы пытаетесь запустить задание под root?
Это запрешено даже на сервере.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 8 фев 12 2:29 
Не в сети

Зарегистрирован: 6 фев 12 20:42
Сообщения: 4
Дацюк В.Н. писал(а):
Работает такая штука без проблем.
Возможно, Вы пытаетесь запустить задание под root?
Это запрешено даже на сервере.

Нет, к сожалению, запускаю от обычного пользователя. В случае запуска от рута сообщение об ошибке выглядит иначе:
Код:
qsub: Bad UID for job execution MSG=root user root not allowed

А вы не могли бы описать, при какой конфигурации это работает? (дистрибутив линукса, версия torque, как он был установлен (из репозиториев дистрибутива или собран вручную), разрядность системы). Был бы очень признателен.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 8 фев 12 15:21 
Не в сети

Зарегистрирован: 30 ноя 05 16:09
Сообщения: 130
Откуда: Ростов-на-Дону
Ситуация следующая.
У нас 4-е небольших кластера с числом узлов от 10 до 20
управляются одним сервером, на котором запущен pbs_server, pbs_shed и pbs_mom.и набор PBS команд.
На всех остальных компьютерах только pbs_mom и набор команд.
Кластеры разной архитектуры - два 64-x битных, два 32-x битных.
Везде установлена SUSE SLES11.
Экспорт файлов NFS.
Аутентификация NIS.
Удаленное исполнение команд rsh.
Torque 2.3.6 - собирался вручную ( как и практически все подсистемы)
Помимо главного сервера у некоторых серверов есть свои управляющие компьютеры,
но на них запущен только pbs_mom. Команда qsub работает с любого компьютера:
главного сервера, вспомогательного, вычислительного узла.
Скорее всего у Вас какие-то проблемы с аутентификацией.
Работает ли запуск удаленной команды с любого компьютера на любой?
Со стороны Torque ни каких ограничений нет. Можно даже запускать задания
на другой сервер, как в грид-системах..


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 8 фев 12 15:28 
Не в сети

Зарегистрирован: 30 ноя 05 16:09
Сообщения: 130
Откуда: Ростов-на-Дону
Да, кстати.
Вспомнил еще оду вещь.
На сервере должно быть установлено разрешение
на прием заданий с других компьютеров.
что-то типа такого:
set server acl_host_enable = True
set server acl_hosts = *.cc.rsu.ru
set server acl_hosts += rsusu1.rnd.runnet.ru
set server acl_hosts += *.hpc.net
set server acl_hosts += rsufs


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 8 фев 12 20:23 
Не в сети

Зарегистрирован: 6 фев 12 20:42
Сообщения: 4
Спасибо за Ваше время. Ответ на свой вопрос я нашел здесь здесь:
Цитата:
Bad UID for Job execution

If a user attempts to submit a job to PBS receives the following error
message Bad UID for execution, the user has not been authorized to run
on the server or execution host.

PBS does not assume a uniform UID space; that means that UserA on
HostX may not be the same user as UserA on HostY. Therefore if
UserA at HostX submits a job to be run on HostY as UserA, or anyother
named user, then PBS must be told that is ok. This authorization is
performed by PBS by calling the common C library call ruserok(). Thus
on HostY, either HostX must appear in the file /etc/hosts.equiv, or
UserA at HostX must appear in UserA's .rhosts file.

Все заработало после добавления нужного вычислительного узла в /etc/hosts.equiv.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 10 фев 15 15:06 
Не в сети

Зарегистрирован: 10 фев 15 12:33
Сообщения: 1
Torque 2.3.6 - собирался вручную ( как и практически все подсистемы)
Помимо главного сервера у некоторых серверов есть свои управляющие компьютеры,
но на них запущен только pbs_mom. Команда qsub работает с любого компьютера:
главного сервера, вспомогательного, вычислительного узла.
Скорее всего у Вас какие-то проблемы с аутентификацией.
Работает ли запуск удаленной команды с любого компьютера на любой?
Со стороны Torque ни каких ограничений нет. Можно даже запускать задания
на другой сервер, как в грид-системах..

_________________
Unlock the key of your success by braindumps.com and braindumps.com - ccna By using our latest passguide and ju study Southern California Institute of Architecture you can easily pass selftestengine exam.


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Часовой пояс: UTC + 4 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 0


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB