PARALLEL.RU

Дискуссионный клуб по параллельным вычислениям
Текущее время: 6 дек 19 5:45

Часовой пояс: UTC + 4 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 55 ]  На страницу Пред.  1, 2, 3, 4
Автор Сообщение
 Заголовок сообщения: Re: openPBS
СообщениеДобавлено: 8 июн 05 19:44 
Не в сети

Зарегистрирован: 28 май 05 21:12
Сообщения: 217
Откуда: Москва
Good-new писал(а):
++++Довожу до Вашего сведения... :) что OSCAR использует Torque, а не OpenPBS

все замечательно, только Torque в OSCAR как штатный пакет появился с версии 4.1 в 4.0 он был как дополнительный, а в 3.0 его вообще не было. Штатно же в OSCAR используется OpenPBS и MAUI.

Не был он там как дополнительный:
The Open Cluster Group is please to announce the release of OSCAR version 4.0.
Feature list of 4.0:
* Red Hat Linux 9, Red Hat Linux Enterprise Linux (RHEL) 3, and Fedora Core 2 support
* New RPM dependency finder helps build the server (DepMan/PackMan)
* SIS 3.3.2
* Ganglia is now included in the distribution
* Torque is now included as the default scheduler (OpenPBS can still be downloaded from OPD)
* Multiple bug fixes and Wizard improvements

Good-new писал(а):
возможно, я просто хочу донести нехитрую мысль..
OpenPBS реальная система, которую можно использовать и которую используют. Сложности в ней не больше чем в прочих решениях. Собственно это все :)

OpenPBS это реально мертвая система. Работы над которой остановились несколько лет назад и пошли в направлении PBSpro, TorquePBS и SGE, принципы которых аналогичны. Все они реализуют POSIX 1003.2b и действительно очень просты как в установке, так и в осбслуживании.
Как Вы думаете, почему OpenPBS убран из OSCAR? И почему к нему так много патчей? И почему он не всегда работает?
Good-new писал(а):
я просто не только для вас пишу...;)

Неужели:
Good-new писал(а):
Ваши комментарии не уместны. Система диспетчеризации (и вообще кластерное ПО) должна уметь обрабатывать такие ситуации. И за аксиому берется то, что в любой момент времени узел/сервер.


Нет проблем. Если вы один или несколько узлов падает OpenPBS легко справляется с этой задачей. Сложности возникают в случае если упавший узл исполь ...


Первый абзац - моя реплика. И я понимаю, что текст который ниже предназначается мне... значит и отвечать мне...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 8 июн 05 19:53 
+++++ Предположения - не её дело.

Правильно. И я о том же.

++++Ы?
Локальная сеть != Ethernet network.

локальная сеть рабочих станций в самом широком смысле.

+++ Хотя НАСА вроде была довольна использованием SETIatHome, которая как раз такие места и использовала.

штука в том какие задачи вы решаете.


++++Ну это и колючему ёжику понятно. И про однородность софта не забывать.

вы удивитесь, но есть люди которые думаю иначе :)

Цитата:
и ДАВНО используются

Зря вы так. Некоторые которые придуманы и реализованы ДАВНО, бывают просто не работают на новых ядрах. Поэтому берутся новые версии, которые вполне могут быть и нестабильными.

все правильно. только поддержка системы для новых платформ требует ресурсов...вопрос, с какие перспективы у новой системы по сравнению с той которая зарекомендовала себя и уже имеет популярность. правильный ответ ИМХО - все дело в том кто ее продвигает. :)

Цитата:
С помощью СУ OSCAR установлено порядка 30% всех кластеров из Top500

Что же, это хорошо. Но и масштаб несколько другой кластеров в топ500 и в топ50 СНГ. Не думаю что все решения приемлимые в одном случае легко перносятся на другой.[/quote]

замечательно переносятся. проверено, не сомнивайтесь ;)

good-new


Вернуться к началу
  
 
 Заголовок сообщения:
СообщениеДобавлено: 8 июн 05 20:04 
Не в сети

Зарегистрирован: 28 май 05 21:12
Сообщения: 217
Откуда: Москва
good-new писал(а):
штука в том какие задачи вы решаете.

Вы в начале делаете утверждение, потом поправляетесь, а потом ...
оправдываться будете...

good-new писал(а):
все правильно. только поддержка системы для новых платформ требует ресурсов...вопрос, с какие перспективы у новой системы по сравнению с той которая зарекомендовала себя и уже имеет популярность. правильный ответ ИМХО - все дело в том кто ее продвигает. :)

Дело не в этом. Дело в том, что в случае OpenPBS, поддержка старого намного дороже (во многих смыслах), чем нового. А когда старое порой безбожно глючит...
good-new писал(а):
замечательно переносятся. проверено, не сомнивайтесь ;)

Я, например, не сомневаюсь... А слово "проверено" из Ваших уст требует доказательств. Ссылки в студию. Или Вы просто имеете ввиду, что кто то из top50 использует такие же инструменты? Что значит проверено? И кем?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: openPBS
СообщениеДобавлено: 8 июн 05 20:10 
++++The Open Cluster Group is please to announce the release of OSCAR version 4.0.

тут ключевое 4.0. До этого в 3.0 был как дополнительный и скачивался отдельно. Тут спорить не о чем, скачайте, поставьте увидете.

+++OpenPBS это реально мертвая система. Работы над которой остановились несколько лет назад и пошли в направлении PBSpro, TorquePBS и SGE, принципы которых аналогичны.

собственно я горю не о ее живучести, я говорю о ее работоспособности.

+++Все они реализуют POSIX 1003.2b и действительно очень просты как в установке, так и в осбслуживании.

да это так. как раз это я и утверждал.
интересно...что первое появилось POSIX 1003.2b или OpenPBS :)


+++Как Вы думаете, почему OpenPBS убран из OSCAR?
могу спросить у ее авторов. если будет интересный ответ напишу сюда.

+++И почему он не всегда работает?
в данном контексте есть смысл обсуждать только конкретные ситуации. Не всегда работает даже легально купленный xp :)


+++Первый абзац - моя реплика. И я понимаю, что текст который ниже предназначается мне... значит и отвечать мне...[/quote]

эт. пожалуйста :)

good-new.


Вернуться к началу
  
 
 Заголовок сообщения:
СообщениеДобавлено: 8 июн 05 20:20 
+++Вы в начале делаете утверждение, потом поправляетесь, а потом ...оправдываться будете...

вы экстрасенс? :)

+++Дело не в этом. Дело в том, что в случае OpenPBS, поддержка старого намного дороже (во многих смыслах), чем нового. А когда старое порой безбожно глючит...

в только откуда уверенность что новое будет лучше и сопровождать его будет дешевле? :)

+++Я, например, не сомневаюсь... А слово "проверено" из Ваших уст требует доказательств.

перечитайте тот пост из которого вы скопировали цитату. речь там идет о преносимости OSCAR для систем большого масштаба на небольшие кластеры.

про это я написал "проверено" поскольку с использованием данного софта у меня был опыт построения кластеров. И он (опыт) положительный.

goodnew


Вернуться к началу
  
 
 Заголовок сообщения: Re: openPBS
СообщениеДобавлено: 8 июн 05 20:33 
Не в сети

Зарегистрирован: 28 май 05 21:12
Сообщения: 217
Откуда: Москва
good-new писал(а):
++++The Open Cluster Group is please to announce the release of OSCAR version 4.0.
тут ключевое 4.0. До этого в 3.0 был как дополнительный и скачивался отдельно. Тут спорить не о чем, скачайте, поставьте увидете.

Я не спорю. Это Вы уважаемый гость спорите сам с собой:
good-new писал(а):
все замечательно, только Torque в OSCAR как штатный пакет появился с версии 4.1 в 4.0 он был как дополнительный, а в 3.0 его вообще не было. Штатно же в OSCAR используется OpenPBS и MAUI.

Надоело... 4.0!=4.1 Следите за собой.
good-new писал(а):
собственно я горю не о ее живучести, я говорю о ее работоспособности.


Причем тут "живучесть". Я говорил лишь о постепенной потери работоспособности у OpenPBS. А "живучеть", если Вам так нравится термин, определяется работоспособностью.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: openPBS
СообщениеДобавлено: 8 июн 05 20:34 
++++Причем тут "живучесть". Я говорил лишь о постепенной потери работоспособности у OpenPBS.


ок. будем считать что поговорили. :)


Вернуться к началу
  
 
 Заголовок сообщения:
СообщениеДобавлено: 9 июн 05 10:50 
Не в сети

Зарегистрирован: 11 дек 02 19:37
Сообщения: 872
Откуда: НИВЦ МГУ
Andrew Sapronov писал(а):
Что значит пассивный мониторинг? Т.е. имеет ся возможность запуска задач в обход системы диспетчеризации? Программка-агент - демон?


Сорри, что поздно отвечаю - был немного занят. Пассивный означает, что программа не пускается из под демона-монитора на узле и не контролиуется им напрямую. Не происходит вмешательства в обычную схему запуска задачи (хотя в Cleo есть и такой режим). Но при этом все процесы задачи отслеживаются и в случае, если задача должна завершиться, то её процессы прибиваются агентом-монитором на узле.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 10 июн 05 21:56 
Уважаемые господа,
В который раз приходится констатировать, что нет в мире
совершенства. Действительно, TORQUE PBS не повисает при
отключении одного из узлов. Система продолжает функционировать.
Но в нем возникает другая неприятность, задача упавшего узла продолжает висеть в очереди и никакими силами удалить ее не возможно.
Не помогает ни команда qdel, ни какие-либо ручные манипуляции.
Это конечно меньшая неприятность, чем повисание системы,
но все равно противно.
Andrew Sapronov советовал воспользоваться готовой конфигурацией
типа OSCAR. Этот вариант для нас не приемлем. Сервер и планировщик
висят на SUN'e под Solaris'ом. И управляют двумя кластерами RH9,
двумя SUN,ами и ALPHA станцией. Все прекрасно работает,
на каждую архитектуру поддерживается своя очередь. Зависания
бывают редко - раза два в год. Но это пока узлов мало.
Поэтому от этих мелких неувязок хотелось бы избавиться.
Отдельное спасибо Andrew Sapronov за дельный совет,
в каком направлении нужно двигаться.


Вернуться к началу
  
 
 Заголовок сообщения:
СообщениеДобавлено: 11 июн 05 8:35 
Не в сети

Зарегистрирован: 28 май 05 21:12
Сообщения: 217
Откуда: Москва
Дацюк В.Н. писал(а):
Сервер и планировщик
висят на SUN'e под Solaris'ом. И управляют двумя кластерами RH9,
двумя SUN,ами и ALPHA станцией. Все прекрасно работает,
на каждую архитектуру поддерживается своя очередь.

Как себя ведет PBS с разными архитектурами я не знаю. Может быть именно в этом дело или на однотипном железе тоже ошибки? Вы в догонку к Torque попробуйте PBS от SUN -- SGE (http://gridengine.sunsource.net/).
Я с ним не работал. Возможно, на "родном железе" все будет как положено. Если решите ставить, то хотелось бы услышать мнение об SGE.

to all А может у кого есть опыт работы с SGE?

Дацюк В.Н. писал(а):
в каком направлении нужно двигаться.

Однозначно вперед :)


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 55 ]  На страницу Пред.  1, 2, 3, 4

Часовой пояс: UTC + 4 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB