Здравствуйте! Подскажите, есть ли какой-то подход для определения количества процессоров, на котором параллельный алгоритм будет выполнен за наименьшее время для разных схем обмена? Знаю, что при увеличении количества процессоров до определенного момента время выполнения параллельного алгоритма будет уменьшатся, но после того как время обмена будет на порядок больше времени счета, т.е. обмены начнут "давить" дальнейшее увеличение количества процессоров не имеет смысла. Необходимо определить на каком количестве процессоров выполнение параллельного алгоритма наиболее эффективна для разных типовых схем обмена. Схемы обмена: дифференцированный, трансляционный, трансляционно-циклический, конвейерно-параллельный, коллекторный. Наиболее интересны трансляционно-циклический и конвейерно-параллельный. Если кто-то занимался чем-то подобным или знает людей, кто занимался или встречал статьи на эту тему, буду очень признателен.
|