PARALLEL.RU

Дискуссионный клуб по параллельным вычислениям
Текущее время: 23 сен 18 7:32

Часовой пояс: UTC + 4 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 2 ] 
Автор Сообщение
СообщениеДобавлено: 9 июл 13 8:36 
Не в сети

Зарегистрирован: 9 июл 13 8:30
Сообщения: 1
Есть ли у кого какие-либо результаты или идеи по OpenMP как эффективно распараллелить матрично-векторное умножение в CSR формате? Данный код даёт ускорение всего в 2 раза на 12ти ядрах(Intel Xeon X5650). Хотелось бы больше. Размер матрицы 10^6 строчек.

#pragma omp for private(j)
for (i = 0; i < n; i++)
{
y[i] = 0;
for (j = row_ptr[i]; j < row_ptr[i+1]; j++)
y[i] += values[j] * x[cols_ind[j]];
}


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 9 авг 13 15:46 
Не в сети

Зарегистрирован: 28 май 07 12:10
Сообщения: 47
Откуда: ИПС РАН
А на сколько (процентов) заполнена сама матрица ?
Т.е., сколько элементов в массиве values ?

Если в каждой строке до десятка значений,
то ускорение нормальное ...


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 2 ] 

Часовой пояс: UTC + 4 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB