Внимание!

Мы используем cookie для сохранения в вашем браузере информации о ваших предыдущих посещениях. Это необходимо для более удобной работы с сайтом.
Если Вы с этим не согласны, вы можете отключить использование cookie в настройках браузера.
Принять

Тестирование кластерной версии Priroda 08, метод RI-MP2

Хранитель
Zheka
Хранитель

Сравнил одну и ту же задачу (расчёт энергии методом RI-MP2/L1 для Zr,Al,Cl,C14,H22), на:

1) 2-х ядрах (один узел, shared-memory) + использование временных файлов; Memory used =   321 486 KB
Memory used =   296 686 KB
  Disk  used =  1 359 076 KB,       5 615 611 KB written,     61 805 158 KB read
  Disk  used =  1 174 988 KB,       5 602 120 KB written,     63 477 093 KB read

Message passing statistics:
node     sent KB   # msg    time          received      time
    0     6502965   20443    14.8     6331083   23370   183.3
    1     6331083   23370    12.5     6502965   20443    62.6

CPU  time = 2170.81 sec = 36.18 min = 0.60 hr =   50.01%
CPU  time = 2166.63 sec = 36.11 min = 0.60 hr =   49.92%
REAL time = 4340.58 sec = 72.34 min = 1.21 hr
ratio     =   99.93%

2) 8-и ядрах (4 узла, mpich) + direct scf + использование временных файлов; Memory used =   104 084 KB
Memory used =    96 803 KB
...
Memory used =    96 803 KB
  Disk  used =   340 973 KB,       1 660 024 KB written,      3 753 728 KB read
  Disk  used =   154 254 KB,       1 252 573 KB written,      2 564 625 KB read
...
  Disk  used =   151 303 KB,       1 262 203 KB written,      2 708 858 KB read

Message passing statistics:
node     sent KB   # msg    time          received      time
    0     6520597   19913    90.2     6533594   18073   181.1
    1     5934661   14291   338.0     6865495   16598   114.7
...
    7     5934752   14257   308.7     6865571   16567   113.9

CPU  time = 5097.08 sec = 84.95 min = 1.42 hr =   98.30%
CPU  time = 5085.72 sec = 84.76 min = 1.41 hr =   98.09%
...
CPU  time = 5089.17 sec = 84.82 min = 1.41 hr =   98.15%
REAL time = 5184.97 sec = 86.42 min = 1.44 hr
ratio     =  786.30%

3) 8-и ядрах (4 узла, mpich) + временные файлы хранились в оперативной памяти узлов кластера; Memory used =   102 808 KB
Memory used =    95 527 KB
...
Memory used =    95 527 KB
  Disk  used =   507 944 KB,       1 727 872 KB written,     18 299 528 KB read
  Disk  used =   300 528 KB,       1 322 012 KB written,     14 799 208 KB read
...
  Disk  used =   298 637 KB,       1 338 523 KB written,     15 600 260 KB read
Message passing statistics:
node     sent KB   # msg    time          received      time
    0     6286869   16099    67.7     6534622   16905   102.3
    1     5950730   13993   133.4     6646807   13654    67.2
...
    7     5950447   13989   111.3     6646509   13653    67.1

CPU  time =  742.32 sec = 12.37 min = 0.21 hr =   99.93%
CPU  time =  742.57 sec = 12.38 min = 0.21 hr =   99.96%
CPU  time =  742.96 sec = 12.38 min = 0.21 hr =  100.02%
...
CPU  time =  742.64 sec = 12.38 min = 0.21 hr =   99.97%
REAL time =  742.83 sec = 12.38 min = 0.21 hr
ratio     =  799.80%

4) 8-и ядрах (4 узла, mpich) + direct scf + временные файлы хранились в оперативной памяти узлов кластера; Memory used =   104 084 KB
Memory used =    96 803 KB
...
Memory used =    96 803 KB
  Disk  used =   340 973 KB,       1 660 024 KB written,      3 753 728 KB read
  Disk  used =   154 254 KB,       1 252 573 KB written,      2 564 625 KB read
...
  Disk  used =   151 303 KB,       1 262 203 KB written,      2 708 858 KB read
Message passing statistics:
node     sent KB   # msg    time          received      time
    0     6520597   19913    81.2     6533594   18073   111.8
    1     5934661   14291   326.9     6865495   16598    85.4
...
    7     5934752   14257   292.7     6865571   16567    78.3

CPU  time = 4951.15 sec = 82.52 min = 1.38 hr =   99.96%
CPU  time = 4952.22 sec = 82.54 min = 1.38 hr =   99.98%
...
CPU  time = 4953.41 sec = 82.56 min = 1.38 hr =  100.01%
REAL time = 4953.09 sec = 82.55 min = 1.38 hr
ratio     =  799.88%

В итоге время расчёта во втором случае даже малость увеличилось. Зато потребляемая память размазалась равномерно по всем узлам. В третьем случае (когда всё хранилось в ОЗУ, т.к. распределение задач на много узлов позволило уместить временные данные в ОЗУ) расчёт ускорился в 6 раз. В 4-м случае (при использовании direct scf) скорость опять падает, польза только от распределения памяти (возможности проведения расчётов, требующих большой объём ОЗУ). При включении direct scf потребляемая дисковая память уменьшилась в 2 раза.

abcdefghijklmnopqrstuvwxyz абвгдеёжзийклмнопрстуфхцчшщьыъэюя
abcdefghijklmnopqrstuvwxyz абвгдеёжзийклмнопрстуфхцчшщьыъэюя
Сменить аватар
Секретный вопрос
<%= q %>
Наложить бан
Пользователь
USER
Сделать предупреждение
Пользователю
USER