Тестирование кластерной версии Priroda 08, метод RI-MP2

Сравнил одну и ту же задачу (расчёт энергии методом RI-MP2/L1 для Zr,Al,Cl,C14,H22), на:
1) 2-х ядрах (один узел, shared-memory) + использование временных файлов; Memory used = 321 486 KB
Memory used = 296 686 KB
Disk used = 1 359 076 KB, 5 615 611 KB written, 61 805 158 KB read
Disk used = 1 174 988 KB, 5 602 120 KB written, 63 477 093 KB read
Message passing statistics:
node sent KB # msg time received time
0 6502965 20443 14.8 6331083 23370 183.3
1 6331083 23370 12.5 6502965 20443 62.6
CPU time = 2170.81 sec = 36.18 min = 0.60 hr = 50.01%
CPU time = 2166.63 sec = 36.11 min = 0.60 hr = 49.92%
REAL time = 4340.58 sec = 72.34 min = 1.21 hr
ratio = 99.93%
2) 8-и ядрах (4 узла, mpich) + direct scf + использование временных файлов; Memory used = 104 084 KB
Memory used = 96 803 KB
...
Memory used = 96 803 KB
Disk used = 340 973 KB, 1 660 024 KB written, 3 753 728 KB read
Disk used = 154 254 KB, 1 252 573 KB written, 2 564 625 KB read
...
Disk used = 151 303 KB, 1 262 203 KB written, 2 708 858 KB read
Message passing statistics:
node sent KB # msg time received time
0 6520597 19913 90.2 6533594 18073 181.1
1 5934661 14291 338.0 6865495 16598 114.7
...
7 5934752 14257 308.7 6865571 16567 113.9
CPU time = 5097.08 sec = 84.95 min = 1.42 hr = 98.30%
CPU time = 5085.72 sec = 84.76 min = 1.41 hr = 98.09%
...
CPU time = 5089.17 sec = 84.82 min = 1.41 hr = 98.15%
REAL time = 5184.97 sec = 86.42 min = 1.44 hr
ratio = 786.30%
3) 8-и ядрах (4 узла, mpich) + временные файлы хранились в оперативной памяти узлов кластера; Memory used = 102 808 KB
Memory used = 95 527 KB
...
Memory used = 95 527 KB
Disk used = 507 944 KB, 1 727 872 KB written, 18 299 528 KB read
Disk used = 300 528 KB, 1 322 012 KB written, 14 799 208 KB read
...
Disk used = 298 637 KB, 1 338 523 KB written, 15 600 260 KB read
Message passing statistics:
node sent KB # msg time received time
0 6286869 16099 67.7 6534622 16905 102.3
1 5950730 13993 133.4 6646807 13654 67.2
...
7 5950447 13989 111.3 6646509 13653 67.1
CPU time = 742.32 sec = 12.37 min = 0.21 hr = 99.93%
CPU time = 742.57 sec = 12.38 min = 0.21 hr = 99.96%
CPU time = 742.96 sec = 12.38 min = 0.21 hr = 100.02%
...
CPU time = 742.64 sec = 12.38 min = 0.21 hr = 99.97%
REAL time = 742.83 sec = 12.38 min = 0.21 hr
ratio = 799.80%
4) 8-и ядрах (4 узла, mpich) + direct scf + временные файлы хранились в оперативной памяти узлов кластера; Memory used = 104 084 KB
Memory used = 96 803 KB
...
Memory used = 96 803 KB
Disk used = 340 973 KB, 1 660 024 KB written, 3 753 728 KB read
Disk used = 154 254 KB, 1 252 573 KB written, 2 564 625 KB read
...
Disk used = 151 303 KB, 1 262 203 KB written, 2 708 858 KB read
Message passing statistics:
node sent KB # msg time received time
0 6520597 19913 81.2 6533594 18073 111.8
1 5934661 14291 326.9 6865495 16598 85.4
...
7 5934752 14257 292.7 6865571 16567 78.3
CPU time = 4951.15 sec = 82.52 min = 1.38 hr = 99.96%
CPU time = 4952.22 sec = 82.54 min = 1.38 hr = 99.98%
...
CPU time = 4953.41 sec = 82.56 min = 1.38 hr = 100.01%
REAL time = 4953.09 sec = 82.55 min = 1.38 hr
ratio = 799.88%
В итоге время расчёта во втором случае даже малость увеличилось. Зато потребляемая память размазалась равномерно по всем узлам. В третьем случае (когда всё хранилось в ОЗУ, т.к. распределение задач на много узлов позволило уместить временные данные в ОЗУ) расчёт ускорился в 6 раз. В 4-м случае (при использовании direct scf) скорость опять падает, польза только от распределения памяти (возможности проведения расчётов, требующих большой объём ОЗУ). При включении direct scf потребляемая дисковая память уменьшилась в 2 раза.