Jak zgadł @Stefan w komentarzu do odpowiedzi @ CaptainGiraffe, możesz sporo zyskać, używając wektora struktur zamiast struktury wektorów. Poprawiony kod wygląda następująco:
#include <vector>
#include <cmath>
#include <iostream>
#include <time.h>
class FloodIsolation {
public:
FloodIsolation() :
h(0),
floodedCells(0),
floodedCellsTimeInterval(0),
qInflow(0),
qStartTime(0),
qEndTime(0),
lowerFloorCells(0),
cellLocationX(0),
cellLocationY(0),
cellLocationZ(0),
levelOfCell(0),
valueOfCellIds(0),
h0(0),
vU(0),
vV(0),
vUh(0),
vVh(0),
vUh0(0),
vVh0(0),
ghh(0),
sfx(0),
sfy(0),
qIn(0),
typeInterface(nEdges, 0),
neighborIds(nEdges, 0)
{
}
~FloodIsolation(){
}
void Update() {
h = h + 1;
floodedCells = !floodedCells;
floodedCellsTimeInterval = !floodedCellsTimeInterval;
qInflow = qInflow + 1;
qStartTime = qStartTime + 1;
qEndTime = qEndTime + 1;
lowerFloorCells = lowerFloorCells + 1;
cellLocationX = cellLocationX + 1;
cellLocationY = cellLocationY + 1;
cellLocationZ = cellLocationZ + 1;
levelOfCell = levelOfCell + 1;
valueOfCellIds = valueOfCellIds + 1;
h0 = h0 + 1;
vU = vU + 1;
vV = vV + 1;
vUh = vUh + 1;
vVh = vVh + 1;
vUh0 = vUh0 + 1;
vVh0 = vVh0 + 1;
ghh = ghh + 1;
sfx = sfx + 1;
sfy = sfy + 1;
qIn = qIn + 1;
for(int j = 0; j < nEdges; ++j) {
++typeInterface[j];
++neighborIds[j];
}
}
private:
static const int nEdges = 6;
bool floodedCells;
bool floodedCellsTimeInterval;
std::vector<int> neighborIds;
double valueOfCellIds;
double h;
double h0;
double vU;
double vV;
double vUh;
double vVh;
double vUh0;
double vVh0;
double ghh;
double sfx;
double sfy;
double qInflow;
double qStartTime;
double qEndTime;
double qIn;
double nx;
double ny;
double floorLevels;
int lowerFloorCells;
bool flagInterface;
std::vector<int> typeInterface;
bool floorCompleteleyFilled;
double cellLocationX;
double cellLocationY;
double cellLocationZ;
int levelOfCell;
};
int main() {
std::vector<FloodIsolation> isolation(20000);
clock_t start = clock();
for (int i = 0; i < 400; ++i) {
if(i % 100 == 0) {
std::cout << i << "\n";
}
for (auto &f : isolation)
f.Update();
}
clock_t stop = clock();
std::cout << "Time: " << difftime(stop, start) / 1000 << "\n";
}
Skompilowany za pomocą kompilatora z VC ++ 2015 CTP, używając -EHsc -O2b2 -GL -Qpar
, otrzymuję wyniki takie jak:
0
100
200
300
Time: 0.135
Kompilacja z g ++ daje wynik, który jest nieco wolniejszy:
0
100
200
300
Time: 0.156
Na tym samym sprzęcie, używając kompilatora / JVM z Java 8u45, otrzymuję wyniki takie jak:
0
100
200
300
Time: 181
Jest to około 35% wolniejsze niż wersja z VC ++ i około 16% wolniejsze niż wersja z g ++.
Jeśli zwiększymy liczbę iteracji do pożądanych 2000, różnica spadnie do zaledwie 3%, co sugeruje, że część zalet C ++ w tym przypadku to po prostu szybsze ładowanie (odwieczny problem z Javą), a nie samo wykonanie. Nie wydaje mi się to zaskakujące w tym przypadku - mierzone obliczenia (w opublikowanym kodzie) są tak trywialne, że wątpię, by większość kompilatorów mogła zrobić wiele, aby je zoptymalizować.
std::vector<bool>
wykorzystuje jeden bit na element, aby zaoszczędzić miejsce, co prowadzi do częstego przesuwania bitów. Jeśli chcesz prędkości, trzymaj się od niej z daleka. Użyjstd::vector<int>
zamiast tego.