Najpierw stworzyłem sobie wyrażenie regularne, które będzie pasowało do wszystkich unikalnych ścieżek bibliotek zewnętrznych na liście wszystkich plików nagłówkowych w projekcie. Tydzień temu zadałem pytanie dotyczące tworzenia tego wyrażenia regularnego .
Zacząłem się wtrącać, aby zobaczyć, jak będzie się zachowywał, gdy będzie asynchroniczny i gdy zostanie przekształcony w pracownika internetowego. Dla wygody i niezawodności stworzyłem ten uniwersalny plik, który działa we wszystkich trzech trybach:
/** Will call result() callback with every match it founds. Asynchronous unless called
* with interval = -1.
* Javadoc style comment for Arnold Rimmer and other Java programmers:
*
* @param regex regular expression to match in string
* @param string guess what
* @param result callback function that accepts one parameter, string match
* @param done callback on finish, has no parameters
* @param interval delay (not actual interval) between finding matches. If -1,
* function will be blocking
* @property working false if loop isn't running, otherwise contains timeout ID
* for use with clearTimeout
* @property done copy of done parameter
* @throws heavy boulders
**/
function processRegex(regex, string, result, done, interval) {
var m;
//Please tell me interpreter optimizes this
interval = typeof interval!='number'?1:interval;
//And this
processRegex.done = done;
while ((m = regex.exec(string))) {
Array.prototype.splice.call(m,0,1);
var path = m.join("");
//It's good to keep in mind that result() slows down the process
result(path);
if (interval>=0) {
processRegex.working = setTimeout(processRegex,
interval, regex, string,
result, done, interval);
// Comment these out for maximum speed
processRegex.progress = regex.lastIndex/string.length;
console.log("Progress: "+Math.round(processRegex.progress*100)+"%");
return;
}
}
processRegex.working = false;
processRegex.done = null;
if (typeof done=="function")
done();
}
processRegex.working = false;
Stworzyłem plik testowy, zamiast go wkleić tutaj, wrzuciłem go na bardzo niezawodny hosting: Demo - Dane testowe .
To, co uważam za bardzo zaskakujące, to fakt, że istnieje tak znacząca różnica między narzędziem roboczym sieci Web a wykonywaniem RegExp w przeglądarce. Wyniki, które otrzymałem:
- Mozilla Firefox
[WORKER]: Time elapsed:16.860s
[WORKER-SYNC]: Time elapsed:16.739s
[TIMEOUT]: Time elapsed:5.186s
[LOOP]: Time elapsed:5.028s
Możesz również zobaczyć, że w moim konkretnym wyrażeniu regularnym różnica między pętlą synchroniczną i asynchroniczną jest nieistotna. Próbowałem użyć listy dopasowań zamiast wyrażenia lookahead i wyniki bardzo się zmieniły. Oto zmiany w starej funkcji:
function processRegexUnique(regex, string, result, done, interval) {
var matchList = arguments[5]||[];
... same as before ...
while ((m = regex.exec(string))) {
... same as before ...
if (matchList.indexOf(path)==-1) {
result(path);
matchList.push(path);
}
if (interval>=0) {
processRegex.working = setTimeout(processRegex, interval,
regex, string, result,
done, interval, matchList);
... same as before ...
}
}
... same as before ...
}
A wyniki:
- Mozilla Firefox
[WORKER]: Time elapsed:0.062s
[WORKER-SYNC]: Time elapsed:0.023s
[TIMEOUT]: Time elapsed:12.250s
(uwaga dla siebie: z każdą minutą robi się coraz dziwniej)[LOOP]: Time elapsed:0.006s
Czy ktoś może wyjaśnić taką różnicę w szybkości?