Czasami musimy użyć pętli, na przykład, gdy nie wiemy, ile iteracji potrzebujemy, aby uzyskać wynik. Weźmy na przykład pętle while. Poniżej znajdują się metody, których absolutnie powinieneś unikać:
a=numeric(0)
b=1
system.time(
{
while(b<=1e5){
b=b+1
a<-c(a,pi)
}
}
)
# user system elapsed
# 13.2 0.0 13.2
a=numeric(0)
b=1
system.time(
{
while(b<=1e5){
b=b+1
a<-append(a,pi)
}
}
)
# user system elapsed
# 11.06 5.72 16.84
Są one bardzo nieefektywne, ponieważ R kopiuje wektor za każdym razem, gdy jest dołączany.
Najbardziej wydajnym sposobem dołączania jest użycie indeksu. Zauważ, że tym razem pozwoliłem iterować 1e7 razy, ale nadal jest znacznie szybszy niż c
.
a=numeric(0)
system.time(
{
while(length(a)<1e7){
a[length(a)+1]=pi
}
}
)
# user system elapsed
# 5.71 0.39 6.12
To jest do zaakceptowania. I możemy zrobić to nieco szybciej, zastępując [
z [[
.
a=numeric(0)
system.time(
{
while(length(a)<1e7){
a[[length(a)+1]]=pi
}
}
)
# user system elapsed
# 5.29 0.38 5.69
Może już zauważyłeś, że length
może to być czasochłonne. Jeśli zastąpimy length
licznikiem:
a=numeric(0)
b=1
system.time(
{
while(b<=1e7){
a[[b]]=pi
b=b+1
}
}
)
# user system elapsed
# 3.35 0.41 3.76
Jak wspominali inni użytkownicy, wstępne przydzielenie wektora jest bardzo pomocne. Ale jest to kompromis między szybkością a zużyciem pamięci, jeśli nie wiesz, ile pętli potrzebujesz, aby uzyskać wynik.
a=rep(NaN,2*1e7)
b=1
system.time(
{
while(b<=1e7){
a[[b]]=pi
b=b+1
}
a=a[!is.na(a)]
}
)
# user system elapsed
# 1.57 0.06 1.63
Metoda pośrednia polega na stopniowym dodawaniu bloków wyników.
a=numeric(0)
b=0
step_count=0
step=1e6
system.time(
{
repeat{
a_step=rep(NaN,step)
for(i in seq_len(step)){
b=b+1
a_step[[i]]=pi
if(b>=1e7){
a_step=a_step[1:i]
break
}
}
a[(step_count*step+1):b]=a_step
if(b>=1e7) break
step_count=step_count+1
}
}
)
#user system elapsed
#1.71 0.17 1.89
vector = values
; lub możesz zrobić wektor = wektor + wartości. Ale mogę źle zrozumieć twój przypadek użycia