A więc: witaj w świecie R. ;-)
Proszę bardzo
Konfigurowanie kodu
urls <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxxxx"
)
readUrl <- function(url) {
out <- tryCatch(
{
# Just to highlight: if you want to use more than one
# R expression in the "try" part then you'll have to
# use curly brackets.
# 'tryCatch()' will return the last evaluated expression
# in case the "try" part was completed successfully
message("This is the 'try' part")
readLines(con=url, warn=FALSE)
# The return value of `readLines()` is the actual value
# that will be returned in case there is no condition
# (e.g. warning or error).
# You don't need to state the return value via `return()` as code
# in the "try" part is not wrapped insided a function (unlike that
# for the condition handlers for warnings and error below)
},
error=function(cond) {
message(paste("URL does not seem to exist:", url))
message("Here's the original error message:")
message(cond)
# Choose a return value in case of error
return(NA)
},
warning=function(cond) {
message(paste("URL caused a warning:", url))
message("Here's the original warning message:")
message(cond)
# Choose a return value in case of warning
return(NULL)
},
finally={
# NOTE:
# Here goes everything that should be executed at the end,
# regardless of success or error.
# If you want more than one expression to be executed, then you
# need to wrap them in curly brackets ({...}); otherwise you could
# just have written 'finally=<expression>'
message(paste("Processed URL:", url))
message("Some other message at the end")
}
)
return(out)
}
Stosowanie kodu
> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory
Badanie produkcji
> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"
[5] "</head><body>"
[6] ""
> length(y)
[1] 3
> y[[3]]
[1] NA
Dodatkowe uwagi
próbuj złapać
tryCatchzwraca wartość związaną z wykonaniem, exprchyba że wystąpi błąd lub ostrzeżenie. W takim przypadku określone wartości zwracane (patrz return(NA)wyżej) można określić, podając odpowiednią funkcję modułu obsługi (patrz argumenty errori warningin ?tryCatch). Mogą to być funkcje, które już istnieją, ale możesz je również zdefiniować w sobie tryCatch()(tak jak to zrobiłem powyżej).
Implikacje wyboru określonych wartości zwracanych przez funkcje obsługi
Jak ustaliliśmy, że NApowinien zostać zwrócony w przypadku błędu, trzecim elementem yjest NA. Gdybyśmy wybrali NULLwartość zwracaną, długość ybyłaby po prostu 2zamiast, 3ponieważ lapply()po prostu „ignoruje” zwracane wartości, które są NULL. Zauważ również, że jeśli nie określisz wyraźnej wartości zwracanej przez return(), funkcje modułu obsługi zwrócą NULL(tj. W przypadku błędu lub warunku ostrzegawczego).
Komunikat ostrzegawczy „niepożądany”
Ponieważ warn=FALSEwydaje się, że nie ma to żadnego efektu, alternatywnym sposobem tłumienia ostrzeżenia (które w tym przypadku tak naprawdę nie jest interesujące) jest użycie
suppressWarnings(readLines(con=url))
zamiast
readLines(con=url, warn=FALSE)
Wiele wyrażeń
Pamiętaj, że możesz także umieścić wiele wyrażeń w „rzeczywiste wyrażeń części” (teza expro tryCatch()) jeśli zawinąć je w nawiasach klamrowych (podobnie jak ja pokazano w finallyczęści).
pastefunkcjach kończy się spacją, dlaczego nie pominąć spacji isep=""?