Stroustrup opublikował ostatnio serię postów obalających popularne mity o C ++ . Piąty mit brzmi: „C ++ jest przeznaczony tylko dla dużych, skomplikowanych programów”. Aby go obalić, napisał prosty program C ++ pobierający stronę internetową i wydobywający z niej linki . Oto on:
#include <string>
#include <set>
#include <iostream>
#include <sstream>
#include <regex>
#include <boost/asio.hpp>
using namespace std;
set<string> get_strings(istream& is, regex pat)
{
set<string> res;
smatch m;
for (string s; getline(is, s);) // read a line
if (regex_search(s, m, pat))
res.insert(m[0]); // save match in set
return res;
}
void connect_to_file(iostream& s, const string& server, const string& file)
// open a connection to server and open an attach file to s
// skip headers
{
if (!s)
throw runtime_error{ "can't connect\n" };
// Request to read the file from the server:
s << "GET " << "http://" + server + "/" + file << " HTTP/1.0\r\n";
s << "Host: " << server << "\r\n";
s << "Accept: */*\r\n";
s << "Connection: close\r\n\r\n";
// Check that the response is OK:
string http_version;
unsigned int status_code;
s >> http_version >> status_code;
string status_message;
getline(s, status_message);
if (!s || http_version.substr(0, 5) != "HTTP/")
throw runtime_error{ "Invalid response\n" };
if (status_code != 200)
throw runtime_error{ "Response returned with status code" };
// Discard the response headers, which are terminated by a blank line:
string header;
while (getline(s, header) && header != "\r")
;
}
int main()
{
try {
string server = "www.stroustrup.com";
boost::asio::ip::tcp::iostream s{ server, "http" }; // make a connection
connect_to_file(s, server, "C++.html"); // check and open file
regex pat{ R"((http://)?www([./#\+-]\w*)+)" }; // URL
for (auto x : get_strings(s, pat)) // look for URLs
cout << x << '\n';
}
catch (std::exception& e) {
std::cout << "Exception: " << e.what() << "\n";
return 1;
}
}
Pokażmy Stroustrupowi, czym tak naprawdę jest mały i czytelny program.
- Pobieranie
http://www.stroustrup.com/C++.html
Wyświetl wszystkie linki:
http://www-h.eng.cam.ac.uk/help/tpl/languages/C++.html http://www.accu.org http://www.artima.co/cppsource http://www.boost.org ...
Możesz używać dowolnego języka, ale biblioteki innych firm nie są dozwolone.
Zwycięzca
Odpowiedź C ++ wygrana głosami, ale opiera się ona na bibliotece innej firmy (która jest niedozwolona przez zasady), a wraz z innym bliskim konkurentem Bashem opiera się na zhakowanym kliencie HTTP (nie będzie współpracować z HTTPS, gzip, przekierowania itp.). Więc Wolfram jest wyraźnym zwycięzcą. Kolejnym rozwiązaniem, które jest bardzo podobne pod względem wielkości i czytelności, jest PowerShell (z ulepszeniami wynikającymi z komentarzy), ale nie spotkał się on z dużym zainteresowaniem. Języki głównego nurtu ( Python , C # ) również były bardzo podobne.
Content-Type: text/html; charset=UTF-8
... Wyślę mu e-maila.
boost/asio
stosowany jest tam, który jest biblioteką trzeciej. Mam na myśli, w jaki sposób konkurować będą języki, które nie obejmują pobierania adresów URL / TCP jako części standardowej biblioteki?