Muszę przeanalizować (po stronie serwera) duże ilości stron HTML.
Wszyscy zgadzamy się, że regexp nie jest właściwą drogą.
Wydaje mi się, że javascript jest natywnym sposobem parsowania strony HTML, ale założenie to opiera się na kodzie po stronie serwera, który ma wszystkie możliwości DOM, jakie javascript ma w przeglądarce.
Czy Node.js ma wbudowaną taką możliwość?
Czy jest lepsze podejście do tego problemu, analizowanie kodu HTML po stronie serwera?