Prawidłowy typ treści dla dokumentów XML, HTML i XHTML


123

Jakie są prawidłowe typy treści dla dokumentów XML, HTML i XHTML?

Muszę napisać prostego robota, który pobiera tylko tego typu pliki.

Obecnie http://example.net/index.html może służyć na przykład jako plik JPEG dzięki mod_rewrite, dlatego muszę sprawdzić typ zawartości z nagłówka odpowiedzi i porównać go z listą dozwolonych typów treści.

Skąd mogę wziąć taką listę?


Odpowiedzi:


206

HTML: text/htmlkropka.

XHTML: application/xhtml+xml, lub tylko wtedy, gdy następujące wytyczne HTML compatbility, text/html. Patrz uwaga dotycząca typów mediów W3 .

XML: text/xml, application/xml( RFC 2376 ).

Istnieje również wiele innych typów mediów opartych na XML, na przykład application/rss+xmllub image/svg+xml. Można bezpiecznie założyć, że każda nierozpoznana, ale zarejestrowana końcówka +xmlma rozszerzenie XML. Zobacz listę IANA dla zarejestrowanych typów mediów kończących się na +xml.

(W przypadku niezarejestrowanych x-typów wszystkie zakłady są wyłączone, ale masz nadzieję, +xmlże zostaną uszanowane).


32
O różnicach między text/xmli application/xmlzobacz tutaj stackoverflow.com/questions/4832357/…
sanmai

To samo dotyczy fragmentów , zobacz w3.org/TR/xml-fragment lub tę inną qustion .
Peter Krauss
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.