Istnieje kilka różnych sposobów usuwania HTML tagsplików NSStringw formacie in Cocoa.
Jednym ze sposobów jest wyrenderowanie ciągu znaków NSAttributedStringi pobranie wyrenderowanego tekstu.
Innym sposobem jest użycie NSXMLDocument's- objectByApplyingXSLTStringmetody zastosowania XSLTtransformacji, która to robi.
Niestety iPhone nie obsługuje NSAttributedStringlub NSXMLDocument. Jest zbyt wiele przypadków skrajnych i źle sformułowanych HTMLdokumentów, abym czuł się komfortowo używając wyrażeń regularnych lub NSScanner. Czy ktoś ma na to rozwiązanie?
Jedną z sugestii było po prostu szukanie znaków otwierających i zamykających znaczników, ta metoda nie zadziała z wyjątkiem bardzo trywialnych przypadków.
Na przykład te przypadki (z rozdziału książki kucharskiej Perla na ten sam temat) zepsują tę metodę:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>