To jest model wybaczającego parsera HTML. Zamiast analizować HTML i wyodrębniać atrybuty, w tym kodzie golfowym parser znaczników będzie prosty.
Napisz funkcję, która przeanalizuje strukturę znaczników i zwróci jej nawiasową formę. Znacznik otwierający składa się z jednej małej litery, a znacznik zamykający składa się z jednej wielkiej litery. Na przykład, aAbaAB
analizuje się (a)(b(a))
, czy w HTML <a></a><b><a></a></b>
. Oczywiście tagi mogą znajdować się w zestawieniu i zagnieżdżeniu.
Należy obsługiwać „przedwcześnie” zamknięte znaczniki. Na przykład w abcA
, A
zamyka skrajne a
, więc analizuje w (a(b(c)))
.
Dodatkowe znaczniki zamykające są po prostu ignorowane: aAB
analizuje w (a)
.
Nakładające się tagi NIE są obsługiwane. Na przykład abAB
analizuje (a(b))
, a nie (a(b))(b)
poprzednią zasadę dodatkowych tagów zamykających ( abAB
-> abA
( (a(b))
) + B
(extra)).
Zakładając, że na wejściu nie ma białych znaków i innych niedozwolonych znaków.
Nie możesz używać żadnej biblioteki.
Oto implementacja referencyjna i lista przypadków testowych:
#!/usr/bin/python
def pars(inpu):
outp = ""
stac = []
i = 0
for x in inpu:
lowr = x.lower()
if x == lowr:
stac.append(x)
outp += "(" + x
i = i + 1
else:
while len(stac) > 1 and stac[len(stac) - 1] != lowr:
outp += ")"
stac.pop()
i = i - 1
if len(stac) > 0:
outp += ")"
stac.pop()
i = i - 1
outp += ")" * i
return outp
tests = [
("aAaAbB", "(a)(a)(b)"),
("abBcdDCA", "(a(b)(c(d)))"),
("bisSsIB", "(b(i(s)(s)))"),
("aAabc", "(a)(a(b(c)))"),
("abcdDA", "(a(b(c(d))))"),
("abcAaA", "(a(b(c)))(a)"),
("acAC", "(a(c))"),
("ABCDEFG", ""),
("AbcBCabA", "(b(c))(a(b))")
]
for case, expe in tests:
actu = pars(case)
print "%s: C: [%s] E: [%s] A: [%s]" % (["FAIL", "PASS"][expe == actu], case, expe, actu)
Najkrótszy kod wygrywa.
AbcBCabA
(powinien parsować jako (b(c))(a(b))
. Mój kod mógłby być krótszy, z wyjątkiem tego przypadku.