Po niedawnej dyskusji na temat korzystania z narzędzi kompresji w kodzie golfowym pomyślałem, że napisanie własnego kompresora i dekompresora byłoby niezłym wyzwaniem.
Napisz dwa programy : jeden do kompresji tekstu ASCII do sekwencji bajtów, a drugi do jego dekompresji. Programy nie muszą być w tym samym języku.
Pierwszy program powinien odczytać fragment tekstu ASCII (z pliku lub ze standardowego wejścia lub używając dowolnego mechanizmu najbardziej naturalnego dla języka) i wypisać jego skompresowaną wersję. (Skompresowane dane wyjściowe mogą składać się z dowolnych bajtów; nie muszą być czytelne.) Drugi program powinien odczytać dane wyjściowe pierwszego i odtworzyć oryginalny tekst wejściowy.
Wynik rozwiązania będzie sumą następujących trzech liczb:
- Długość sprężarki programu w postaci.
- Długość wyjściu sprężarki, ze względu na wejście testu poniżej, w bajtach.
- Długość dekompresor programu (jeżeli różni się od sprężarki) w znakach.
Powinieneś zanotować wszystkie trzy liczby i ich sumę w swojej odpowiedzi. Ponieważ jest to kod golfowy, im niższy wynik, tym lepiej.
Zasady i ograniczenia:
Nie możesz używać żadnych wcześniej istniejących narzędzi lub bibliotek do kompresji lub dekompresji, nawet jeśli są dostarczane w pakiecie z wybranym językiem. W razie wątpliwości, czy dane narzędzie lub funkcja jest dozwolona, zapytaj.
Twój program kompresujący musi być w stanie obsłużyć dane wejściowe składające się z dowolnego tekstu ASCII do wydruku , w tym tabulatorów (ASCII 9) i znaków nowej linii (ASCII 10). Użytkownik może, ale nie musi, obsługiwać dowolne dane Unicode i / lub dane binarne.
Twój program dekompresyjny musi wytwarzać dokładnie takie same wyjście, jakie podano sprężarce jako wejście. W szczególności uważaj, aby nie wysyłać końcowego wiersza linii, jeśli dane wejściowe go nie miały. (Poniżej Wejście Test ma nowego wiersza spływu, więc trzeba do tego testu oddzielnie dla GolfScript Tip.
).Kompresor i dekompresor mogą być tym samym programem (z wybranym trybem wybranym np. Z przełącznikiem wiersza poleceń). W takim przypadku jego długość jest liczona tylko raz .
Programy nie powinny być zbyt wolne ani wymagające pamięci . Jeśli kompresja lub dekompresja wejścia testowego zajmie więcej niż minutę na moim nie tak nowym komputerze stacjonarnym (AMD Athlon64 X2 2,2 GHz) lub zużyje więcej niż gigabajt pamięci RAM, będę orzekać, że rozwiązanie jest nieprawidłowe. Limity te są celowo luźne - staraj się ich nie przekraczać. (Patrz poprawka poniżej: musisz być w stanie obsłużyć co najmniej 100 kB danych wejściowych w tych granicach).
Nawet jeśli tylko wejście testowe ma znaczenie dla punktacji, powinieneś przynajmniej starać się skompresować dowolny tekst wejściowy. Rozwiązanie, które osiąga przyzwoity stopień kompresji tylko dla wejścia testowego i nic poza tym, jest technicznie ważne, ale nie dostanie ode mnie opinii.
Programy kompresora i dekompresora powinny być samodzielne . W szczególności, jeśli zależy to od możliwości odczytania pliku lub zasobu sieciowego, który nie jest częścią standardowego środowiska wykonawczego wybranego języka, długość tego pliku lub zasobu należy liczyć jako część długości programu (programów). (Ma to na celu wyłączenie „kompresorów”, które porównują dane wejściowe z plikiem w sieci i jeśli pasują, wyprowadzają zero bajtów. Przepraszam, ale to już nie jest nowa sztuczka.)
Poprawki i wyjaśnienia:
Kompresor musi obsługiwać pliki składające się z co najmniej 100 kB typowego tekstu w języku angielskim w rozsądnym czasie i przy użyciu pamięci (maksymalnie jedna minuta i jeden GB pamięci). Twój dekompresor musi być w stanie dekompresować wynikowy wynik w tych samych granicach. Oczywiście możliwość dłuższego przetwarzania plików jest w porządku i godna pochwały. Można podzielić długie pliki wejściowe na fragmenty i skompresować je indywidualnie lub użyć innych środków, aby obniżyć wydajność kompresji w celu uzyskania szybkości dla dużych danych wejściowych.
Twój kompresor może wymagać podania danych wejściowych przy użyciu natywnej reprezentacji nowej linii preferowanej platformy (LF, CR + LF, CR itp.), O ile dekompresor używa tej samej reprezentacji nowej linii na wyjściu. Oczywiście kompresor akceptuje również wszelkie nowe znaki (lub nawet nowe znaki uniksowe niezależnie od platformy), o ile dekompresor wypisuje te same znaki, co na oryginalnym wejściu.
Wejście testowe:
Aby ocenić skuteczność kompresji odpowiedzi, zostaną użyte następujące dane testowe ( The Raven Edgara Allana Poe, dzięki uprzejmości Project Gutenberg ):
Once upon a midnight dreary, while I pondered, weak and weary,
Over many a quaint and curious volume of forgotten lore,
While I nodded, nearly napping, suddenly there came a tapping,
As of some one gently rapping, rapping at my chamber door.
"'T is some visiter," I muttered, "tapping at my chamber door--
Only this, and nothing more."
Ah, distinctly I remember it was in the bleak December,
And each separate dying ember wrought its ghost upon the floor.
Eagerly I wished the morrow:--vainly I had sought to borrow
From my books surcease of sorrow--sorrow for the lost Lenore--
For the rare and radiant maiden whom the angels name Lenore--
Nameless here for evermore.
And the silken sad uncertain rustling of each purple curtain
Thrilled me--filled me with fantastic terrors never felt before;
So that now, to still the beating of my heart, I stood repeating
"'T is some visiter entreating entrance at my chamber door
Some late visiter entreating entrance at my chamber door;--
This it is, and nothing more."
Presently my soul grew stronger; hesitating then no longer,
"Sir," said I, "or Madam, truly your forgiveness I implore;
But the fact is I was napping, and so gently you came rapping,
And so faintly you came tapping, tapping at my chamber door,
That I scarce was sure I heard you"--here I opened wide the door;--
Darkness there, and nothing more.
Deep into that darkness peering, long I stood there wondering, fearing,
Doubting, dreaming dreams no mortal ever dared to dream before;
But the silence was unbroken, and the darkness gave no token,
And the only word there spoken was the whispered word, "Lenore!"
This I whispered, and an echo murmured back the word, "Lenore!"
Merely this and nothing more.
Back into the chamber turning, all my soul within me burning,
Soon again I heard a tapping, somewhat louder than before.
"Surely," said I, "surely that is something at my window lattice;
Let me see, then, what thereat is, and this mystery explore--
Let my heart be still a moment and this mystery explore;--
'T is the wind and nothing more!"
Open here I flung the shutter, when, with many a flirt and flutter,
In there stepped a stately Raven of the saintly days of yore.
Not the least obeisance made he; not a minute stopped or stayed he;
But, with mien of lord or lady, perched above my chamber door--
Perched upon a bust of Pallas just above my chamber door--
Perched, and sat, and nothing more.
Then this ebony bird beguiling my sad fancy into smiling,
By the grave and stern decorum of the countenance it wore,
"Though thy crest be shorn and shaven, thou," I said, "art sure no craven,
Ghastly grim and ancient Raven wandering from the Nightly shore,--
Tell me what thy lordly name is on the Night's Plutonian shore!"
Quoth the Raven, "Nevermore."
Much I marvelled this ungainly fowl to hear discourse so plainly,
Though its answer little meaning--little relevancy bore;
For we cannot help agreeing that no living human being
Ever yet was blessed with seeing bird above his chamber door--
Bird or beast upon the sculptured bust above his chamber door,
With such name as "Nevermore."
But the Raven, sitting lonely on the placid bust, spoke only
That one word, as if his soul in that one word he did outpour.
Nothing further then he uttered--not a feather then he fluttered--
Till I scarcely more than muttered, "Other friends have flown before--
On the morrow _he_ will leave me, as my hopes have flown before."
Then the bird said, "Nevermore."
Startled at the stillness broken by reply so aptly spoken,
"Doubtless," said I, "what it utters is its only stock and store,
Caught from some unhappy master whom unmerciful Disaster
Followed fast and followed faster till his songs one burden bore--
Till the dirges of his Hope that melancholy burden bore
Of 'Never--nevermore.'"
But the Raven still beguiling all my sad soul into smiling,
Straight I wheeled a cushioned seat in front of bird and bust and door;
Then, upon the velvet sinking, I betook myself to linking
Fancy unto fancy, thinking what this ominous bird of yore--
What this grim, ungainly, ghastly, gaunt and ominous bird of yore
Meant in croaking "Nevermore."
This I sat engaged in guessing, but no syllable expressing
To the fowl whose fiery eyes now burned into my bosom's core;
This and more I sat divining, with my head at ease reclining
On the cushion's velvet lining that the lamplight gloated o'er,
But whose velvet violet lining with the lamplight gloating o'er
_She_ shall press, ah, nevermore!
Then, methought, the air grew denser, perfumed from an unseen censer
Swung by seraphim whose foot-falls tinkled on the tufted floor.
"Wretch," I cried, "thy God hath lent thee--by these angels he hath sent thee
Respite--respite and nepenthe from thy memories of Lenore!
Quaff, oh quaff this kind nepenthe, and forget this lost Lenore!"
Quoth the Raven, "Nevermore."
"Prophet!" said I, "thing of evil!--prophet still, if bird or devil!--
Whether Tempter sent, or whether tempest tossed thee here ashore,
Desolate yet all undaunted, on this desert land enchanted--
On this home by Horror haunted--tell me truly, I implore--
Is there--_is_ there balm in Gilead?--tell me--tell me, I implore!"
Quoth the Raven, "Nevermore."
"Prophet!" said I, "thing of evil--prophet still, if bird or devil!
By that Heaven that bends above, us--by that God we both adore--
Tell this soul with sorrow laden if, within the distant Aidenn,
It shall clasp a sainted maiden whom the angels name Lenore--
Clasp a rare and radiant maiden whom the angels name Lenore."
Quoth the Raven, "Nevermore."
"Be that word our sign of parting, bird or fiend!" I shrieked, upstarting--
"Get thee back into the tempest and the Night's Plutonian shore!
Leave no black plume as a token of that lie thy soul hath spoken!
Leave my loneliness unbroken!--quit the bust above my door!
Take thy beak from out my heart, and take thy form from off my door!"
Quoth the Raven, "Nevermore."
And the Raven, never flitting, still is sitting, still is sitting
On the pallid bust of Pallas just above my chamber door;
And his eyes have all the seeming of a demon's that is dreaming,
And the lamplight o'er him streaming throws his shadow on the floor;
And my soul from out that shadow that lies floating on the floor
Shall be lifted--nevermore!
Prawidłowe wejście testowe (zakodowane za pomocą znaków nowej linii LF w stylu uniksowym) powinno mieć długość 7043 bajtów i mieć szesnastkowy skrót MD5 286206abbb7eca7b1ab69ea4b81da227
. ( md5sum -t
powinien generować tę samą wartość skrótu, nawet jeśli używasz nowej linii CR + LF w systemie DOS / Windows). Wyjście dekompresora powinno mieć tę samą długość i skrót.
Ps. Pamiętaj, że to wyzwanie jest tak trudne, jak to tylko możliwe. Naprawdę, wszystko poniżej 7043 liczy się jako dobry wynik. (Na drugim końcu skali będę pod ogromnym wrażeniem, jeśli ktoś osiągnie wynik poniżej 2500.)