Analizuję plik skrzynki pocztowej, w którym przechowywane są raporty serwera e-mail o nieudane dostarczenie wiadomości e-mail. Chcę wyodrębnić złe adresy e-mail, aby usunąć je z systemu. Plik dziennika wygląda następująco:
...some content...
The mail system
<slavicatomic118@hotmail.com>: host mx1.hotmail.com[65.54.188.94] said: 550
Requested action not taken: mailbox unavailable (in reply to RCPT TO
command)
...some content...
The mail system
<oki88@optimumpro.net>: host viking.optimumpro.net[79.101.51.82] said: 550
Unknown user (in reply to RCPT TO command)
...some content...
The mail system
<sigirna_luka@yahoo.com>: host mta5.am0.yahoodns.net[74.6.140.64] said: 554
delivery error: dd This user doesn't have a yahoo.com account
(sigirna_luka@yahoo.com) [0] - mta1172.mail.sk1.yahoo.com (in reply to end
of DATA command)
...etc.
Adres e-mail pojawia się 2 wiersze po wierszu z „Systemem poczty”. Używanie grep w ten sposób daje mi wiersz „System poczty” i kolejne dwa wiersze:
grep -A 2 "The mail system" mbox_file
Nie wiem jednak, jak usunąć z tego wyniku wiersz „System poczty” i drugi pusty wiersz. Myślę, że mógłbym napisać skrypt PHP / Perl / Python, aby to zrobić, ale zastanawiam się, czy jest to możliwe przy pomocy grep lub innego standardowego narzędzia. Próbowałem podać ujemne przesunięcie parametru -B:
grep -A 2 -B -2 "The mail system" mbox_file
Ale grep narzeka:
grep: -2: invalid context length argument
Czy można to zrobić za pomocą grep?