Mam plik sekwencji i chcę policzyć kolejny znak „N” z jego pozycją wystąpienia i długością Powiedzmy, że mam plik o nazwie mySequence.fasta
takiej:
>sequence-1
ATCGCTAGCATNNNNNNNNNNNNNNCTAGCATCATGCNNNNNNATACGCATCACANNNNNNNNNCgcatATCAC
i oczekiwany wynik powinien wyglądać następująco:
Position 12 N 14
Position 38 N 6
Position 56 N 9
Uprzejmie pomóż mi rozwiązać ten problem awk
lub sed
podając nazwę mojego plikumySequence.fasta