FASTQ
O formato FASTQ é um formato de texto para armazenamento da sequência biológica (geralmente sequência de nucleotídeos) e sua pontuação de qualidade correspondente. Tanto a cadeia de caracteres e a pontuação de qualidade são codificados usando um caractere da tabela ASCII. O formato FASTQ possui normalmente quatro linhas por sequência:
- Linha 1 começa com o caractere '@' e é seguido por um identificador de sequência opcional;
- Linha 2 começa com os caracteres da sequência bruta;
- Linha 3 começa com um caractere '+' e é opcionalmente seguido pelo mesmo identificador da sequência;
- Linha 4 codifica os valores de qualidade da sequência na linha 2 e deve conter o mesmo número de símbolos que os caracteres da linha 2.
@NS500746:56:HLY2MAFXX:1:11101:10096:1016 1:N:0:1
GCCTGNCGCATTGCATTCATCAAACGCTGAATAGCAAAGCCTCTACGCGATTTCATAGTGGAGGCCTCCAGCAATCTTGAACACTCATCCTTAATACCTTTCTTTTTGGGGTAATTATACTCATCGCGAATATCCTTAAGAGGGCGTTCAGCAGCCAGCTTGCGG
+
AAAAA#EEEEEEEEEAEE/AEEEAEEEEEEEEEEAEE/EEEEEEEEEEEA/EE<AEEEEEEEEEEEEAEAEAE/EEEEEE/E<AEE<EE/EEE//E/AEEEEE<AAEEEEEEEEEEAEE/EAAA/AEAEEEEEE/EEEAA<AAEA<EEAEAEEE</AE<A/A<<<
Elementos da Header | Significado |
---|---|
NS500746 | nome único do instrumento |
56 | ID da corrida |
HLY2MAFXX | ID da flowcell |
1 | lane da flowcell |
11101 | número da tile com a lane da flowcell |
10096 | coordenada 'x' do cluster dentro da tile |
1016 | coordenada 'y' do cluster dentro da tile |
1 | número da read (1 pode ser single read e 2 pode ser paired-end) |
N | informação se a read é ou não filtrada (Y se a read não passou nos critérios e N caso contrário) |
0 | Bit de controle (0 para o caso em que não há bits de controle) |
1 | Número da amostra |
American Standard Code for Information Interchange
O formato dos teclados são específicos aos países. A tabela ASCII proporciona uma conversão entre números e símbolos.
@HWUSI-EAS1875:2:120:17692:21403#0/1
AGAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
+
########################################################################################################################
@HWUSI-EAS1875:2:1:2031:1038#0/1
TNACGATGCAGATTATATTTTTGTGCTGTATTGCCCACAGAGAGTAATATTGCCTTCAATATGATGGATTTCGAGCTGTTTCTCTAGCTGAGCTGTCTGGATCTCTCTGAGCTGTTCCTG
+
A#ABAFFFFEIIIIIIIIIIIIIHIGIHIGGIIIIIIIHIEGEDEGGGDGEEIHIG<CEEBGG@DHIBHIIEE@HBFHDHF@EBEBEADBDEDEGB>BDC==9>'=9;=;B?@B@6936?