Nella biologia molecolare una sequenza di DNA o sequenza genetica è una successione di lettere che rappresentano la struttura primaria di una molecola di DNA, con la capacità di veicolare informazione. Le lettere sono A, C, G e T e rappresentano le quattro basi nucleotidi adenina, citosina, guanina e timina. Relativamente alla funzione biologica una sequenza di DNA può essere considerata senso o antisenso. In alcuni casi speciali, possono essere presenti in una sequenza altre lettere oltre A, T, C e G. Le regole per la trascrizione delle lettere dell’Unione Internazionale di Chimica Pura ed Applicata (IUPAC) sono le seguenti: A = adenina C = citosina G = guanina T = timina R = G A (purina) Y = T C (pirimidina) K = G T (ceto) M = A C (amino) S = G C (legami forti) W = A T (legami deboli) B = G T C (tutte tranne A) D = G A T (tutte tranne C) H = A C T (tutte tranne G) V = G C A (tutte tranne T) N = A G C T (tutte)