Thursday, July 5, 2012

BWA İle Eşleştirme (Mapping - Alignment)

Bunu daha önce yazmayı unutmuşum. Aslında bahsetmiştim ancak nasıl yapıldığına dair bir şeyler yazmamışım ayrıca örnek komutlar da eklememişim.

BWA elimizdeki (FASTQ formatındaki) DNA dizilimini, referans genomunu (projemde bu insan genomu) alarak bir .sai dosyası oluşturuyor. Bu dosya dizinin ve referans genomunun eşleşmesi ile ilgili bilgiler taşiyor ve bu bilgileri kullanarak eşleşmeyenleri ayırabiliyorum.

İlk olarak aşağıdaki komut ile .sai dosyamızı oluşturuyoruz.

bwa aln $NGSDATAROOT/bwa/human_genome37 ChIP_NoIndex_L001_R1_complete_filtered.fastq > complete_alignment.sai

Oluşturduğumuz .sai dosyası çok da kullanışlı bir dosya değil, bu yüzden onu SAM dosyasına çevirerek, işlemlere devam ediyoruz. Elimizdeki veri tek-sonlu okuma (single-end read) olarak kabul edildiği için "samse" ile bu değişimi yapıyoruz, eğer çift-sonlu okuma (paired-end read) olsaydı "sampe" kullanılacaktı.

Bunu da aşağıdaki kod ile gerçekleştiriyoruz.

bwa samse $NGSDATAROOT/bwa/human_genome37 complete_alignment.sai ChIP_NoIndex_L001_R1_complete_filtered.fastq > complete_alignment.sam

Bundan sonra elde ettiğimiz SAM dosyasıyla çalışmamıza devam ediyoruz. Devamı aşağıdaki yazımda bahsettiğim BAM dosyasına dönüştürme ve ardından FASTQ dosyasına çevirme var.

İlgili yazı: SAM Dosyası - BAM Dosyası - samtools

No comments: