Sådan tælles læsninger i bam pr. Senginterval med sengeværktøjer

Jeg installerede for nylig Ubuntu 16.04 (fordi jeg stadig brugte 12.04). Men det ser ud til, at mine sengeværktøjsskripter ikke fungerer ordentligt længere. Jeg kan ikke finde ud af, hvordan jeg bruger de nye sengeværktøjer til mine gamle måder. Hvad jeg vil gøre er at få antallet af læsninger fra en bam-fil pr. Interval fra en sengfil. Det var meget simpelt med min gamle version af Ubuntu og sengeværktøjer:

bedtools coverage -abam file.bam -b All_peaks.bed > file.cov.txt 

Men det ser ikke ud til at fungere mere. Jeg plejede at få små filer som resultater (~ 3MB), men nu oprettes enorme filer (~ 4 GB) inklusive læse navne ??

Jeg bruger sengeværktøj v2.25 nu.

Svar

Rækkefølgen af -a og -b skiftede på et eller andet tidspunkt. Du vil:

bedtools coverage -a All_peaks.bed -b file.bam > file.cov.txt 

Til reference er dette slutningen på hjælpeproduktionen i version 2.25:

Default Output: After each entry in A, reports: 1) The number of features in B that overlapped the A interval. 2) The number of bases in A that had non-zero coverage. 3) The length of the entry in A. 4) The fraction of bases in A that had non-zero coverage. 

Og dette er den tilsvarende output fra version 2.19:

Default Output: After each entry in B, reports: 1) The number of features in A that overlapped the B interval. 2) The number of bases in B that had non-zero coverage. 3) The length of the entry in B. 4) The fraction of bases in B that had non-zero coverage. 

Opdater : Ændringen i adfærd skete i version 2.24:

Vi har ændret dækningsværktøjets adfærd, så det er i overensstemmelse med de andre værktøjer. Specifikt beregnes dækning nu for intervallerne i A-filen baseret på overlapningen s med B-filen i stedet for omvendt.

Kommentarer

  • Tak Devon! Jeg var ikke ' ikke opmærksom på ' switch '. At skifte -a og -b løser faktisk mit problem!

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *