0 Daumen
117 Aufrufe

Hallo :)


Für ein Projekt an der Uni müssen wir zwei FASTA Files miteinander vergleichen. Die Files enthalten zwei Aminosäurenketten (ATGAAGCTGA....) und wir sollten vergleichen, welche Sequenz in beiden Files am häufigsten vorkommen. Also die Funktion, die wir schreiben müssen, sollte am Schluss drucken, welche Top 10 Sequenzen in beiden Files am häufigsten vorkommen.

Das Ganze sollten wir mit k mers machen, Länge eines k = 12.


Jedoch weiss ich nicht, wo ich anfangen soll oder wo ich Hilfe/Infos im Internet finden kann.

Ich habe mittlerweile herausbekommen, wie man die Sequenzen in ein Dictionary bringt, aber nicht, wie man dann die beiden Files vergleichen und eine Top 10 Liste erstellen soll.


Kann mir jemand weiterhelfen?

Bin auch froh über Links zu Webseiten oder YouTube oder irgendwas!


Ich hoffe, man versteht die Frage...


Vielen Dank!!

von

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Stacklounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community