PhredPhrapConsed - Manual

Dokumentation :: Anleitung :: Faq

Benötigt:

Um mit Phred Phrap Consed arbeiten zu können, brauchen Sie

  • einen X Server und einen
  • SSH Client, der X11 forwarding unterstützt.


    Anleitung zum Assemblieren mit Phred/Phrap/Consed

  • Account für nbc11.biologie.uni-kl.de bei Martin holen
  • Lokal den X Server starten
  • Mit Freigabe \\nbc11.biologie.uni-kl.de\phredphrap_<USERNAME>" verbinden
  • Einloggen mit SSH (Interface: SSH-2, Host=nbc11.biologie.uni-kl.de, Port=22) im nächsten Fenster Name und Paßwort eingeben
  • Eventuell "e" eingeben, um vorherige Ergebnisse zu löschen. Vorsicht! Dabei werden alle vorherigen Assemblies gelöscht, daher vorher rechtzeitig alte Ergbnisse sichern!
  • Chromatogrammdateien vom ABI Sequencer in das Verzeichnis \\nbc11.biologie.uni-kl.de\phredphrap_<USERNAME>\chromat_dir kopieren, dabei "USERNAME" durch den eigenen Benutzernamen ersetzen
  • Die Bedeutung der Verzeichnisse in "\\nbc11.biologie.uni-kl.de\phredphrap_<USERNAME>":
  • chromat_dir:
  • Hier kommen die Chromatogramme aus dem ABI Sequencer hinein. Nur die Chromatogramme, keine Textdateien mit Sequenz!
  • edit_dir:
  • Die Ergebnisse eines Assemblies werden hier abgelegt.
  • phd_dir:
  • In diesem Verzeichnis werden während eines Phredphraplaufes die Dateien mit Sequenzen abgelegt, die durch das Basecalling der Chromatogramme gewonnen werden. Hier kann man auch eigene phd Dateien hineinkopieren. Bei einem Phredphraplauf werden sie dem Assembly hinzugefügt.
  • Auf der Kommandozeile "pp" eingeben
  • Wenn kein Fehler angezeigt wird, dann wurde das Basecalling durchgeführt und assembliert. Jetzt kann mit "c" consed gestartet werden.

    FAQ & Troubleshooting

  • Beim Assemblieren mit Consed kommt die Fehlermeldung: Fatal: There were 0 reads in the assembly. Figure out why phrap is not assembly

    Lösung: Möglicherweise hatten die verwendeten Sequenzen keine hinreichende Sequenzähnlichkeit, um assembliert zu werden. Im Verzeichnis "\\nbc11.biologie.uni-kl.de\phredphrap_<USERNAME>" liegt eine Datei "standard_<USERNAME>.fasta" In dieser Datei sind die Sequenzen, die Phrap versucht zu assemblieren.

    Man kann von Hand darauf testen mit Blast2Sequences oder mit Nucmer

  • Beim Assemblieren mit Consed tauchen im Assembly Contigs oder Reads aus der Eingabe nicht auf. Wo sind die geblieben?

    Diese Sequenzen wurden von phrap wahrscheinlich als "singlets" klassifiziert und sind in der Datei "\\nbc11.biologie.uni-kl.de\assembly\phredphrap_<USERNAME>\edit_dir\standard_<USERNAME>.fasta.screen.singlets"

    Aus dem Handbuch dazu:

    118) WHY ARE ALL THE READS NOT IN THE ASSEMBLY?

    You will notice that there are some contigs that contain only one read. You will also notice that there are some reads that are not shown by Consed at all, since phrap did not put them into the ace file. Why?

    If a read does not have a significant match (with Smith-Waterman score exceeding minscore) to any other read, that read is not included in the ace file. Instead, that read is put in the '.singlets' file. That read will not appear in Consed.

    If a read does have a significant match to any other read, then it will appear in the ace file and be shown by Consed. However, such a read might have other problems: it might not be possible to assemble such a read with other reads (in the case of EST's this read may be a unique representative of a particular gene (or a genomic sequence contaminant) that happens to contain an Alu repeat and thus happens to match other reads in the data set; or it may represent the only read of a particular alternatively spliced form; or it may have data anomalies of some sort (chimeras, etc.). Such a read would end up in a contig all of its own.