Applied Python Programming

Dieses Seminar wurde entwickelt, um die praktische Anwendung der Grundlagen von Python an Lebenswissenschaftler zu vermitteln. Während der letzten Semester wurde das Seminar kontinuierlich von Boas Pucker und Bernd Weisshaar angeboten. Die Grundlagen von Python werden vermittelt, um einfache biologische Herausforderungen zu meistern. In jeder Sitzung werden zahlreiche Aufgaben bearbeitet, um das jeweilige Thema zu vertiefen. Am Kursende demonstrieren alle Teilnehmenden ihre Erfolge durch die Bearbeitung eines Projekts. Um die Ziele und das Potential dieses Seminars für Interessenten anschaulich zu präsentieren, sind hier verschiedene Abschlussprojekte dargestellt. Diese Veranstaltung ist auch im ekVV der Universität Bielefeld beschrieben.

 

Beispiel Python-Projekte

1) Statistischer p-Wert auf Knopfdruck (2016/2017)

(von Franziska Buchholz)

In meinem Projekt ging es um die statistische Auswertung von Daten. Die Idee war, ein Skript zu schreiben, mit dem Daten eingelesen und automatisch in den jeweils passenden statistischen Test eingesetzt werden, sodass der ausgerechnete p-Wert zurück gegeben wird. Dies funktioniert für Daten mit zwei und drei Datensätzen. Der Benutzer kann außerdem wählen, ob die Daten abhängig oder unabhängig sind. Somit lassen sich verschiedene einfache Tests wie zum Beispiel der t-Test berechnen, aber auch komplexere wie der Kruskal Wallis Test oder eine ANOVA. Für eine repeated measure ANOVA musste R zu Hilfe genommen werden, da es in Python dafür keinen Befehl gibt. Deshalb wurde aus Python R aufgerufen und dann dort der Test berechnet. Anschließend wurde das Ergebnis wieder in Python eingelesen. Mit Hilfe meines Skriptes lassen sich daher nun ganz einfach Datensätze statistisch auswerten.

Abb. 1: Ausschnitt aus Pythonscript zur automatischen Auswahl und Durchführung eines statistischen Tests für gegebene Daten.
2) tBLASTn zur Identifikation von Transposasen in der Genomsequenz von Arabidopsis thaliana (2016/2017)

(von Katharina Frey)

Dieses Script verwendet tBLASTn, um Sequenzen mit Ähnlichkeit zu den Mutatortransposasen in der Arabidopsis thaliana Referenzgenomsequenz zu finden. Peptidsequenzen dieser Transposasen dienen als Ausgangspunkt für die Suche. Die Positionen von BLAST-Treffern mit einem e-value kleiner als 0.0000000001 wurden auf der X-Achse aufgetragen, welche die Chromosomensequenzen von A. thaliana repräsentiert. Die erzeugte Grafik zeigt die Positionen von Sequenzen mit Ähnlichkeit zu MUDRA von A.thaliana (rote Dreiecke) bzw. der Transposase MUDRB von Zea mays (gelbe Dreiecke).
Abb. 2: Ausschnitt aus dem Pythonscript zur Identifikation von Transposasegenen in der A. thaliana Col-0 Genomsequenz.
Abb. 3: Ergebnis der Transposasegensuche in der A. thaliana Col-0 Genomsequenz.