Letzte Änderung : 24.01.2025 22:00:32   


Code:250000
Modul:Angewandte Bioinformatik
Module title:Applied Bioinformatics
Version:1.0 (04/2019)
letzte Änderung: 09.11.2023
Modulverantwortliche/r: Prof. Dr. rer. nat. Fester, Karin
Karin.Fester@hszg.de

angeboten im Studiengang:Pharmazeutische Biotechnologie (M.Sc.) gültig ab Matrikel 2020

Modul läuft im:WiSe (Wintersemester)
Niveaustufe:Master
Dauer des Moduls:1 Semester
Status:Wahlpflichtmodul
Lehrort:Zittau
Lehrsprache:Deutsch

Workload* in SWS **
Semester
Zeit- std.ECTS-
Pkte
1
2
3

V
S
P
W
V
S
P
W
V
S
P
W
150
5
4.0

2
2
0
0

*Gesamtarbeitsaufwand pro Modul (1 ECTS-Punkt entspricht einem studentischen Arbeitsaufwand von 30 Zeitstunden)
**eine Semesterwochenstunde (SWS) entspricht 45 Minuten pro Woche

Selbststudienzeit in h
Angabe gesamt
davon
105
60
Vor- und Nachbereitung LV
45
Vorbereitung Prüfung
0
Sonstiges


Lehr- und Lernformen:Vorlesungen und praktische Übungen am Computer
Hinweise:Für die Hausaufgaben und die Bearbeitung des Belegs wird ein eigener PC mit Internetanschluss empfohlen.

Alternativ können Rechner der HSZG verwendet werden (im Computerpool).

Folgende frei verfügbare und kostenlosen Programme werden verwendet: Python, R, RStudio.

Empfohlen werden noch folgende kostenlose Programme: PyCharm Community, Notepad++.


Prüfung(en)
Prüfungsvorleistung Prüfungsvorleistung als Teilnahme/Testat (VT)
Prüfung Prüfungsleistung als Beleg (PB)
 - 
100.0%



Lerninhalt: Vorlesung
- Festigung statistischer Grundlagen (deskriptive Statistik, Hypothesentests, Korrelation)
- Statistische Modellbildung (Regressionen, wiederholte Messungen, longitudinale Daten)
- Überblick über Ordinations- und Klassifikationsverfahren
- Angewandte Statistik mit R, eventuell auch Ausflüge nach SPSS und SAS möglich
- Kurzer Überblick zu Programmiersprachen (Interpreter, Compiler, Just-in-time-Compiler) und Programmierparadigmen (imperativ, deklarativ, objektorientiert)
- Grundlagen der Programmierung (mit der Programmiersprache Python) – Variablen, Datentypen, Operatoren, Kontrollstrukturen; Ausblick zu Algorithmen, Datenstrukturen und Objektorientierung
- Bioinformatische Methoden mit Hilfe von Python
- Schnittstellen zwischen R und Python

Übungen
- Einführung in die Programmiersprache R
- Erstellen eigener R-Auswerteskripte
- Auswertung einfacher Datensätze mit verschiedenen Methoden in R
- Einsatz von R in Ordinations- und Klassifikationsverfahren zur Dimensionsreduktion und Strukturbildung komplexer Datensätze (u.a. Hauptkomponenten- und Clusteranalysen)
- Graphiken in R
- Nutzung von Skripten (R und Python) zur schnellen Analyse komplexer und großer Datenmengen, die in modernen Analyseverfahren anfallen
- Nutzung von Skripten, um große Datenmengen nach bestimmten Kriterien zu filtern
- Einsatz von Python zur Auswertung von Sequenzdaten (insbesondere aus Next-Generation-Sequencing-Projekten)
- Aufbau einer lokalen BLAST-Datenbank
- Browserbasierter und programmatischer Zugriff auf externe, öffentliche Datenbanken (z.B. E-utilities von NCBI)
- Vorstellung nützlicher Bioinformatik-Software (Open-Source- und kommerzielle Programme)
- Visualisierung von Biomolekülen mittels PyMol

Beleg:
Als Beleg ist ein Datensatz eigenständig auszuwerten. Die Ergebnisse werden von den Studierenden im Rahmen eines Vortrags dargestellt. Das von den Studierenden im Rahmen der Belegarbeit erstellte Skript wird ebenfalls bewertet.

Lernergebnisse/Kompetenzen:
Fachkompetenzen:Nach erfolgreicher Teilnahme an diesem Modul
sind die Studierenden in der Lage:
- Einfache Programme in den Programmiersprachen R und Python zu erstellen und zu verstehen
- Einfache und komplexe Datensätze mithilfe von R und Python einzulesen, zu filtern und statistisch auszuwerten

Die Studierenden haben grundlegende Begriffe und Methoden der Statistik wiederholt (Hypothesentests, Korrelation, Regression, Varianzanalyse). Dadurch sind sie in der Lage, mithilfe der Programmiersprache R Statistiken zu erstellen und zu visualisieren. Auch fortgeschrittenere Konzepte der Statistik können sie mit R umsetzen (gemischte lineare Modelle, statistisches Lernen mit Entscheidungsbäumen, Hauptkomponentenanalyse).

Die Studierenden können große Datensätze (wie sie z.B. bei „Omics“-Studien anfallen) mithilfe der Programmiersprache Python öffnen und bearbeiten. Sie sind befähigt, grundlegende Begriffe und Methoden des Programmierens einzusetzen (Variablen, Funktionen, Module, Schleifen, Bedingungen, Klassen, Objekte, GUIs, Libraries).
Fachübergreifende Kompetenzen:Nach erfolgreicher Teilnahme an diesem Modul sind die Studierenden in der Lage, mit bioinformatischen und statistischen Methoden große Datensätze zu interpretieren und damit biologische Fragestellungen zu beantworten.

Mit Python haben die Studierenden zudem eine Programmiersprache kennengelernt, die sie für alle Zwecke im späteren Berufsleben als auch privat anwenden können (nicht nur für Datenanalyse bzw. Bioinformatik). Zudem erleichtert die Kenntnis einer Programmiersprache das Erlernen einer neuen Programmiersprache.

Wenn im späteren Berufsleben mit Experten der IT zusammengearbeitet wird, haben die Studierenden ein fachübergreifendes, besseres Verständnis für Anforderungen von informatischen Methoden.


Notwendige Voraussetzungen für die Teilnahme:Grundlegende Kenntnisse in Statistik und Molekularbiologie
Empfohlene Voraussetzungen für die Teilnahme:Grundlegende Kenntnisse in Bioinformatik (Anwendung von BLAST)

Literatur:Biostatistik:
- Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage.). Berlin, Heidelberg: Springer.
- Hedderich, J. & Sachs, L. (2020). Angewandte Statistik: Methodensammlung mit R (17. Auflage). Berlin, Heidelberg: Springer Spektrum.

Multivariate Verfahren:
- Backhaus, K., Erichson, B., Gensler, S., Weiber, R & Weiber, T. (2021). Multivariate Analysemethoden: Eine anwendungsorientierte Einführung (16. Auflage). Berlin, Heidelberg: Springer Gabler.
- James, G., Witten, D., Hastie, T. & Tibshirani, R. (2021). An Introduction to Statistical Learning with Applications in R. New York, Heidelberg, Dordrecht, London: Springer.
- Leyer, I. & Wesche, K. (2007). Multivariate Statistik in der Ökologie: Eine Einführung (1. Auflage). Berlin, Heidelberg: Springer.

R:
- Jones, E., Harden, S. & Crawley, M. J. (2022). The R Book (3rd ed.). Chichester, West Sussex, United Kingdom: Wiley.
- Teetor, P. (2019). R Cookbook (2nd ed.). Gravenstein Highway North, Sebastopol, CA, USA: O’Reilly Media.
- Wickham, H. & Grolemund, G. (2023). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (2nd ed.). Gravenstein Highway North, Sebastopol, CA, USA: O’Reilly Media.
- Wollschläger, D. (2020). Grundlagen der Datenanalyse mit R: eine anwendungsorientierte Einführung (5. Auflage). Berlin: Springer.
- außerdem: kostenlose Tutorien im Netz

Python und Bioinformatik
- Mitchell L. Model (2009) Bioinformatics Programming Using Python: Practical Programming for Biological Data. O’Reilly-Verlag, 1st Edition. (in englischer Sprache)
- Luigi Lo Iacono, Stephan Wiefling, Michael Schneider (2018). Programmieren trainieren. Mit über 120 Workouts in Java und Python. Hansa-Verlag. (Im Netz der HSZG kostenlos als E-Book verfügbar)
- Berk Ekmekci, Charles E. McAnany, Cameron Mura (2016). An Introduction to Programming for Bioscientists: A Python-Based Primer. PLoS Comput Biol. 12(6):e1004867. Open Access: https://doi.org/10.1371/journal.pcbi.1004867
- Katja Schuerer, Catherine Letondal (2002, 2004, 2008). Python course in Bioinformatics. Pasteur Institute [http://www.pasteur.fr/], im Netz frei verfügbar