Studiengänge >> Pharmazeutische Biotechnologie 2020 M.Sc. >> Angewandte Bioinformatik |
Code: | 250000 |
Modul: | Angewandte Bioinformatik |
Module title: | Applied Bioinformatics |
Version: | 1.0 (04/2019) |
letzte Änderung: | 09.11.2023 |
Modulverantwortliche/r: | Prof. Dr. rer. nat. Fester, Karin Karin.Fester@hszg.de |
angeboten im Studiengang: | Pharmazeutische Biotechnologie (M.Sc.) gültig ab Matrikel 2020 |
Modul läuft im: | WiSe (Wintersemester) |
Niveaustufe: | Master |
Dauer des Moduls: | 1 Semester |
Status: | Wahlpflichtmodul |
Lehrort: | Zittau |
Lehrsprache: | Deutsch |
Workload* in | SWS ** | |||||||||||||
Zeit- std. | ECTS- Pkte |
|||||||||||||
* | Gesamtarbeitsaufwand pro Modul (1 ECTS-Punkt entspricht einem studentischen Arbeitsaufwand von 30 Zeitstunden) |
** | eine Semesterwochenstunde (SWS) entspricht 45 Minuten pro Woche |
Selbststudienzeit in h | ||||
Vor- und Nachbereitung LV |
Vorbereitung Prüfung |
Sonstiges |
Lehr- und Lernformen: | Vorlesungen und praktische Übungen am Computer |
Hinweise: | Für die Hausaufgaben und die Bearbeitung des Belegs wird ein eigener PC mit Internetanschluss empfohlen. Alternativ können Rechner der HSZG verwendet werden (im Computerpool). Folgende frei verfügbare und kostenlosen Programme werden verwendet: Python, R, RStudio. Empfohlen werden noch folgende kostenlose Programme: PyCharm Community, Notepad++. |
Prüfung(en) | |||
Prüfungsvorleistung | Prüfungsvorleistung als Teilnahme/Testat (VT) | ||
Prüfung | Prüfungsleistung als Beleg (PB) | 100.0% |
Lerninhalt: |
Vorlesung - Festigung statistischer Grundlagen (deskriptive Statistik, Hypothesentests, Korrelation) - Statistische Modellbildung (Regressionen, wiederholte Messungen, longitudinale Daten) - Überblick über Ordinations- und Klassifikationsverfahren - Angewandte Statistik mit R, eventuell auch Ausflüge nach SPSS und SAS möglich - Kurzer Überblick zu Programmiersprachen (Interpreter, Compiler, Just-in-time-Compiler) und Programmierparadigmen (imperativ, deklarativ, objektorientiert) - Grundlagen der Programmierung (mit der Programmiersprache Python) – Variablen, Datentypen, Operatoren, Kontrollstrukturen; Ausblick zu Algorithmen, Datenstrukturen und Objektorientierung - Bioinformatische Methoden mit Hilfe von Python - Schnittstellen zwischen R und Python Übungen - Einführung in die Programmiersprache R - Erstellen eigener R-Auswerteskripte - Auswertung einfacher Datensätze mit verschiedenen Methoden in R - Einsatz von R in Ordinations- und Klassifikationsverfahren zur Dimensionsreduktion und Strukturbildung komplexer Datensätze (u.a. Hauptkomponenten- und Clusteranalysen) - Graphiken in R - Nutzung von Skripten (R und Python) zur schnellen Analyse komplexer und großer Datenmengen, die in modernen Analyseverfahren anfallen - Nutzung von Skripten, um große Datenmengen nach bestimmten Kriterien zu filtern - Einsatz von Python zur Auswertung von Sequenzdaten (insbesondere aus Next-Generation-Sequencing-Projekten) - Aufbau einer lokalen BLAST-Datenbank - Browserbasierter und programmatischer Zugriff auf externe, öffentliche Datenbanken (z.B. E-utilities von NCBI) - Vorstellung nützlicher Bioinformatik-Software (Open-Source- und kommerzielle Programme) - Visualisierung von Biomolekülen mittels PyMol Beleg: Als Beleg ist ein Datensatz eigenständig auszuwerten. Die Ergebnisse werden von den Studierenden im Rahmen eines Vortrags dargestellt. Das von den Studierenden im Rahmen der Belegarbeit erstellte Skript wird ebenfalls bewertet. |
Lernergebnisse/Kompetenzen: | |
Fachkompetenzen: | Nach erfolgreicher Teilnahme an diesem Modul sind die Studierenden in der Lage: - Einfache Programme in den Programmiersprachen R und Python zu erstellen und zu verstehen - Einfache und komplexe Datensätze mithilfe von R und Python einzulesen, zu filtern und statistisch auszuwerten Die Studierenden haben grundlegende Begriffe und Methoden der Statistik wiederholt (Hypothesentests, Korrelation, Regression, Varianzanalyse). Dadurch sind sie in der Lage, mithilfe der Programmiersprache R Statistiken zu erstellen und zu visualisieren. Auch fortgeschrittenere Konzepte der Statistik können sie mit R umsetzen (gemischte lineare Modelle, statistisches Lernen mit Entscheidungsbäumen, Hauptkomponentenanalyse). Die Studierenden können große Datensätze (wie sie z.B. bei „Omics“-Studien anfallen) mithilfe der Programmiersprache Python öffnen und bearbeiten. Sie sind befähigt, grundlegende Begriffe und Methoden des Programmierens einzusetzen (Variablen, Funktionen, Module, Schleifen, Bedingungen, Klassen, Objekte, GUIs, Libraries). |
Fachübergreifende Kompetenzen: | Nach erfolgreicher Teilnahme an diesem Modul sind die Studierenden in der Lage, mit bioinformatischen und statistischen Methoden große Datensätze zu interpretieren und damit biologische Fragestellungen zu beantworten. Mit Python haben die Studierenden zudem eine Programmiersprache kennengelernt, die sie für alle Zwecke im späteren Berufsleben als auch privat anwenden können (nicht nur für Datenanalyse bzw. Bioinformatik). Zudem erleichtert die Kenntnis einer Programmiersprache das Erlernen einer neuen Programmiersprache. Wenn im späteren Berufsleben mit Experten der IT zusammengearbeitet wird, haben die Studierenden ein fachübergreifendes, besseres Verständnis für Anforderungen von informatischen Methoden. |
Notwendige Voraussetzungen für die Teilnahme: | Grundlegende Kenntnisse in Statistik und Molekularbiologie |
Empfohlene Voraussetzungen für die Teilnahme: | Grundlegende Kenntnisse in Bioinformatik (Anwendung von BLAST) |
Literatur: | Biostatistik: - Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Auflage.). Berlin, Heidelberg: Springer. - Hedderich, J. & Sachs, L. (2020). Angewandte Statistik: Methodensammlung mit R (17. Auflage). Berlin, Heidelberg: Springer Spektrum. Multivariate Verfahren: - Backhaus, K., Erichson, B., Gensler, S., Weiber, R & Weiber, T. (2021). Multivariate Analysemethoden: Eine anwendungsorientierte Einführung (16. Auflage). Berlin, Heidelberg: Springer Gabler. - James, G., Witten, D., Hastie, T. & Tibshirani, R. (2021). An Introduction to Statistical Learning with Applications in R. New York, Heidelberg, Dordrecht, London: Springer. - Leyer, I. & Wesche, K. (2007). Multivariate Statistik in der Ökologie: Eine Einführung (1. Auflage). Berlin, Heidelberg: Springer. R: - Jones, E., Harden, S. & Crawley, M. J. (2022). The R Book (3rd ed.). Chichester, West Sussex, United Kingdom: Wiley. - Teetor, P. (2019). R Cookbook (2nd ed.). Gravenstein Highway North, Sebastopol, CA, USA: O’Reilly Media. - Wickham, H. & Grolemund, G. (2023). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data (2nd ed.). Gravenstein Highway North, Sebastopol, CA, USA: O’Reilly Media. - Wollschläger, D. (2020). Grundlagen der Datenanalyse mit R: eine anwendungsorientierte Einführung (5. Auflage). Berlin: Springer. - außerdem: kostenlose Tutorien im Netz Python und Bioinformatik - Mitchell L. Model (2009) Bioinformatics Programming Using Python: Practical Programming for Biological Data. O’Reilly-Verlag, 1st Edition. (in englischer Sprache) - Luigi Lo Iacono, Stephan Wiefling, Michael Schneider (2018). Programmieren trainieren. Mit über 120 Workouts in Java und Python. Hansa-Verlag. (Im Netz der HSZG kostenlos als E-Book verfügbar) - Berk Ekmekci, Charles E. McAnany, Cameron Mura (2016). An Introduction to Programming for Bioscientists: A Python-Based Primer. PLoS Comput Biol. 12(6):e1004867. Open Access: https://doi.org/10.1371/journal.pcbi.1004867 - Katja Schuerer, Catherine Letondal (2002, 2004, 2008). Python course in Bioinformatics. Pasteur Institute [http://www.pasteur.fr/], im Netz frei verfügbar |