Modellierung landwirtschaftlicher Daten

Fakult?t

Fakult?t Agrarwissenschaften und Landschaftsarchitektur (AuL)

Version

Version 1 vom 12.09.2025.

Modulkennung

44B0768

Niveaustufe

Bachelor

Unterrichtssprache

Deutsch

ECTS-Leistungspunkte und Benotung

5.0

H?ufigkeit des Angebots des Moduls

nur Sommersemester

Dauer des Moduls

1 Semester

 

 

Kurzbeschreibung

Die Modellierung von komplexen Daten spielt eine zentrale Rolle in verschiedenen wissenschaftlichen Disziplinen der Agrarwissenschaften. Dabei erm?glicht die Modellierung nicht nur den Gewinn von neuen Erkenntnissen über biologische Prozesse, sondern auch die Vorhersage zukünftiger Ereignisse weit über die g?ngigen Gruppenvergleiche aus Feldexperimenten hinaus. Oftmals sind biologische Abh?ngigkeiten nicht linear, sondern folgen nicht-linearen Trends. Die Modellierung solcher nicht-linearen Abh?ngigkeiten erfordert spezielle Kompetenzen in der statistischen Analyse, insbesondere von Zeitreihen (eng. “time series”), r?umlichen Daten (eng. “spatial data”) oder genetischen Daten und Sequenzen. In dem Modul “Modellierung landwirtschaftlicher Daten” werden die g?ngigen statistische Verfahren zur Auswertung dieser und weiterer Datenquellen vorgestellt und diskutiert. Im Weiteren spielt die Vorhersage von Ereignissen eine entscheidende Rolle in den Agrarwissenschaften, sei es für die Früherkennung von Risiken oder die Steuerung landwirtschaftlicher Prozesse. Im Modul werden die Grundlagen des maschinellen Lernens pr?sentiert und anhand von Fallbeispielen erl?utert. Das Modul “Modellierung landwirtschaftlicher Daten” vermittelt den Studierenden fortgeschrittene Kenntnisse und F?higkeiten im Bereich der Datenmodellierung und -analyse im Kontext der landwirtschaftlichen Anwendung. Der Fokus liegt in dem Modul auf der Darstellung, Verarbeitung und statistischer Modellierung komplexer landwirtschaftlicher Daten. Fallstudien aus verschiedenen Bereichen der Agrarwissenschaften werden verwendet, um die erworbenen theoretischen Kenntnisse in die Praxis umzusetzen. In der Anwendung wird R/Bioconductor für die Datenanalyse genutzt. Das Modul “Modellierung landwirtschaftlicher Daten” erweitert die bisherigen Kenntnisse der Studierenden in der Auswertung agrarwissenschaftlicher Daten und bereitet auf anspruchsvolle Aufgaben in diesem Bereich vor.

Lehr-Lerninhalte

  • Einführung in die statistische Modellierung sowie deren Interpretation am Beispiel der multiplen linearen Regression.
  • Besonderheiten der statistischen Modellierung von Zeitreihen und r?umlichen Daten.
  • Die explorative Datenanalyse und deren statistischen Ma?zahlen sowie die Visualisierung von r?umlichen und zeitlichen Daten.
  • Multivariate statistische Analysen zur Erkennung von Gruppenzugeh?rigkeiten anhand von Clusteranalysen.
  • Einführung in die klassischen experimentellen Designs in den Agrarwissenschaften.
  • Grundlagen der Analyse von genetischen Daten anhand ausgew?hlter, beispielhafter Omics-Ebenen.
  • Genetische Distanzen und polygenetische B?ume zur Darstellung evolution?rer Beziehungen.
  • Grundlagen des maschinellen Lernens und der Klassifikation von Ereignissen sowie Ma?zahlen der Bewertung eines maschinellen Lernalgorithmus.
  • Anwendung der grundlegenden maschinellen Lernverfahren beispielhaft durch k-NN, Random Forest und Neuronale Netze.
  • Modellierungen an aktuellen Fallbeispielen aus der Anwendung.
  • Automatisierte Erstellung von Berichten in R Quatro.
  • Einführung in die Erstellung von interaktiven R Shiny Apps.

Gesamtarbeitsaufwand

Der Arbeitsaufwand für das Modul umfasst insgesamt 150 Stunden (siehe auch "ECTS-Leistungspunkte und Benotung").

Lehr- und Lernformen
Dozentengebundenes Lernen
Std. WorkloadLehrtypMediale UmsetzungKonkretisierung
40VorlesungPr?senz oder Online-
20?bungPr?senz oder Online-
Dozentenungebundenes Lernen
Std. WorkloadLehrtypMediale UmsetzungKonkretisierung
35Veranstaltungsvor- und -nachbereitung-
20Literaturstudium-
20Sonstiges-
15Prüfungsvorbereitung-
Benotete Prüfungsleistung
  • Hausarbeit oder
  • Klausur
Bemerkung zur Prüfungsart

Standardprüfungsleistung: Hausarbeit, max. 20 Seiten. Alternative Prüfungsleistung: 2-stündige Klausur

Prüfungsdauer und Prüfungsumfang

Klausur, 2-stündig oder Hausarbeit max. 20 Seiten

Empfohlene Vorkenntnisse

Keine. 

Für dieses Modul sind Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik hilfreich, aber nicht notwendig, wie sie unter anderem in den Modulen “Mathematik und Statistik (44B0266)” oder “Angewandte Statistik und Versuchswesen (44B0400)” vermittelt werden.

Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen oder erweitern m?chten, wird folgende Grundlagenliteratur mit dem “Skript Bio Data Science” unter jkruppa.github.io empfohlen.

In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter www.youtube.com/c/JochenKruppa.

Wissensverbreiterung

  • Die Studierenden kennen die g?ngigen experimentellen Designs in den Agrarwissenschaften.
  • Die Studierenden kennen die entsprechenden Repr?sentationen der experimentellen Designs als Datensatz.
  • Die Studierenden kennen die g?ngigen Datenformate für r?umliche und zeitliche Daten.
  • Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen in der Genetik zu erkennen und zu benennen.
  • Die Studierenden k?nnen die g?ngigen, vorgestellten statistischen Modellierungen benennen und unterscheiden.
  • Die Studierenden kennen die g?ngigen Funktionen für die Modellierungen und Datenaufbereitung in R.

Wissensvertiefung

  • Die Studierenden k?nnen explorative Abbildungen erstellen und interpretieren.
  • Die Studierenden k?nnen r?umliche und zeitliche Daten visualisieren und interpretieren.
  • Die Studierenden k?nnen das Ergebnis eines statistischen Modells im Kontext einer wissenschaftlichen Fragestellung interpretieren.
  • Die Studierenden sind in der Lage anhand eines statistischen Modells eine Entscheidung zu treffen.
  • Die Studierenden sind in der Lage Modellierungen mit den notwendigen Funktionen und Paketen in R durchzuführen.
  • Die Studierenden k?nnen einen automatischen Bericht in R Quatro erstellen.

Wissensverst?ndnis

  • Die Studierenden k?nnen ein statistisches Modell mit einer explorativen Datenanalyse oder Visualisierung in einen Kontext bringen.
  • Die Studierenden k?nnen verschiedene statistisches Modelle anhand verschiedener Ma?zahlen miteinander vergleichen und eine informierte Modellauswahl treffen.

Nutzung und Transfer

Die Studierenden sind in der Lage einfache Kosten- und Nutzenabsch?tzungen anhand von statistischen Modellen durchzuführen. Diese einfachen Absch?tzungen umfassen die Planung von technischen und biologischen Prozessen in der Landwirtschaft. Sie k?nnen Modelle für landwirtschaftliche Prozesse unter Verwendung von r?umlichen Daten entwickeln und validieren. Die Studierenden k?nnen dabei externe Literaturquellen und deren statistischen Ma?zahlen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen treffen.

Wissenschaftliche Innovation

Die Studierende k?nnen statistische Ma?zahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen. Die Studierenden k?nnen explorative Abbildungen aus Ver?ffentlichungen verstehen und erste informierte Forschungsideen entwickeln.

Kommunikation und Kooperation

Die Studierenden sind in der Lage die Ergebnisse der Datenanalyse klar und verst?ndlich zu kommunizieren, sowohl schriftlich als auch mündlich. Ebenfalls sind die Studierenden in der Lage g?ngige statistische Ma?zahlen zu erkennen und zu berichten. Die Studierenden k?nnen R Code lesen, erstellen und demonstrieren. Die Studierenden sind in der Lage mit einer automatisierten Berichterstattung in R Quatro oder R Shiny eine Datenanalyse zu kommunizieren.

Wissenschaftliches Selbstverst?ndnis / Professionalit?t

Die Studierenden k?nnen wissenschaftliche Publikationen und deren Modellierungen r?umlicher und zeitlicher Fragestellungen in den Kontext des eigenen Berufsfeldes setzen. Unter der Hilfe der Modellierung sind die Studierenden in der Lage informierte Entscheidungen treffen. Die Studierende sind sich der inh?renten Unsicherheit statistischer Modellierungen bewusst und k?nnen die eigenen Forschungsergebnisse kritisch hinterfragen. Den Studierenden sind die algorithmischen Grenzen von Modellen bewusst.

Literatur

Verwendbarkeit nach Studieng?ngen

  • Landwirtschaft
    • Landwirtschaft B.Sc. (01.09.2025)

  • Agrarsystemtechnologien
    • Agrarsystemtechnologien B.Sc. (01.09.2025)

    Modulpromotor*in
    • Kruppa-Scheetz, Jochen
    Lehrende
    • Kruppa-Scheetz, Jochen