Dieser Kurs behandelt die Anwendung multivariater statistischer Methoden im Umfeld technischer Anwendungen in Forschung und Entwicklung. Alle Verfahren werden im Kurs anhand von praktischen Beispielen erläutert und in der Software "R" gerechnet. Schwerpunkt ist die Vermittlung der notwendigen Verfahrenskenntnis.
Inhalte:
- Multivariate Statistik im Vergleich zur univariaten Statistik
- Multivariate Varianzanalyse, multiple Vergleiche, MANOVA, Kontraste
- Multivariate lineare Modelle, multiple Regression, kanonische Korrelation
- Diskriminanzanalyse: kanonisch, linear und quadratisch
- Clusteranalyse
- Variablenreduktion, Extraktion bedeutender Faktoren, Hauptkomponenten- und Faktorenanalyse
- PLS (partial least squares) , erstellen und validieren von Kalibrationsmodellen
- Strukturgleichungsmodelle, Pfaddiagramme und Modellstruktur, latente Variablen aufdecken
Voraussetzungen:
Keine
Kursdauer: 2 Tage
Es gibt viele Programme zur Auswertung von Big Data, doch kaum eines ist so flexibel wie R. In dieser 3-Tages-Schulung erfahren Sie alles, was Sie brauchen um ihr erstes Data-Mining-Projekt erfolgreich zum Abschluss zu bringen.
Angefangen bei den Grundprinzipien und bewährten Arbeitsweisen des Datamining in R erhalten Sie einen Überblick über die wichtigsten Pakete und Werkzeuge. Anhand von zahlreichen praktischen Demonstrationen und Übungen verinnerlichen Sie die wichtigen ersten Schritte jedes Datamining-Projekts: Daten-Exploration und Management.
Im zweiten Teil des Kurses lernen Sie die wichtigsten Verfahren zur Auswertung von Big Data kennen. Hier werden Modelle des Clusterings (K-means, hierarchisches Clustering) sowie Prognosemodelle (Entscheidungsbäume, Neuronale Netzwerke, Random Forrests) besprochen. Im Detail lernen die Teilnehmer wie die entsprechenden Modelle in R berechnet, bewertet und interpretiert werden können.
Inhalte
- Strukturieren von Data-Mining-Projekten (SEMMA-Algorithmus)
- Explorative Datenanalyse und Datenmanagement für Big-Data in R
- Unsupervised Learning: Suche nach Strukturen (Clustering)
- Supervised Learning: Erstellen von Prognosemodellen
- Entscheidungsbäume
- Künstliche, neuronale Netze
- Das Prinzip von Ensemble-Modellen & Random Forrests
Voraussetzungen
Teilnehmer sollten bereits erste Erfahrungen mit R gesammelt haben und die grundlegende Arbeitsweise kennen. Dieses Wissen wird z.B. im Kurs Explorative Datenanalyse mit R vermittelt.
In diesem Eintageskurs lernen Sie die wichtigsten Pakete zum Erzeugen von Reports mit R kennen.
Beginnend bei einem Überblick über die wichtigsten Pakete zur Report-Erzeugung in R (Sweave, knitr und Markdown) lernen Sie schnell anhand von zahlreichen Übungen die grundlegende Syntax der Pakete knitr und Markdown kennen.
Mithilfe der in RStudio implementierten Funktionen erstellen Sie schnell und einfach Ihre Reports als HTML-Seite oder als Präsentation in PDF. In den Berichten werden Tabellen und Grafiken eingebettet und Sie lernen alle wichtigen Einstellungsmöglichkeiten kennen.
Inhalte
- Überblick über Reproducible Research mit R (Sweave, knitr, Markdown)
- Erstellen von einfachen Reports mit knitr und RStudio
- Erstellen von einfachen Reports mit Markdown und RStudio
- Anpassung von Reports und Grafiken
- Exportformate (HTML, PDF)
Voraussetzungen
Teilnehmer sollten bereits die grundlegende Arbeitsweise mit R kennen, wie Sie z.B. im Kurs Explorative Datenanalyse mit R vorgestellt wird.
Dieser zwei-Tages-Kurs behandelt die zwei wahrscheinlich wichtigsten Verfahren in der Statistik: ANOVA und lineare Regression.
Nach einer kurzen Abhandlung über statistische Hypothesentests, erfahren Sie in zahlreichen Beispielen und Übungen, wie Sie lineare Modelle zur Lösung Ihrer Fragestellungen nutzen können. Sie vergleichen Gruppenmittelwerte für zwei oder mehr Gruppen und analysieren den Einfluss von einer oder mehreren stetigen Einflussgrößen auf eine Responsevariable. Dabei lernen Sie nicht nur die statistischen Grundlagen, sondern auch die notwendigen Funktionen in R kennen.
Wesentliche behandelte Themen sind das Aufstellen von linearen Modellen, das Überprüfen von wichtigen Voraussetzungen sowie die Nutzung von grafischen Werkzeugen zur Interpretation der Ergebnisse.
Alle im Kurs verwendeten Werkzeuge und Pakete sind kostenlos und zum Großteil als Open Source im Internet verfügbar.
Inhalte:
- Statistische Hypothesentests
- Vergleich von Gruppen via ANOVA
- Modellspezifikation
- Modellinterpretation
- Residuendiagnostik & Annahmen
- Einfache Lineare Regression
- Multiple Lineare Regression
- Modellspezifikation
- Modellinterpretation
- Residuendiagnostik & Annahmen
Voraussetzungen:
Teilnehmer sollten ein grundlegendes Verständnis vom Arbeiten mit R haben. Die notwendigen Kenntnisse können Sie zum Beispiel im Kurs Explorative Datenanalyse mit R erwerben.
Dieser zweitägige Kurs vermittelt Ihnen das notwendige Wissen um statistische Analysen mir R durchzuführen.
Zu Beginn lernen Sie die grundlegende Arbeitsweise mit R und R-Studio kennen. Das beinhaltet den Import von Daten aus verschiedenen Dateiformaten, wie Excel, Textdateien oder Datenbanken, Datenmanagement mit dem Paket dplyr sowie eine Beschreibung der verschiedenen Hilfefunktionen. Im Verlauf des Kurses entwickeln Sie anhand von zahlreichen, praktischen Beispielen, Routine im Anpassen von vorgefertigten Skripten und Funktionen für Ihre Anwendungen.
Der letzte Teil des Kurses beschäftigt sich mit deskriptiver Statistik in R. Sie lernen, wie Sie Übersichtstabellen (Pivot-Tabellen) in R erstellen und publizieren können. Weiterhin werden die wichtigsten Grafikfunktionen des Pakets ggplot2 vorgestellt. Am Ende des Kurses können Sie Balkendiagramme, Histogramme, Scatterplots und zahlreiche weiter Grafiken mit R erstellen und exportieren.
Alle im Kurs verwendeten Werkzeuge und Pakete sind kostenlos und zum Großteil als Open Source im Internet verfügbar.
Inhalte:
- R und R-Studio
- Datenimport (Excel, Textdateien)
- Datenmanagement mit dplyr
- Deskriptive Statistik mit dplyr
- Grafikerstellung mit ggplot2
Voraussetzungen:
Keine.