Rmd

Einfache Boxplots

Per Defaults werden dargestellt: Median, eine Box hierum zwischen oberem und unterem Quartil, die Spannweite (Min, Max) und bei Ausreissern diese Datenpunkte.

Default für Ausreisser ist der 1.5-fache Interquartilabstand über bzw. unter der oberen bzw. unteren Quartilgrenze (Ober- bzw. Unterkante der Box). Der entsprechende named Parameter ist ‘range’. Achtung: In den Whiskers wird nicht diese Grenze angezeigt, sondern die Vp/Beobachtung mit dem höchsten bzw. tiefsten Wert innerhalb dieses zulässigen Bereiches

# Beispieldaten:
kids <- c(18,15,22,19,18,17,18,20,17,12,16,16,17,21,23,18,20, 21,20,20,15,18,17,19,20,23,22,10,17,19,19,21,20,18, 18,24,11,19,31,16,17,15,19,20,18,18,40,18,19,16)
adults <- c(10,12,5,8,13,10,12,8,7,11,11,10,9,9,11,15,12, 17,14,10,9,8,15,16,10,14,7,16,9,1,4,11,12,7, 9,10,3,11,14,8,12,5,10,9,7,11,14,10,15,9)
boxplot(kids)

zwei Boxplots nebeneinander

boxplot(kids, adults)

mit Beschriftung

namen <- c("Kinder","Erwachsene")
boxplot(kids, adults, names=namen, main="Anzahl der 'and then ...' Nennungen")

Anpassungen

Die Farben der Boxen wie auch ihre Breite können beispielsweise festgelegt werden und vieles andere mehr …

boxplot(
  kids, adults,                               # die beiden darzustellenden Datenvektoren 
  names=c("Kinder","Erwachsene"),             # Namen für die beiden Boxplot-Spalten festlegen
  main="Anzahl der 'and then ...' Nennungen", #Titel für die Grafik festlegen
  col=c("green","red"),                       #Farben für die Boxplot-Kästen festlegen
  boxwex=0.2,                                 # die Boxen schmaler machen (20% der Normalbreite)
  ylim = c(0,50))                             # den Bereich für die Y-Achse festlegen

Bivariate Boxplots

Everitt (2009) empfielt einen sog. bivariate boxplot um in einem Streudiagramm bivariate Verteilung, Zusammenhang und Ausreisserkontrolle visuell zu ermöglichen. R bietet diese Funktion nicht von Haus aus, sie kann aber über die Möglichkeit der Definition eigener Funktionen ‘nachgerüstet’ werden. Diese Funktion nennt er ‘bvplot’. Sie benutzt ‘biweight’.

Ein Beispiel (mit einem Ausreisser)

# define data
m1 <- c( 88.49,  91.17,  95.25,  79.83,  83.69, 97.64,  93.06, 74.50, 78.32,  93.00)
m2 <- c(106.04, 100.81, 107.41, 104.43, 107.69, 97.93, 108.07, 85.99, 98.38, 102.27)

# read Brian's functions
#source("http://www.psych.uni-goettingen.de/mat/functions.txt")

library(MVA)
## Loading required package: HSAUR2
## Loading required package: tools
# a minimal bvbox
MVA::bvbox(cbind(m1, m2))

etwas verständlicher

MVA::bvbox(cbind(m1, m2), 
    mtitle="",
    xlab="Messung 1",
    ylab="Messung 2"
    )

Version: 22 April, 2021 09:28