0 Daumen
487 Aufrufe

Aufgabe (Statistikprogramm R):

Sie lernen einen männlichen Kommilitonen kennen, der Ihnen erzählt, dass er drei weitere Geschwister hat. Schreiben Sie eine Funktion "sim.geschwister", die mithilfe von relativen Häufigkeiten schätzt, wie hoch die Wahrscheinlichkeit dafür ist, dass die drei Geschwister alle das gleiche Geschlecht haben, es sich also um vier Brüder handelt oder er drei Schwestern hat.

a) Gehen Sie dazu zunächst davon aus, dass die Geschlechterverteilung der Geburt gleichverteilt ist (50 % Jungen, 50 % Mädchen).

b) Was müssen Sie in Ihrer Funktion abändern, wenn Sie die folgende Geschlechterverteilung bei der Geburt betrachten: 51% Jungen, 49% Mädchen? Schreiben Sie eine erweiterte Version "sim.geschwister2", in der Sie dieses Verhältnis beachten. Vergleichen Sie Ihre Ergebnisse mit denen aus Teil a)

Verwenden Sie bei der Anwendung Ihrer Funktion jeweils die folgende Anzahl an Simulations- durchläufen L ∈ {10, 1000, 100000}. L soll Parameter Ihrer Funktion sein.

Avatar von

1 Antwort

0 Daumen

Antwort mit KI erzeugt

Um diese Aufgabe zu lösen, werden wir zwei R-Funktionen erstellen. Die erste Funktion, sim.geschwister, simuliert die Geburt von vier Kindern unter der Annahme, dass die Wahrscheinlichkeit, einen Jungen oder ein Mädchen zu bekommen, gleich ist (50% für jedes Geschlecht). Die zweite Funktion, sim.geschwister2, passt das Modell an, um eine Geschlechterverteilung von 51% für Jungen und 49% für Mädchen zu berücksichtigen.

Simulation mit gleicher Geschlechterverteilung (50% Jungen, 50% Mädchen):

r
sim.geschwister <- function(L) {
  geschwister <- replicate(L, {
    # Generiere 4 zufällige Zahlen (0 für Mädchen, 1 für Jungen)
    kinder <- sample(c(0, 1), size = 4, replace = TRUE)
    
    # Teste, ob alle vier Kinder das gleiche Geschlecht haben
    if(all(kinder == 1) | all(kinder == 0)) 1 else 0
  })
  
  # Berechne die relative Häufigkeit, dass alle vier Kinder das gleiche Geschlecht haben
  return(sum(geschwister) / L)
}


Simulation mit einer Geschlechterverteilung von 51% Jungen, 49% Mädchen:

r
sim.geschwister2 <- function(L) {
  geschwister <- replicate(L, {
    # Generiere 4 zufällige Zahlen basierend auf der Geschlechterverteilung
    # 1 für Jungen (51% Wahrscheinlichkeit), 0 für Mädchen (49% Wahrscheinlichkeit)
    kinder <- sample(c(0, 1), size = 4, replace = TRUE, prob = c(0.49, 0.51))
    
    # Teste, ob alle vier Kinder das gleiche Geschlecht haben
    if(all(kinder == 1) | all(kinder == 0)) 1 else 0
  })
  
  # Berechne die relative Häufigkeit, dass alle vier Kinder das gleiche Geschlecht haben
  return(sum(geschwister) / L)
}


Anwendung und Vergleich der beiden Simulationen:

Um die Funktionen zu testen und die Ergebnisse zu vergleichen, verwenden wir jeweils die vorgegebenen Werte für L (10, 1000, 100000).

r
# Simulation 1: Gleichverteilte Geschlechter
ergebnisse1_10 <- sim.geschwister(10)
ergebnisse1_1000 <- sim.geschwister(1000)
ergebnisse1_100000 <- sim.geschwister(100000)

# Simulation 2: Geschlechterverteilung 51% Jungen, 49% Mädchen
ergebnisse2_10 <- sim.geschwister2(10)
ergebnisse2_1000 <- sim.geschwister2(1000)
ergebnisse2_100000 <- sim.geschwister2(100000)

# Ergebnisse ausgeben
print(paste("Gleichverteilung - 10 Durchläufe:", ergebnisse1_10))
print(paste("Gleichverteilung - 1000 Durchläufe:", ergebnisse1_1000))
print(paste("Gleichverteilung - 100000 Durchläufe:", ergebnisse1_100000))

print(paste("Veränderte Verteilung - 10 Durchläufe:", ergebnisse2_10))
print(paste("Veränderte Verteilung - 1000 Durchläufe:", ergebnisse2_1000))
print(paste("Veränderte Verteilung - 100000 Durchläufe:", ergebnisse2_100000))


Durch die Analyse der Ergebnisse aus diesen Simulationen, kann man erkennen, wie sich die Änderung in der Geschlechterverteilung auf die Wahrscheinlichkeit auswirkt, dass alle vier Geschwister das gleiche Geschlecht haben. Erwartungsgemäß sollte die Wahrscheinlichkeit bei einer gleichmäßigen Verteilung etwas niedriger sein als bei der veränderten Geschlechterverteilung.

Jedoch können die exakten Ergebnisse variieren, da sie auf den Zufallszahlen basieren, die in jedem Simulationsdurchlauf generiert werden. Generell sollte aber gelten, dass mit zunehmender Anzahl an Simulationen (L) die ermittelten relativen Häufigkeiten stabilere Schätzungen der wahren Wahrscheinlichkeiten liefern.
Avatar von

Ein anderes Problem?

Stell deine Frage

Ähnliche Fragen

0 Daumen
1 Antwort
0 Daumen
1 Antwort
+2 Daumen
0 Antworten

Willkommen bei der Stacklounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community