Kapitel 9 Simulation Von Markov Chain Monte Carlo

Inhaltsverzeichnis

In Kapitel 8 Abschnitt 8.7 haben wir die Nützlichkeit des Posterior Predictive Checking beim Model Checking veranschaulicht. Die Grundidee besteht darin, eine Reihe von replizierten Datensätzen aus der späteren Vorhersageverteilung zu simulieren und zu sehen, wie die beobachtete Stichprobe im Vergleich zu den Replikationen abschneidet. Wenn die beobachteten Daten den Replikationen ähneln, sagt man, dass die beobachteten Daten mit den vorhergesagten Daten aus dem Bayes'schen Modell übereinstimmen.

  • Abschnitt 9.3 stellt den Metropolis-Sampler vor, einen allgemeinen Algorithmus zur Simulation einer beliebigen a-posteriori-Verteilung.
  • Anstatt eine Kandidatenstichprobe aus einer Vorschlagsverteilung auszuwählen, die die gesamte Dichte darstellt, wählt die Gibbs-Stichprobe einen zufälligen Wert für einen einzelnen Parameter, der alle anderen Parameter konstant hält.
  • Vor dem Zusammenfassen der simulierten Probe sollten einige grafische Diagnoseverfahren implementiert werden, um zu beurteilen, ob sich die Probe scheinbar „mischt“ oder sich gut über den Raum wahrscheinlicher Werte der Parameter bewegt.
  • Viele Random-Walk-Monte-Carlo-Methoden bewegen sich in relativ kleinen Schritten um die Gleichgewichtsverteilung herum, ohne die Tendenz, dass die Schritte in die gleiche Richtung gehen.
  • Die Bayes'schen Modelle in den Kapiteln 7 und 8 beschreiben die Anwendung von konjugierten Prioren, wobei Prior und Posterior zur gleichen Familie von Verteilungen gehören.

Weitere Beispiele werden in Beispielanwendungen unter der Unterüberschrift Artikel vorgestellt. Wenn ein MCMC einen stabilen Satz von Proben aus einer stationären posterioren Verteilung erreicht hat, wird es als konvergiert bezeichnet. Einige Modelle konvergieren möglicherweise nie, oder einige der oben diskutierten Gründe. Beispielsweise kann eine schlecht angepasste Vorschlagsverteilung dazu führen, dass der Walk einen kleinen Bereich der Zielverteilung nie oder nur sehr langsam verlässt. Ein hohes Maß an Autokorrelation zwischen Proben kann auch zu sehr kleinen Schritten im Gang und langsamer oder keiner Konvergenz führen. Fehler in der Programmierung und Syntax wurden von vielen Autoren als weiterer Grund für das Scheitern der Konvergenz genannt.

image

image

Ein Diagramm Erstellen, Auf Dem Man Weitergehen Kann

Beachten Sie, dass „fwd_ret“ eine deterministische Funktion von „fwd_choices“ und „proposal_args“ ist. Wenn nur diskrete Zufallsauswahlen verwendet werden, muss die Gewichtung gleich get_score – get_score sein. Gen enthält Primitive zum Konstruieren von MCMC-Kerneln und zum Zusammensetzen derselben in MCMC-Algorithmen. Obwohl Gen Sie ermutigt, MCMC-Algorithmen zu schreiben, die zur bedingten Verteilung konvergieren, erzwingt Gen diese Anforderung nicht. Sie können die MCMC-Grundelemente von Gen auf andere Weise verwenden, einschließlich für die stochastische Optimierung. Es wird viel Forschung zu verschiedenen Vorschlagsverteilungen für eine effiziente Stichprobe der späteren Verteilung durchgeführt.

Fortschritte Bei Multivariaten Statistischen Methoden

Im Gegensatz dazu ist aus Abbildung 9.8 ersichtlich, dass die Posterior-Dichte unter Verwendung der Cauchy-Dichte der Wahrscheinlichkeit ähnelt. Im Wesentlichen besagt diese Posterior-Analyse, dass unsere vorherigen Informationen falsch waren und das Posterior am stärksten von den Daten beeinflusst wird. Da Metropolis ein relativ einfacher Algorithmus ist, schreibt man eine kurze Funktion in R, um dieses Sampling für eine beliebige Wahrscheinlichkeitsverteilung zu implementieren. Die Funktion normal_update() wird verwendet, um den Mittelwert und die Standardabweichung der Posterior-Normalverteilung zu ermitteln. Der generative Funktionsvorschlag wird auf Argumenten (trace, suggest_args...) ausgeführt und erzeugt eine Auswahlkarte fwd_choices und einen Rückgabewert fwd_ret. Für jeden Wert von Modellargumenten und Vorschlags_Argumenten wendet die Involutionsfunktion eine Involution an, die das Tupel (get_choices, fwd_choices) auf das Tupel (get_choices, bwd_choices) abbildet.

Beachten Sie, dass beide Paare von Parameterwerten weit außerhalb des Bereichs liegen, in dem die hintere Dichte konzentriert ist. Man definiert einen Wert InitialValues, der eine Liste ist, die zwei Listen enthält, wobei jede Liste einen Startwert enthält. (Felder oben rechts und unten links in Abbildung 9.7) erzeugen akzeptablere Ströme simulierter Werte, obwohl die jeweiligen http://charma.uprm.edu/twiki/bin/view/Main/VoltzBird4985 Akzeptanzraten (0,8158 und 0,179) sehr unterschiedlich sind.