Fehlerfortpflanzung

Im Einführungsskript findet man auf Seite 42 die Aussage: ,, Die Standardabweichungen für die beiden Parameter ... erhält man durch Anwendung des Fortpflanzungsgesetzes für die Unsicherheiten``. Als Quelle kann hier das im Vorwort erwähnte Buch Bevington (2003) vermutet werden. Dort findet sich auf Seite 109 die Herleitung der im Einführungsskript verwendeten Formeln. Eine ähnliche Aussage wie im Einführungsskript ist auch bei Wolff (2014) auf Seite 118 zu finden, ohne dass dazu eine Begründung oder eine Quellenangabe erfolgt.

Was bedeutet die Anwendung der Fehlerfortpflanzung auf das Allgemeine Lineare Modell? Dazu wird zuerst eine skalare Größe $ \theta$ betrachtet, die eine beliebige Funktion des $ n$ dimensionalen Vektors $ \bm{y}$ ist.

$\displaystyle \theta \equiv \theta(\bm{y}) = \theta(y_1,y_2,\ldots,y_n)
$

Wenn die Fehler $ \epsilon_i=y_i-\bar{y_i}$ mit $ \bar{y_i} = \bm{\mathrm{E}}[y_i]$ klein sind, kann die Taylorentwicklung von $ \theta(\bm{y})$ in der Umgebung des Punktes $ \bm{y}=\bar{\bm{y}}$ nach der ersten Ordnung abgebrochen werden.

$\displaystyle \theta(\bm{y}) = \theta\left(\bar{\bm{y}}\right)+\sum_{i=1}^n\lef...
...\frac{\partial \theta(\bm{y})}{\partial y_i} \right\vert _{\bm{y}=\bar{\bm{y}}}$ (24)

Für die Varianz von $ \theta(\bm{y})$ gilt:

$\displaystyle \bm{\mathrm{Var}}[\theta(\bm{y})]=\bm{\mathrm{E}}\left[\Big(\thet...
...eq \bm{\mathrm{E}}\left[\Big(\theta(\bm{y})-\theta(\bar{\bm{y}})\Big)^2\right]
$

Wird die Taylorentwicklung 24 in diese Gleichung eingesetzt, ergibt sich:
$\displaystyle \bm{\mathrm{Var}}[\theta(\bm{y})]$ $\displaystyle =$ $\displaystyle \bm{\mathrm{E}}\left[\left( \sum_{i=1}^n\left(y_i-\bar{y_i}\right...
...heta(\bm{y})}{\partial y_i} \right\vert _{\bm{y}=\bar{\bm{y}}} \right)^2\right]$  
  $\displaystyle =$ $\displaystyle \sum_{i=1}^n\sum_{j=1}^n
\left.\frac{\partial\theta(\bm{y})}{\par...
...t.\frac{\partial\theta(\bm{y})}{\partial y_j}\right\vert _{\bm{y}=\bar{\bm{y}}}$  

Dabei sind die

$\displaystyle \bm{\mathrm{E}}\left[\Big(y_i-\bar{y_i}\Big)\Big(y_j-\bar{y_j}\Big)\right]
= \sigma_{i,j} = \bm{\mathrm{Cov}}[y_i,y_j]
$

die Elemente der Kovarianzmatrix $ \bm{\Sigma}$ des Vektors $ \bm{y}$. Wird außerdem

$\displaystyle (\Delta\,\theta)^2 = \bm{\mathrm{Var}}[\theta(\bm{y})]
$

gesetzt, erhalten wir das allgemeine Fehlerfortpflanzungsgesetz

$\displaystyle (\Delta\,\theta)^2 = \sum_{i=1}^n\sum_{j=1}^n \left.\frac{\partia...
...t.\frac{\partial\theta(\bm{y})}{\partial y_j}\right\vert _{\bm{y}=\bar{\bm{y}}}$ (25)

Für den Fall, dass die Werte des Vektors $ \bm{y}$ nicht korreliert sind, wenn für $ i\ne j$ gilt $ \bm{\mathrm{Cov}}[y_i,y_j] = 0$, vereinfacht sich die Gleichung 25 zu der häufig verwendeten Form:

$\displaystyle (\Delta\,\theta)^2 = \sum_{i=1}^n\left(
\left.\frac{\partial\the...
...bm{y})}{\partial y_i}\right\vert _{\bm{y}=\bar{\bm{y}}}
\Delta\,y_i \right)^2
$

mit $ (\Delta\,y_i)^2 = \sigma_{i,i} = \bm{\mathrm{Var}}[y_i]$.

Das allgemeine Fehlerfortpflanzungsgesetz 25 für eine Größe $ \theta$ lässt sich auf den $ p$-dimensionalen Vektor $ \bm{\theta}$ erweitern. Dessen Elemente $ \theta_k$ sind alle Funktionen des selben Vektors $ \bm{y}$ und daher korreliert. Für die Elemente der Kovarianzmatrix $ \bm{\mathrm{Cov}}[\bm{\theta}]$ gilt dann:

$\displaystyle \bm{\mathrm{Cov}}[\theta_k,\theta_l] = \sum_{i=1}^n\sum_{j=1}^n \...
...; \left.\frac{\partial\theta_l}{\partial y_j}\right\vert _{\bm{y}=\bar{\bm{y}}}$ (26)

Wird eine $ p \times n$ Matrix $ \bm{G}$ mit den Elementen

$\displaystyle g_{k,i} = \left.\frac{\partial\theta_k}{\partial y_i}\right\vert ...
...hspace{4mm} k = 1\dots p \hspace{4mm}
\mathrm{und} \hspace{4mm} i = 1\ldots n
$

eingeführt, kann Gleichung 26 als Matrizengleichung geschrieben werden.

$\displaystyle \bm{\mathrm{Cov}}[\bm{\theta}] = \bm{G} \, \bm{\Sigma} \, \bm{G}^T$ (27)

Bezeichnet man die $ p \times n $ Matrix $ (\bm{A}^T\bm{P}\;\bm{A})^{-1}\bm{A}^T\bm{P}$ aus Gleichung 12 mit $ \bm{H}$, dann kann die Gleichung 12 auch geschrieben werden als:

$\displaystyle \widehat{\bm{\theta}}$ $\displaystyle =$ $\displaystyle \bm{H} \, \bm{y}$  
$\displaystyle \widehat{\theta_k}$ $\displaystyle =$ $\displaystyle \sum_{i=1}^n h_{k,i}\, y_i$  

Aus dieser Darstellung wird sofort klar, dass für die einzelne Elemente der Matrix $ \bm{H}$ gilt:

$\displaystyle h_{k,i} = \frac{\partial \theta_k}{\partial y_i}
$

Damit kann aus den Gleichungen 27 und 11 die Beziehung
$\displaystyle \bm{\mathrm{Cov}}[\bm{\theta}]$ $\displaystyle =$ $\displaystyle \bm{H}\,\bm{\Sigma}\,\bm{H}^T$ (28)
  $\displaystyle =$ $\displaystyle c (\bm{A}^T\bm{P}\;\bm{A})^{-1}$  

abgeleitet 17werden. Die so bestimmte Kovarianzmatrix enthält die, bei der Aufstellung des Allgemeinen Linearen Modells willkürlich festlegbare Konstante $ c$. Alle aus der Kovarianzmatrix abgeleiteten Fehlerintervalle sind daher von der Festlegung dieser Konstanten abhängig. Nur wenn die Kovarianzmatrix $ \bm{\Sigma}$ vollständig bekannt ist, oder aus den vorliegenden Daten bestimmt werden kann, so wie es von Grabe (2011) im Kapitel 21 beschrieben wird, führt die Festlegung $ c = 1$ beziehungsweise $ \bm{P}=\bm{\Sigma}^{-1}$ zu richtigen Ergebnissen. Nur in diesem Fall gilt:

$\displaystyle \bm{\mathrm{Cov}}[\bm{\theta}] = (\bm{A}^T\bm{\Sigma}^{-1}\bm{A})^{-1}$ (29)

Auf diesen Umstand macht auch Bevington (2003) auf Seite 108 aufmerksam. Er schlägt vor, die bestimmten Varianzen, die Quadrate der Fehlerintervalle, zu korrigieren, sie mit dem Wert von $ \chi^2/(n-p)$ zu multiplizieren, wenn $ \chi^2/(n-p)$ zu stark von 1 abweicht. Genau dann ergibt sich die von von der klassischen Statistik (Gleichung 14) berechnet Kovarianzmatrix. Auf die zwingende Notwendigkeit der Berücksichtigung des Varianzfaktors $ \widehat{\sigma^2}$ weist auch Martin (2012) ausdrücklich im Abschnitt 8.1.2 hin. Wird dies unterlassen, dann führt die Anwendung des Fehlerfortpflanzungsgesetzes auf das Allgemeine Lineare Modell zu falschen Ergebnissen.

Damit ist die Ursache der Widersprüche in Tabelle 2 geklärt. Die Formeln aus dem Einführungsskript (2007) liefern das gleiche falsche Ergebnis wie die Mathematica Routine ,,LinearModelFit`` mit der Option ,,VarianceEstimatorFunction $ \rightarrow$ (1&)``. In beiden Fällen wird der Varianzfaktor auf den Wert 1 festgelegt. Ob das auch bei QtiPlot der Fall ist, wird im weiteren noch untersucht.

Da in der im Einführungsskript (2007) auf Seite 42 angegebenen Gleichung 45 der Varianzfaktor nicht berücksichtigt wird und dort auch die obigen Hinweise in keiner Weise erwähnt werden, ist diese Gleichung und die ihr zu Grunde liegende Vorgehensweise als falsch zu betrachten.

schaefer 2017-12-09