Multipler Korrelationskoeffizient
Der multiple Korrelationskoeffizient ist in der multivariaten Statistik ein Korrelationskoeffizient, welcher die lineare Abhängigkeit zwischen einer Zufallsvariable und einer Menge anderer Zufallsvariablen misst. Konkret bedeutet das für einen Zufallsvektor , dass der multiple Korrelationskoeffizient die maximale Korrelation zwischen einer Zufallsvariable für und jeder beliebigen linearen Funktion von ist. Als Spezialfall erhält man den multiplen Korrelationskoeffizient zwischen und . Im Gegensatz zu den gewöhnlichen Korrelationskoeffizienten liegt der multiple Korrelationskoeffizient zwischen und . Der multiple Korrelationskoeffizient wird mit notiert.
Der multiple Korrelationskoeffizient wurde 1896 von Karl Pearson für drei Variablen eingeführt und 1897 von George Udny Yule erweitert.[1]
Definition
Sei ein Zufallsvektor mit positiv definiter Kovarianzmatrix und .
Wir machen folgende Zerlegung
Der multiple Korrelationskoeffizient zwischen und ist die maximale Korrelation zwischen und jeder linearen Funktion .
In mathematischen Formeln ausgedrückt[2]
wobei die -te Reihe von ist und .
Wendet man die Cauchy-Schwarz-Ungleichung an
so erhält man eine Obergrenze, die erreicht wird, wenn .
Daraus folgt
Eigenschaften
- Es gilt
- und .
- Man kann zeigen, dass wenn die Regressionsfunktion eine lineare Funktion ist, dann ist der multiple Korrelationskoeffizient gerade der Korrelationskoeffizient zwischen und .[3][2]
- Es gilt
- wobei [2]
Spezialfall X1 und X2,...,Xn
Möchten wir herleiten, das heißt den multiplen Korrelationskoeffizient zwischen und , dann machen wir folgende Zerlegung
da ein -dimensionaler Vektor ist, verzichten wir auf die Notation .
Es gilt dann
Multipler Korrelationskoeffizient für eine Stichprobe
Seien unabhängige Stichproben von und
die korrigierte Stichprobenkovarianzmatrix. Dann machen wir folgende Zerlegung
und der multiple Korrelationskoeffizient einer Stichprobe ist dann
wobei die -te Reihe von ist.
Wenn eine Normalverteilung zugrunde liegt, dann ist der Maximum-Likelihood-Schätzer von .[3]
Literatur
- Theodore Wilbur Anderson: Multivariate Analysis and Its Applications. Hrsg.: Wiley. 2003, ISBN 978-0-940600-35-5.
- Robb J. Muirhead: Aspects of Multivariate Statistical Theory. Hrsg.: Wiley, Deutschland. 2009.
Einzelnachweise
- Theodore Wilbur Anderson: Multivariate Analysis and Its Applications. Hrsg.: Wiley. 2003, ISBN 978-0-940600-35-5, S. 33.
- Theodore Wilbur Anderson: Multivariate Analysis and Its Applications. Hrsg.: Wiley. 2003, ISBN 978-0-940600-35-5, S. 38.
- Robb J. Muirhead: Aspects of Multivariate Statistical Theory. Hrsg.: Wiley, Deutschland. 2009, S. 164–167.