Hey Leute,
ich will jetzt bitte nicht als streber abgestempelt werden. aber ich schicke mal die lösung, die ich mit nen paar leuten im team ausgearbeitet hab. ist alles nen bissle ausführlicher geschrieben, als für die klausur nötig.
ich hoffe es hilft euch. der fehler von hotshot liegt glaub ich bei der zweiten distanzmatrix in dem er die Produkte 1 und 5 wegen Distanz von 2 zusammenfassen will. die distanz von 1,7 zwischen P2 und P3 ist noch kleiner.
hoffentlich bring ich euch nicht auf den holzweg, aber wie gesagt, die lösung wurde in der gruppe ausgearbeitet.
schönes wochenende.
Beispiel Klausur WS 05/06 Aufgabe 2
folgende Distanzmatrix mit euklidischen Distanzen ist gegeben:
Produkt 1 Produkt 2 Produkt 3 Produkt 4 Produkt 5
Produkt 1 0
Produkt 2 3,7* 0
Produkt 3 4,1** 1,7*** 0
Produkt 4 5 8 1 0
Produkt 5 2 6 4 3 0
Produkt 1 Produkt 2 Produkt 3
Variable 1 1 2 1
Variable 2 2 4 3
Variable 3 3 6 7
Aufgabe a) Berechnung der euklidischen Distanz:
1. Euklidische Distanz zwischen Produkt (P) 1 und 2 (*)
d² = │Var 1: P 1 P 2│² + │Var 2: P 1 P 2│² + │Var 3: P 1 P 2│²
= │1-2│² +│2-4│² +│3-6│²
= 1² + 2² + 3²
d² = 14 (entspricht der quadr. eukl. Distanz)
d = √14 = 3,7 (euklidische Distanz)
2. Euklidische Distanz zwischen Produkt 1 und 3 (**)
d² = │Var 1: P 1 P 3│² + │Var 2: P 1 P 3│² + │Var 3: P 1 P 3│²
= │1-1│² +│2-3│² +│3-7│²
d² = 17
d = √17 = 4,1
3. Euklidische Distanz zwischen Produkt 2 und 3 (***)
d² = │Var 1: P 2 P 3│² + │Var 2: P 2 P 3│² + │Var 3: P 2 P 3│²
= │2-1│² +│4-3│² +│6-7│²
d² = 3
d = √3= 1,7
Insgesamt ergeben sich bei den 5 Produkten 10 verschiedene Distanzwerte. Da die Distanz zwischen Produkt 3 und 4 mit dem Wert 1 am kleinsten ist, sind sich diese am ähnlichsten.
Am unähnlichsten sind sich die Produkte 2 und 4 mit der größten Distanz von 8.
Aufgabe b)
1. Single-Linkage-Verfahren:
ermittelte Distanzmatrix wird zugrunde gelegt
Produkt 1 Produkt 2 Produkt 3 Produkt 4
Produkt 2 3,7
Produkt 3 4,1 1,7
Produkt 4 5 8 1
Produkt 5 2 6 4 3
- zuerst Objekte mit kleinster Distanz wählen und zu einer neuen Gruppe D(P3+P4)
zusammenfassen hier Distanz zwischen P3 und P4 am kleinsten mit Wert 1
(neue Gruppe steht in neuer Matrix links (2. Spalte); Rest mit verbleibenden Produk-ten auffüllen)
- Berechnung der Abstände/ Distanz zwischen der neuen Gruppe zu den übrigen Objekten durch ablesen oder mittels der Formel:
z.B.
Produkt 1:
D(P1; P3+P4) = 0,5{ D(P1,P3) + D (P1,P4) - │ D(P1,P3) + D (P1,P4) │}
= 0,5 { 4,1 + 5 - │4,1 - 5 │} = 0,5 * 8,2 = 4,1
Man erhält dann eine reduzierte Distanzmatrix.
P 3+4 P1 P2
P1 4,1
P2 1,7 3,7
P 5 3 2 6
im zweiten Schritt wieder Objekte mit kleinster Distanz wählen und zu einer neuen Gruppe D(P3+P4+P2) zusammenfassen hier (P3 + P4) und P2 am kleinsten mit Wert 1,7
Distanzmatrix
P 3+4+2 P1
P1 3,7
P 5 3 2
- im letzten Schritt werden P1 und P5 zu einer Gruppe zusammengefasst und die Distanz zur anderen Gruppe ermittelt mit
D(P1+P5; P2+P3+P4)
= 0,5{ D(P1,P2+P3+P4) + D (P5,P2+P3+P4) - │ D(P1,P2+P3+P4) + D (P5,P2+P3+P4) │} = 0,5 { 3,7 + 3 - │ 3,7 - 3│} = 3
2. Bestimmen der Cluster- Dendogramm:
Auf den ersten beiden Stufen wird ein Cluster gebildet. Auf Stufe 3 ein zweites.
Die Anzahl der Cluster kann auch mit dem Varianzkriterium begründet werden (erhöht Rechenaufwand). Bei Verwendung des Dendogramms kann man sagen, dass die Objekte ein Cluster bilden, die ohne Unterbrechung zusammengefasst wurden.
Somit erfolgt die Clusterbildung im Beispiel zwischen der dritten und vierten Stufe, da die Produkte 1 und 5 zu einer neuen Gruppe/ Cluster zusammengefügt werden.
Somit ergeben sich zwei Gruppen / Cluster.
Einloggen um zu antworten.