Aprašysime lygties
(1)
koeficientų radimo eigą. Tiek klasterinėje, tiek diskriminantinėje analizėje viena iš fundamentaliausių yra atstumo tarp stebėjimų ir grupių sąvoka. Metodas, kurį nagrinėsime, pagrįstas kovariacinės matricos savybe atspindėti taškų išsibarstymą pagal atskirus kintamuosius. Panagrinėkime matricą
; čia:
,
- s-ojo kintamojo bendrasis vidurkis (visose grupėse). Pastebėsime, kad
yra kovariacijos tarp s-ojo ir q-ojo kintamųjų koeficientas. Reiškiniai skliausteliuose yra kintamųjų reikšmių nuokrypiai nuo bendrojo vidurkio. Įstrižainės elementai yra kvadratinių nuokrypių sumos, o kai
, turime nuokrypių pagal du skirtingus kintamuosius sandaugų sumas – šis dydis yra kintamųjų reikšmių suderinamumo matas ta prasme, kad parodo, kaip gerai didelis nuokrypis pagal vieną kintamąjį atitinka didelį nuokrypį pagal kitą kintamąjį. Analizuodami visą matricą R, gausime pilną informaciją apie stebėjimų pasiskirstymą kintamųjų erdvėje.
Sudarykime analogišką matricą W, charakterizuojančią nuokrypius grupių viduje:
;
čia -s-ojo kintamojo vidurkis i-oje grupėje. Jeigu grupės yra pakankamai gerai atskiriamos, stebėjimų išsibarstymas grupės viduje yra mažesnis už bendrą išsibarstymą; kartu – matricos W elementai mažesni už atitinkamus matricos R elementus. Tegul B=R-W, t.y
. Tai jau yra matas, tinkantis vertinti atstumą tarp grupių. Lygčių sistemos
,
……………………… (2)
sprendinys tenkina (1) sąryšį; čia
yra tikrinė reikšmė. Atlikę transformaciją
, (3)
gausime standartizuotus koeficientus , taip pat tenkinančius (1) lygtį. (2) lygčių sistema maksimaliai turi z netrivialių sprendinių (kartu egzistuoja z tikrinių reikšmių
), kurių kiekvienas atitinka vieną diskriminantinę funkciją. Pastebėsime, kad (3) koeficientų transformacija naudojama tam, kad naujoji koordinačių sistema būtų natūralesnė, t.y. jos pradžia sutaptų su pagrindiniu centroidu, matavimo vienetai sutaptų su atitinkamos diskriminantinės funkcijos visų stebėjimų reikšmių standartinio kvadratinio nuokrypio vienetais. Kiekviena ašis „ištempiama“ arba „suspaudžiama“ taip, kad atitinkama stebėjimo diskriminantinė reikšmė būtų lygi taško atstumui nuo pagrindinio centroido, išreikštam standartiniais nuokrypiais. Pavyzdžiui, reikšmė -2,5 reiškia, kad stebėjimas du su puse kvadratinio nuokrypio atstumu yra nutolęs nuo pagrindinio centroido priešinga diskriminantiniai ašiai kryptimi.
Tokiu būdu įvedame naują kanonių diskriminantinių funkcijų šeimos apibrėžtą, (k-1)-matę diskriminantinę erdvę.