FormareȘtiință

Regresie logistică: modele și metode

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. regresie logistică și analiza discriminantă sunt utilizate atunci când este necesar să se diferențieze în mod clar respondenților categoriile vizate. Mai mult decât atât, aceste grupuri sunt un singur parametru niveluri univariate. а также выясним, для чего она нужна. Luați în considerare în continuare în detaliu modelul de regresie logistică, precum și a afla ce a fost pentru.

Prezentare generală

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Un exemplu al problemei, în soluția care este utilizată de regresie logistică, poate fi o clasificare a respondenților prin cumpărarea de grup și nu cumpără muștar. Diferențierea se realizează în funcție de caracteristicile socio-demografice. Acestea includ, în special, includ vârsta, sexul, numărul de membri ai familiei, venituri și așa mai departe. Există criterii de diferențiere și variabila în cadrul operațiunii. Acesta din urmă codifică categoria țintă pentru care, de fapt, trebuie să împartă respondenți.

nuanțe

, значительно уже, чем для дискриминантного анализа. Trebuie spus că intervalul de cazuri în care logistica de regresie aplicate, mult mai îngust decât analiza discriminantă. În acest sens, utilizarea acesteia ca metodă universală de diferențiere este considerată mai preferată. Mai mult decât atât, experții recomandăm să începeți cu un studiu de analiza de clasificare discriminative. Și doar în caz de incertitudine pentru rezultatele pot fi utilizate de regresie logistică. Această necesitate este cauzată de mai mulți factori. используется при наличии четкого представления о типе независимых и зависимых переменных. regresie logistică se utilizează atunci când există o idee clară despre tipul de variabile independente și dependente. Prin urmare, selectat unul dintre cele 3 proceduri posibile. În cazul în care analiza discriminantă, cercetătorul este întotdeauna de-a face cu o operațiune statică. Aceasta a implicat o variabile categorice independente dependente și mai multe cu scara de orice tip.

tipuri

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. cercetării statistice obiective, care utilizează o regresie logistică, este de a determina probabilitatea ca un anumit respondent va fi atribuit unui anumit grup. Diferențierea se realizează în conformitate cu anumiți parametri. În practică, în conformitate cu valorile unuia sau mai multor factori independenți pot fi clasificate în două grupe de respondenți. . În acest caz, există o regresie logistică binară. De asemenea, parametrii specificați pot fi utilizate în alocarea a grupului este mai mare de două. Într-o astfel de situație există o regresie logistică multinomial. Grupul exprimat rezultat niveluri de orice variabilă.

exemplu

Să presupunem că există răspunsurile respondenților la întrebarea dacă acestea sunt interesați de o ofertă de a dobândi terenuri în suburbiile Moscovei. În acest caz, opțiunile sunt „nu“ și „da“. Trebuie să aflăm ce factori au o influență predominantă asupra deciziei potențialilor cumpărători. Pentru acest respondent întrebări sunt întrebați despre infrastructura teritoriului, distanța până la capitală, suprafața de teren, prezența / absența clădirilor rezidențiale și așa mai departe. Cu ajutorul regresiei binare, pot fi distribuite în două grupuri de respondenți. Primul va include pe cei care sunt interesați de cumpărare - potențialii cumpărători, iar al doilea, respectiv, cei care nu sunt interesați de o astfel de ofertă. Pentru fiecare respondent, în plus, se va calcula probabilitatea de atribuire la o categorie sau alta.

caracteristicile comparative

Spre deosebire de cele două exemple de realizare de mai sus constă într-un număr diferit și tipul de grupe dependente și variabile independente. Într-o regresie binară, de exemplu, a studiat factorul dihotomice dependență de una sau mai multe independente condiții. În acest caz, acesta din urmă poate fi de orice tip de scară. regresie multinomial este considerat un fel de versiune a clasificării. Aceasta se referă la variabila dependentă mai mult de 2 grupuri. Factorii independenți trebuie să aibă fie o ordinală sau la scară nominală.

De regresie logistică în SPSS

Pachetul statistic 11-12, a introdus o nouă versiune a analizei - secvenței. Această metodă este utilizată atunci când factorul dependent se referă la aceeași scală (ordinal) nume. În acest caz, variabilele independente selectate de un anumit tip. Acestea trebuie să fie ordinale sau nominale. Clasificarea în mai multe categorii este considerat cel mai versatil. Această metodă poate fi utilizată în toate studiile care au folosit de regresie logistică. , однако, можно только с помощью всех трех приемов. Îmbunătățirea calității modelului, cu toate acestea, este posibil doar prin utilizarea toate cele trei metode.

clasificarea ordinal

Se spune că mai devreme în pachetul statistic nu a fost oferit posibilitatea de a efectua o analiză tipică de specialitate pentru dependente de factori cu o scală ordinală. Pentru toate variabilele, cu numărul de grupuri de mai mult de 2 utilizate opțiunea multinomial. A introdus relativ recent, analiza secvenței are o serie de caracteristici. Ei iau în considerare specificul scalei ea. часто не рассматривается как отдельный прием. Între timp, în manualele metodologice de regresie ordinală logistică este de multe ori nu sunt tratate ca o recepție separată. Motivul este după cum urmează: analiza de serie nu are nici avantaje semnificative față de multinomial. Cercetătorul poate folosi bine acesta din urmă în prezența și ordinale și variabila dependentă nominală. În acest sens, procesul de clasificare sunt aproape imposibil de distins unul față de celălalt. Acest lucru înseamnă că analiza de ordinul de susținere nu va cauza probleme.

Analiza opțiunilor

Luați în considerare cazul simplu - o regresie binară. De exemplu, în procesul de cercetare de marketing estimat cererea pentru absolvenții anumită universitate metropolitane. În chestionar, respondenții au pus întrebări, inclusiv:

  1. Lucrezi? (Ql).
  2. Specificarea absolvire an (q 21).
  3. Care este scorul mediu de evacuare (aver).
  4. Sex (q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Regresia logistică va evalua impactul factorilor independenți aver, q 21 q 22 la ql variabilă. Pur și simplu pune, în scopul analizei este de a determina angajarea probabilă a absolvenților pe baza informațiilor pe teren, la sfârșitul anului, iar scorul mediu.

regresie logistică

Pentru a seta parametri folosind regresia binară, folosiți meniul Analyze►Regression►Binary Logistic. În Regresie logistică de a alege în lista din stânga variabilelor disponibile dependentă de factorul. Ei este QL. Această variabilă trebuie să fie plasat în câmpul dependent. După aceea, trebuie să introduceți site-ul covariabilele factori independenți - 21 q, q 22, aver. Apoi, aveți nevoie pentru a alege un mod de a le include în analiză. În cazul în care numărul de factori independenți de mai mult de 2, nu utilizați metoda de administrare simultană a tuturor variabilelor, care este instalat în mod implicit, și pas cu pas. Cel mai popular mod este considerat înapoi: LR. Folosind butonul de selectare, nu puteți include în studiul tuturor respondenților, și doar o categorie țintă specifică.

Definirea variabilelor categoriale

Butonul categoriale pentru a utiliza în cazul în care una dintre variabilele este evaluat la numărul de categorii de mai mult de 2. În această situație, Definiți fereastra Variabile categorici în stația Categorical Covariabilele amplasat la doar o astfel de opțiune. În acest exemplu, o astfel de variabilă lipsește. După această listă drop-down, selectați elementul Contrast deviației și faceți clic pe butonul Modificare. Ca urmare, unele dintre variabilele dependente vor fi generate de fiecare factor nominal. Numărul acestora corespunde numărului de condițiile inițiale ale categoriilor.

Salvare Variabile noi

Utilizați butonul Salvare în studiul principal este setat pentru a crea caseta de dialog setări noi. Acestea vor conține numere calculate în procesul de regresie. În special, este posibil să se creeze variabile care determină:

  1. Apartenența la o anumită categorie de clasificare (Groupmembership).
  2. Probabilitatea de clasificare a respondenților din fiecare grup de studiu (probabilităților).

Când utilizați butonul Opțiuni cercetătorul nu primește nici oportunități semnificative. Prin urmare, acesta poate fi ignorat. După apăsarea butonului „OK“ din fereastra principală vor fi afișate rezultatele analizei.

Controlul de calitate de adecvare de regresie logistică

Luați în considerare masa Coeficienții Omnibus Testsof model. Se afișează rezultatele analizei calității modelului de aproximare. Datorită faptului că opțiunea incrementală, aveți nevoie pentru a viziona rezultatele ultimei etape (Pasul2) a fost stabilit. Ar fi considerat un rezultat pozitiv, în care creșterea detectată indicele Chi-pătrat în tranziția la pasul următor, la un înalt grad de semnificație (Sig. <0,05). Calitatea modelului este estimat în linia de model. Dacă obțineți o valoare negativă, dar nu este considerată semnificativă în cazul în care modelul general ridicat pragul de semnificație, ultimul poate fi considerat, practic, utilizabil.

tabele

Modelul Rezumat oferă o estimare a indicelui dispersiei totale, care descrie modelul construit (figura R pătrat). Se recomandă să se aplice valoarea Nagelker. indicator pozitiv poate fi considerat ca un parametru Nagelkerke R Square, în cazul în care este mai mare decât 0,50. După aceea a evaluat rezultatele clasificării în care indicatorii efectivi ai aparținând uneia sau o altă categorie a studiului sunt comparate cu cele prezise de modelul de regresie. În acest scop, tabelul de clasificare Tabelul. De asemenea, vă permite să tragă concluzii cu privire la corectitudinea diferențiere pentru fiecare grup în cauză. . Tabelul de mai jos face posibilă găsirea de factori independenți semnificativi statistic au intrat în analiză precum și un factor de regresie logistică nestandardizate. Pe baza acestor indicatori pot prezice afilierea fiecărui respondent din eșantion la un anumit grup. Noile variabile pot fi introduse folosind butonul Save. Acestea vor conține informații cu privire la calitatea de membru al unei anumite categorii de clasificare (Predictedcategory) și probabilitatea de includere în aceste grupe (probabilități predictibilă de membru). După apăsarea butonului „OK“ din fereastra principală va apărea rezultatele de calcul Multinomial de regresie logistică.

Primul tabel, care conține indicatori importanți pentru cercetător, - Informații model de montare. Un nivel ridicat de semnificație statistică va indica calitatea înaltă și adecvarea utilizării modelelor pentru a rezolva probleme practice. O altă masă importantă este Pseudo R-Square. Acesta vă permite să se estimeze proporția din varianța totală în factorul dependent, care este cauzată de variabilele independente selectate pentru analiză. Conform testelor Ratio Tabelul Likelihood pot trage concluzii despre semnificația statistică a acesteia din urmă. Estimările parametrilor reflectă coeficienții nestandardizate. Acestea sunt utilizate în construcția ecuației. În plus, pentru fiecare combinație de variabile este determinată semnificația statistică a impactului lor asupra factorului dependent. În același timp, cercetarea de piață este adesea necesară pentru a diferenția categoriile de respondenți nu separat, ci ca parte a grupului țintă. În acest scop, tabelul Observedand Frecventele predictibile.

aplicație practică

Metoda Considerat de analiză este utilizat pe scară largă în activitatea comercianților. În 1991, a fost dezvoltat indicatorul sigmoid de regresie logistică. El este un instrument ușor de utilizat și eficient, care pot fi folosite pentru a prezice prețurile care ar putea „supraîncălzire“ lor. Indicatorul este prezentat pe un grafic sub forma unui canal format de două linii care se extind în paralel. Ei au eliminat o distanță egală față de tendința. Lățimea coridorului va depinde numai de intervalul de timp. Indicatorul este utilizat atunci când se lucrează cu aproape toate activul - de la perechi valutare la metale prețioase.

În practică, aceasta a produs 2 strategii cheie pentru utilizarea instrumentului: defalcarea și o inversare. În acest din urmă caz, comerciantul se va concentra asupra dinamicii modificărilor de preț în cadrul canalului. Pe este probabilitatea ca mișcarea începe în direcția opusă, deoarece se apropie de costul unui suport sau rezistență la rata de linie. În cazul în care prețul este apt strâns la limita superioară, atunci activul poate fi eliminat. Dacă este la limita inferioară, ar trebui să se gândească la cumpărare. defalcare strategie implică utilizarea de mandate. Ele sunt instalate în afara limitelor distanței relativ scurtă. Având în vedere faptul că prețul, în unele cazuri, le încalci pentru o perioadă scurtă de timp, ar trebui să-l joace în condiții de siguranță și setați stop-loss. În același timp, desigur, indiferent de strategia aleasă impune comerciantului pentru a maximiza Imperturbabil percepe și să evalueze situația care a apărut pe piață.

concluzie

Astfel, utilizarea de regresie logistică vă permite de a clasifica rapid și ușor respondenții în categorii, în conformitate cu parametrii specificați. La analiza posibila utilizare a unui anumit fel. În special, versatilitatea diferite de regresie multinomial. Cu toate acestea, expertii recomanda utilizarea tuturor metodelor descrise mai sus, în complex. Acest lucru se datorează faptului că, în acest caz, calitatea modelului va fi semnificativ mai mare. Aceasta, la rândul său, extinde gama de aplicare a acesteia.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ro.birmiss.com. Theme powered by WordPress.