/ / Logistinen regressio: malli ja menetelmät

Logistinen regressio: malli ja menetelmät

Logististen regressioiden menetelmät ja käytetään syrjintäanalyysiä,kun on tarpeen erottaa selvästi vastaajat kohderyhmittäin. Tässä tapauksessa ryhmiä itseään edustaa yhden yksiväräisen parametrin tasot. Katsotaanpa yksityiskohtaisesti logistisen regressiomallin, ja myös selvittää, miksi sitä tarvitaan.

regressio logistinen

Yleistietoja

Esimerkki ongelmasta, jonka ratkaisussa regressio logistinen, luokittelu vastaajien mukaanryhmät, jotka ostavat ja eivät osta sinapiaa. Erilaistuminen suoritettava sosiodemograafiset. Näitä ovat erityisesti ovat ikä, sukupuoli, perheenjäsenten lukumäärän, tulot jne. On kriteereitä erottamaan ja muuttuja operaatioon. Jälkimmäinen koodaa kohde- ryhmään, jonka itse asiassa täytyy jakaa vastaajat.

vivahteet

On huomattava, että niiden tapausten valikoima, joissa regressio logistinen, on paljon kapeampi kuin syrjäyttäjäanalyysi. Tältä osin pidetään suositeltavana jälkimmäisen käyttöä yleismaailmallisena eriyttämismenetelmänä. Lisäksi asiantuntijat suosittelevat luokitustutkimusten aloittamista syrjivällä analyysillä. Ja vain jos epävarmuus johtaa tuloksiin, voimme käyttää logistista regressiota. Tämä tarve johtuu joistakin tekijöistä. Logistinen regressio Sitä käytetään, kun on selkeä käsitysriippumattomat ja riippuvaiset muuttujat. Tämän mukaisesti valitaan yksi kolmesta mahdollisesta menettelystä. Tutkija tekee syrjivällä analyysillä aina yhden staattisen operaation. Siihen kuuluu yksi riippuvainen ja useita itsenäisiä kategorisia muuttujia, joilla on minkä tahansa tyyppinen asteikko.

tyypit

Tilastollisen tutkimuksen tehtävä, joka käyttää regressio logistinenon määritellä todennäköisyys, ettätietylle vastaajalle annetaan tietty ryhmä. Erotus tehdään tiettyjen parametrien mukaisesti. Käytännössä yhden tai useamman itsenäisen tekijän arvojen mukaan on mahdollista luokitella vastaajat kahteen ryhmään. Tässä tapauksessa, binäärinen logistinen regressio. Myös määritettyjä parametreja voidaan käyttääkun ne on jaettu yli kaksi ryhmään. Tässä tilanteessa on monimuotoinen logistinen regressio. Tuloksena olevat ryhmät ilmaistaan ​​yhden muuttujan tasoilla.

logistinen regressio

esimerkki

Oletetaan vastaajien vastauksia kysymykseenolivatko he kiinnostuneita ehdotuksesta hankkia maa-tontti Moskovan lähiöissä? Vaihtoehdot ovat "ei" ja "kyllä". On selvitettävä, mitkä tekijät vaikuttavat ensisijaisesti potentiaalisten ostajien päätökseen. Tästä vastaaja kysymyksiä kysytään infrastruktuurin alueella, etäisyys pääkaupungista, maa-alue, läsnäolo / poissaolo asuinrakennusten ja niin edelleen. Binääriohjaus regressio, voidaan jakaa kahteen ryhmään vastaajista. Ensimmäinen sisältää ne, jotka ovat kiinnostuneita ostamaan - potentiaalisia ostajia, ja toinen vastaavasti niitä, jotka eivät ole kiinnostuneita tällaista tarjousta. Kunkin vastaajan lisäksi, se lasketaan todennäköisyys tehtävän yhteen luokkaan tai toisella.

Vertailevat ominaisuudet

Ero edellä mainituista kahdesta vaihtoehdosta,koostuu eri ryhmistä ja riippuvaisten ja riippumattomien muuttujien tyypistä. Binaarisessa regressiossa tutkitaan esimerkiksi dikotomisen tekijän riippuvuutta yhdestä tai useammasta itsenäisestä tilasta. Jälkimmäisellä voi olla minkä tahansa asteikon tyyppi. Monimuotoista regressiota pidetään tämän luokituksen vaihtoehtona. Sisällön muuttuvassa muuttujassa on yli 2 ryhmää. Riippumattomilla tekijöillä on oltava joko tavallinen tai nimellinen asteikko.

Logistinen regressio spss: ssä

Tilastopaketissa 11-12, uusianalyysimuunnos - ordinal. Tätä menetelmää käytetään siinä tapauksessa, että riippuva tekijä viittaa samaan (ordinaali) asteikolle. Tässä tapauksessa riippumattomat muuttujat valitaan yhdestä tyypistä. Niiden on oltava joko tavallisia tai nimellisiä. Luokitusta useilla luokilla pidetään yleisimpänä. Tätä menetelmää voidaan käyttää kaikissa tutkimuksissa, joissa logistinen regressio. Paranna mallin laatua, mutta se on mahdollista vain kolmen tekniikan avulla.

riittävyyteen ja logistiseen regressioon

Tavallinen luokittelu

On syytä mainita, että aikaisemmin tilastopaketissaei ollut tyypillistä mahdollisuutta suorittaa erikoistunutta analyysia riippuvaisille tekijöille ordinaalimaailmassa. Kaikille muuttujille, joiden ryhmien lukumäärä oli suurempi kuin 2, käytettiin monimuotoista versiota. Otettu käyttöön melko äskettäin, ordinaalianalyysillä on useita ominaisuuksia. Ne ottavat huomioon mittakaavan erityispiirteet. Sillä välin menetelmän käsikirjoissa, ordinal logistinen regressio usein ei pidetä erillisenä laitteena. Tämä johtuu seuraavista: ordinaalianalyysillä ei ole merkittäviä etuja kuin multinomi. Tutkija voi hyvinkin käyttää jälkimmäistä, jos on sekä ordinaalinen että nimellinen riippuva muuttuja. Samalla luokitusprosessit eivät eroa toisistaan. Tämä tarkoittaa, että ordinaalianalyysin suorittaminen ei aiheuta ongelmia.

Analyysi vaihtoehto

Harkitse yksinkertaista tapausta - binääristä regressiota. Oletetaan, että markkinointitutkimuksen aikana arvioidaan tietyn korkeakoulun tutkinnon suorittaneiden merkitystä pääkaupungissa. Kyselylomakkeessa kysyttiin vastaajilta seuraavat kysymykset:

  1. Työskenteletkö? (Ql).
  2. Ilmoita valmistumisvuosi (q 21).
  3. Mikä on keskimääräinen valmistumisaste (keskiarvo).
  4. Sukupuoli (q22).

Logistinen regressio arvioi riippumattomien tekijöiden vaikutuksetaver, q 21 ja q 22 muuttujalle ql. Yksinkertaisesti sanottuna analyysin tarkoituksena on määrittää tutkinnon suorittaneiden todennäköinen työllisyys alan, valmistumisvuoden ja keskiarvon perusteella.

logistinen sigmoidinen regressiomittari

Logistinen regressio

Parametrien asettaminen binääriselläregressio, käytä Analyse►Regression►Binary Logistic -valikkoa. Logistinen regressio -ikkunassa sinun on valittava riippuva tekijä käytettävissä olevien muuttujien vasemmassa luettelossa. Hän on ql. Tämä muuttuja on sijoitettava riippuvaiseen kenttään. Sen jälkeen riippumattomia tekijöitä tulisi ottaa käyttöön Covariates-sivustolle - q 21, q 22, aver. Sitten sinun on valittava tapa sisällyttää ne analyysiin. Jos riippumattomien tekijöiden määrä on suurempi kuin 2, ei käytetä kaikkia muuttujia, jotka asennetaan oletusarvoisesti, mutta vaiheittaista menetelmää, samanaikaisen käyttöönoton menetelmä. Suosituin tapa katsotaan Taaksepäin: LR. Valitse-painikkeella et voi sisällyttää kaikkia vastauksia tutkimukseen, mutta vain tietyn kohderyhmän.

Määrittele luokitteluversioita

Luokittelupainiketta tulee käyttää kohdassajos jokin riippumattomista muuttujista on nimellistä ja luokkien lukumäärä on suurempi kuin 2. Tässä tilanteessa määritetään parametreja määritettäessä kategorinen muuttujien parametri parametriksi Kategorical Covariates -osiossa. Tässä esimerkissä tällaista muuttujaa ei ole. Tämän jälkeen valitse Contrast-pudotusvalikosta Poikkeus ja paina Muuta-painiketta. Tämän seurauksena kustakin nimellistekijästä muodostuu useita riippuvaisia ​​muuttujia. Heidän lukumääränsä vastaa alkuperäisen tilan luokkien lukumäärää.

Tallenna uudet muuttujat

Tallennuspainikkeen käyttäminen päävalintaikkunassatutkimus luo uusia parametreja. Ne sisältävät regressioprosessissa laskettuja indikaattoreita. Voit erityisesti luoda muuttujia, jotka määrittävät:

  1. Tietyn luokittelun luokittelu (ryhmän jäsenyyden).
  2. Todennäköisyys antaa vastaaja jokaiselle tutkimusryhmälle (Todennäköisyys).

Kun käytät Asetukset-painiketta, tutkija eisaa merkittäviä mahdollisuuksia. Näin ollen sitä voidaan sivuuttaa. Kun napsautat OK-painiketta, analyysitulokset näkyvät pääikkunassa.

logistisen regressiokerroin

Laadun valvonta riittävyyden ja logistisen regressio

Harkitse Omnibus Testsof Model -taulukkoKertoimia. Se näyttää mallin lähentymislaadun analyysin tulokset. Johtuen siitä, että vähitellen vaihtoehdon, sinun täytyy katsoa tuloksia viimeisen vaiheen (Vaihe 2) on asetettu. Pidettäisiin positiivinen tulos, jossa havaittiin kasvun Chi-square indeksi siirtymistä seuraavaan vaiheeseen on korkea merkitys (Sig. <0,05). Mallin laatua arvioidaan mallirivillä. Jos saat negatiivinen arvo, mutta sitä ei pidetä merkittävänä, jos yleinen korkea olennaisuuden mukaan viimeinen voidaan pitää käytännössä käytettävissä.

taulukot

Malliyhteenveto tarjoaa mahdollisuuden arvioida indikaattoria(R-aukon ilmaisin). On suositeltavaa käyttää Nagelkerin arvoa. Positiivinen indikaattori on parametri Nagelkerke R Square, jos se on yli 0,50. Tämän jälkeen arvioidaan luokituksen tuloksia, joissa verrataan todellisten indeksiä, jotka kuuluvat johonkin tutkituista luokista toiseen, verrattuna ennustettuihin regressiomallin perusteella. Voit tehdä tämän käyttämällä luokittelutaulukkoa. Sen avulla voidaan myös tehdä johtopäätöksiä eriyttämisen oikeellisuudesta kullekin tarkasteltavana olevalle ryhmälle.

logistisen regressiomallin
Seuraava taulukko tarjoaa mahdollisuuden selventää analyysiin otettujen riippumattomien tekijöiden tilastollista merkitsevyyttä sekä kumpaakin ei-standardoitua logistisen regressiokerroin. Näiden indikaattorien perusteella voitennusta kunkin vastaajan henkilöllisyys näytteestä tiettyyn ryhmään. Tallenna-painikkeella voit syöttää uusia muuttujia. Ne sisältävät tietoa tietyn luokitteluluokan luokittelusta (Predictedcategory) ja todennäköisyydestä sisällyttää kyseisiin ryhmiin (Predicted probabilities membership). Kun napsautat "OK", laskutoimitukset näkyvät moninomialistisen regressio-ikkunan pääikkunassa.

Ensimmäinen taulukko, jossa on tärkeäätutkijan luvut, - mallin sovitustiedot. Tilastollisen merkitsevyyden korkea taso osoittaa mallin käyttämisen korkean laadun ja soveltuvuuden käytännön ongelmien ratkaisemiseen. Toinen tärkeä taulukko on Pseudo R-Square. Sen avulla voimme arvioida osuuden varianssiarvosta riippuvalle tekijälle, joka määräytyy analysoitavaksi valitun riippumattoman muuttujan mukaan. Taulukon Likelihood Ratio Tests -työkalun mukaan voit tehdä johtopäätöksiä jälkimmäisen tilastollisesta merkityksestä. Parametrien arviot estävät epätyypillisiä kertoimia. Niitä käytetään yhtälön rakentamisessa. Lisäksi jokaiselle muuttujien yhdistelmälle on määritetty niiden vaikutuksen tilastollinen merkitys riippuvaiselle tekijälle. Sillä välin markkinointitutkimuksessa on usein tarpeen erottaa toisistaan ​​vastaajaryhmittäin, ei erikseen, vaan osana kohderyhmää. Voit tehdä tämän käyttämällä Observedand Predicted Frequency -taulukkoa.

Käytännön soveltaminen

Pohdittavaa analyysimenetelmää käytetään laajaltikauppiaiden työtä. Vuonna 1991 kehitettiin logistisen sigmodirektiivin indikaattori. Se on helppokäyttöinen ja tehokas työkalu, jolla voit ennustaa todennäköiset hinnat ennen kuin ne ylikuumenevat. Indikaattori on esitetty kaaviossa kahden sellaisen kanavan muodostamana, joka toimii rinnakkain. Ne ovat yhtä kaukana trendistä. Käytävän leveys riippuu vain aikataulusta. Indikaattoria käytetään lähes kaikkien omaisuuserien kanssa - valuuttaparista jalometalleihin.

logistinen regressio spss: ssä

Käytännössä on kehitetty kaksi keskeistä strategiaatyökalun käyttö: hajoamisen ja käännöksen yhteydessä. Jälkimmäisessä tapauksessa elinkeinonharjoittajaa ohjataan hinnanmuutoksen dynamiikalla kanavassa. Kun kustannus lähestyy tuen tai vastustuksen linjaa, panos tehdään todennäköisyydellä siitä, että liike alkaa vastakkaiseen suuntaan. Jos hinta lähestyy tiukasti ylärajaa, omaisuus voidaan hävittää. Jos se on alaraja, kannattaa ajatella hankintaa. Jakautumisstrategiaan kuuluu tilausten käyttö. Ne asetetaan suhteellisen pienen etäisyyden rajoille. Ottaen huomioon, että hinta tietyissä tapauksissa rikkoo niitä lyhyeksi ajaksi, sinun pitäisi saada jälleenvakuutus ja asentaa stop-loss. Samaan aikaan tietenkin, valitusta strategiasta riippumatta, elinkeinonharjoittajan on pidettävä mahdollisimman viileänä ja viileänä havaita ja arvioida markkinoilla vallitseva tilanne.

johtopäätös

Näin ollen logistisen regressiosovelluksen soveltaminenvoit nopeasti ja yksinkertaisesti luokitella vastaajat luokkiin määritettyjen parametrien mukaisesti. Analyysissä voit käyttää mitä tahansa tiettyä menetelmää. Erityisesti monimuotoinen regressio on monipuolinen. Asiantuntijat kuitenkin suosittelevat kaikkien edellä mainittujen menetelmien käyttöä kompleksissa. Tämä johtuu siitä, että tässä tapauksessa mallin laatu on paljon suurempi. Tämä puolestaan ​​laajentaa sen sovellusaluetta.

Lue lisää: