TvorenieVeda

Logistická regresia: modely a metódy

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. Logistická regresná a diskriminačné analýza sa používajú, keď je potrebné jasne odlíšiť respondentom cieľových kategórií. Okrem toho, tieto skupiny sú jediné jednorozmerné úrovne parametrov. а также выясним, для чего она нужна. Zvážiť ďalšie detail logistický regresný model, rovnako ako zistiť, čo to bolo pre.

Prehľad

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Príkladom tohto problému, v roztoku, ktorý sa používa logistickej regresie, môže byť klasifikácia respondentov Kúpou skupina a nie nákup horčice. Diferenciácia sa vykonáva podľa sociálno-demografické charakteristiky. Patrí medzi ne najmä patrí vek, pohlavie, počet členov rodiny, príjem a tak ďalej. Existujú kritériá pre diferenciáciu a premenné v prevádzke. Ten kóduje cieľový kategóriu, ktorá v skutočnosti, je potrebné rozdeliť respondentmi.

nuansy

, значительно уже, чем для дискриминантного анализа. Je potrebné povedať, že mnoho prípadov, v ktorých sa použili regresné logistika, oveľa užšie ako diskriminačné analýzy. V tomto ohľade je použitie tejto zlúčeniny ako univerzálny spôsobu diferenciácia sa považuje za výhodnejšie. Okrem toho odborníci odporúčajú začínať klasifikácie študijným diskriminačné analýzy. A práve v prípade neistoty pre výsledky môžu byť použité logistické regresie. Táto potreba je spôsobená niekoľkými faktormi. используется при наличии четкого представления о типе независимых и зависимых переменных. Logistická regresia sa používa, keď je jasnú predstavu o druhu nezávislých a závislých premenných. V súlade s tým, je vybraný z 3 možných postupov. Keď je diskriminačné analýza, výskumný pracovník je vždy čo do činenia s statickom prevádzky. Jednalo sa o jeden závislé a niekoľko nezávislých kategorické premenné s rozsahom ľubovoľného typu.

typy

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. Cieľ štatistický výskum, ktorý používa logistickej regresie, je stanoviť pravdepodobnosť, že konkrétny respondent bude priradená k určitej skupine. Diferenciácia sa vykonáva podľa určitých parametrov. V praxi sa podľa hodnôt jednej alebo viacerých nezávislými faktory môžu byť rozdelené do dvoch skupín respondentov. . V tomto prípade je binárny logistická regresia. Tiež uvedené parametre, môžu byť použité pri prideľovaní k skupine je vyšší ako dva. V takejto situácii je multinomial logistická regresia. Výsledná skupina vyjadrená hladiny akejkoľvek jednej premennej.

príklad

Predpokladám, že tam sú odpovede respondentov na otázku, či majú záujem o ponuku na kúpu pozemkov na predmestí Moskvy. V tomto prípade sú možnosti "nie" a "áno". Musíme zistiť, aké faktory majú rozhodujúci vplyv na rozhodovanie potenciálnych kupujúcich. Z tohto respondenta sú kladené otázky ohľadom infraštruktúry územia, vzdialenosť do hlavného mesta, rozlohy, prítomnosť / neprítomnosť obytných budov a podobne. Použitie binárne regresie, môžu byť rozdelené do dvoch skupín respondentov. Prvý bude zahŕňať tých, ktorí majú záujem o kúpu - potenciálnych kupcov, a druhý, respektíve tých, ktorí nemajú záujem o takú ponukou. Pri každom respondenta, okrem toho, že bude vypočítaná pravdepodobnosť priradenie k jednej kategórii alebo iný.

porovnávacie charakteristiky

Na rozdiel od oboch vyššie prevedenia spočíva v tom, rôzneho počtu a typu skupín závislých a nezávislých premenných. V binárnom regresiou, napríklad, študoval závislosť dichotomickej faktor z jedného alebo viacerých nezávislých podmienok. V tomto prípade môže byť tento akéhokoľvek typu vodného kameňa. Multinomické regresie je považovaný za akúsi verziu klasifikácie. To sa vzťahuje na závislej premennej na viac ako 2 skupín. Nezávislé faktory musia mať buď radové alebo menovitej stupnice.

Logistická regresia v SPSS

Štatistická balíček 11-12, predstavila novú verziu analýzy - sekvencie. Táto metóda sa používa, keď je závislý faktor týka rovnakého mena (poradové) meradle. V tomto prípade nezávislé premenné vybraný jeden konkrétny typ. Musí byť buď poradové číslo alebo nominálne. Zaradenie do niekoľkých kategórií je považovaná za najuniverzálnejší. Táto metóda môže byť použitá vo všetkých štúdiách, ktoré používali logistickej regresie. , однако, можно только с помощью всех трех приемов. Zlepšiť kvalitu modelu, je však možné iba za použitia všetkých troch metód.

poradový klasifikácia

Hovorí sa, že skôr do štatistického balíka nebola poskytnutá možnosť vykonávať typické špecializované analýzy pre závislé faktory sa poradové stupnice. Pre všetky premenné, s počtom skupín viac ako 2 používa multinomiální možnosť. Predstavený relatívne nedávno sekvenčná analýza má rad funkcií. Berú do úvahy špecifiká meradle. часто не рассматривается как отдельный прием. Medzitým, v metodických príručkách poradové logistická regresia nie je často považovaný za samostatnú recepcii. Dôvodom je nasledujúci: serial analýza nemá žiadne významné výhody oproti multinomial. Výskumník môže tiež použiť druhý, v prítomnosti a poradové číslo, a nominálnej závislej premennej. Pritom postup klasifikácie sú takmer na nerozoznanie od seba navzájom. To znamená, že analýza holding poradí nespôsobí žiadne problémy.

analýza možností

Zoberme si jednoduchý prípad - binárne regresie. Napríklad v procese marketingového výskumu odhaduje dopyt po absolventoch niektorých metropolitnej univerzity. V dotazníku boli respondenti kladených otázok, vrátane:

  1. Pracuješ? (Ql).
  2. Určte rok Graduation (q 21).
  3. Aký je priemerný počet bodov výstupu (priem).
  4. Pohlavie (Q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Logistická regresia posúdi vplyv nezávislých faktorov aver, Q 21 a Q 22 na variabilné QL. Jednoducho povedané, cieľom analýzy je určiť pravdepodobnú zamestnávanie absolventov na základe informácií o poli, na konci roka, a priemerné skóre.

logistická regresia

Ak chcete nastaviť parametre pomocou binárne regresie, použite ponuku Analyze►Regression►Binary Logistic. V logistická regresia vybrať v ľavom zozname dostupných veličín závislých faktorov. Oni je ql. Táto premenná musí byť umiestnený v závislých poli. Za to, že musíte zadať premenných site nezávislé faktory - Q 21, Q 22, priemer. Potom budete musieť zvoliť spôsob ich zahrnutie do analýzy. Ak je počet nezávislých faktorov viac ako 2, nepoužívajú metódu súčasného podávania všetkých premenných, ktoré je nainštalovaný v predvolenom nastavení, a krok za krokom. Najobľúbenejší spôsob je považovaný za vzad: LR. Pomocou tlačidla Select, nemožno zahrnúť do štúdia všetkých respondentov a len špecifické cieľové skupiny.

Definovať kategorické premenné

Tlačidlo kategorické použiť v prípade, že jedna z premenných je hodnotený na počet kategórií viac ako 2. V tejto situácii, Definovať okno kategoriálních premenné v stanici kategoriálních premenných umiestnená len taká možnosť. V tomto príklade je taká premenná chýba. Po tomto rozbaľovacom zozname vyberte položku Kontrast odchýlka a kliknite na tlačidlo Zmeniť. V dôsledku toho niektorí závislých premenných bude vytvorený z každého menovitého faktora. Ich počet zodpovedá počtu pôvodných podmienok kategórií.

Uloženie novej premenné

Použite tlačidlo Uložiť v hlavnej štúdii je nastavená na vytvorenie novej dialógové okno s nastavením. Budú obsahovať čísla vypočítané v procese regresie. Najmä je možné vytvoriť premenné, ktoré určujú:

  1. Príslušnosť k určitej kategórii klasifikácie (Groupmembership).
  2. Pravdepodobnosť, že klasifikáciu respondentov v každej študijnej skupine (pravdepodobnosti).

Pri použití tlačidla Možnosti výskumník neprijíma žiadne významné príležitosti. V súlade s tým môžu byť ignorované. Po stlačení tlačidla "OK" v hlavnom okne sa zobrazí výsledky analýzy.

kontrola kvality logistickej regresie primeranosti

Pozrime sa na tabuľku Omnibus Testsof Model koeficientov. To zobrazuje výsledky analýzy kvality modelu aproximácie. Vzhľadom k tomu, že inkrementálny možnosť, je potrebné sa pozerať na výsledky posledného stupňa (Krok 2) bol nastavený. By bola považovaná za pozitívny výsledok, v ktorom je zistený nárast Chi-kvadrát index v prechode k ďalšiemu kroku pri vysokom stupni významnosti (Sig. <0,05). Kvalitu modelu sa odhaduje na modelové rady. Ak sa dostanete zápornú hodnotu, ale to nie je považované za významné, pokiaľ je celková modelu vysokú významnosť, posledný môže byť považovaný prakticky použiteľné.

stoly

Model Súhrn poskytuje odhad celkového indexu disperzie, ktorá popisuje konštruované modelu (obr R námestie). Odporúča sa použiť hodnotu Nagelker. Pozitívne ukazovateľ možno považovať za parameter Nagelkerke R Square, v prípade, že je vyššia ako 0,50. Potom sa hodnotia výsledky klasifikácie, v ktorej sú skutočné ukazovatele do jednej alebo inej kategórie štúdie v porovnaní s tými, ktoré predpovedal regresného modelu. Na tento účel sa tabuľka klasifikácie tabuľky. To tiež umožňuje vyvodiť závery o správnosti diferenciácie pre každú z danej skupiny. . V nasledujúcej tabuľke je možné nájsť štatisticky významné nezávislé faktory vstúpili do analýzy, rovnako ako non-štandardizovaný faktora logistickej regresie. Na základe týchto ukazovateľov možno predpovedať vzťah každého respondenta vo vzorke do určitej skupiny. Nové premenné možné zadať pomocou tlačidla Uložiť. Budú obsahovať informácie o príslušnosti k určitej klasifikácie kategórie (Predictedcategory) a pravdepodobnosť zaradenie do týchto skupín (odhad pravdepodobnosti členstvo). Po stlačení tlačidla "OK" v hlavnom okne objaví MULTINOMIAL logistickej regresie výsledky výpočtov.

Prvá tabuľka, ktorá obsahuje dôležité ukazovatele pre výskumníka, - Model Fitting informácie. Vysoká hladina štatistickej významnosti bude ukazovať na vysokú kvalitu a vhodnosť využitia modelov na riešenie praktických problémov. Ďalším dôležitým tabuľka je Pseudo-R Square. To vám umožní odhadnúť podiel celkovej variance závislé faktor, ktorý je spôsobený nezávislých premenných zvolených pre analýzu. Podľa tabuľka pravdepodobnosti Ratio skúšok možno vyvodiť závery o štatistickej významnosti druhej. Parameter Odhady odrážať non-štandardizované koeficienty. Sú používané v konštrukcii rovnice. Okrem toho, pre každú kombináciu premenné sa určuje štatistickú významnosť ich vplyvu na závislé faktora. Medzitým sa prieskum trhu je často nutné rozlišovať kategórie respondentov nie je samostatne, ale ako súčasť cieľovej skupiny. Na tento účel sa tabuľka Observedand Predpovedané frekvencie.

praktická aplikácia

Považovaný za Metóda analýzy je široko používaný v práci obchodníkov. V roku 1991 sa ukazovateľ sigmoid logistickej regresie bol vyvinutý. Je ľahko použiteľný a účinný nástroj, ktorý možno použiť na predpovedanie pravdepodobného cien na ich "prehriatie". Indikátor je uvedená na grafe v podobe kanáli tvoreného dvoma líniami prebiehajúcimi paralelne. Sú odstránené v rovnakej vzdialenosti od trendu. Šírka koridoru bude závisieť iba na časovom rámci. Ukazovateľ sa používa pri práci s takmer všetky aktíva - od menových párov do drahých kovov.

V praxi bolo vyrobené 2 kľúčové stratégie pre použitie prístroja: členenie a obrátenie. V poslednom prípade obchodník bude sústrediť na dynamiku zmien cien v rámci kanála. Na je pravdepodobnosť, že pohyb začína v opačnom smere, ako sa blíži náklady na podporu alebo odporového rýchlosti linky. V prípade, že cena je tesne priliehať k hornej hranici, potom aktívum môže byť odstránená. Ak je to na spodnej hranici, mali by ste uvažovať o nákupe. Rozdelenie stratégia zahŕňa použitie odôvodňuje. Sú inštalované mimo hraníc relatívne krátke vzdialenosti. Ak vezmeme do úvahy, že cena v niektorých prípadoch porušiť je na krátku dobu, mali by ste hrať na istotu a nastaviť stop-loss. V rovnakej dobe, samozrejme, bez ohľadu na zvolené stratégie vyžaduje, aby obchodník s cieľom maximalizovať chladne vnímať a zhodnotiť situáciu, ktorá vznikla na trhu.

záver

To znamená, že použitie logistickej regresie umožňuje ľahko a rýchlo roztriediť respondentov do kategórií v súlade so zadanými parametrami. Pri analýze možného využitia určitým spôsobom. Najmä všestrannosť rôznych multinomiálního regresie. Avšak, odborníci odporúčajú použitie všetkých metód opísaných vyššie v komplexe. To je spôsobené tým, že v tomto prípade bude kvalita modelu podstatne vyššia. To na oplátku rozšíriť možnosti jeho použitia.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sk.birmiss.com. Theme powered by WordPress.