형성, 과학

로지스틱 회귀 : 모델과 방법

и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. 로지스틱 회귀 분석과 판별 분석은 명확 응답자를 대상으로 범주를 구별 할 필요가있을 때 사용된다. 또한,이 그룹은 단일 변량 매개 변수 수준이다. а также выясним, для чего она нужна. 더 자세히 로지스틱 회귀 모델을 고려뿐만 아니라, 그것을 위해 무엇인지 알아보십시오.

개요

, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. 문제의 예는, 로지스틱 회귀 분석을 사용하는 용액, 그룹 구입하여 응답자 및 겨자를 구입하지 않는 분류 될 수있다. 분화는 인구 사회 학적 특성에 따라 수행된다. 이들은 특히, 등등 나이, 성별, 가족 수, 소득 등을 포함, 등이 있습니다. 차별화 기준과 운영에 변수가있다. 후자는 사실, 응답자을 나눌 필요의 대상 범주를 인코딩합니다.

뉘앙스

, значительно уже, чем для дискриминантного анализа. 이는 상기되어야한다는 케이스의 범위되는 판별 분석보다인가 회귀 물류 훨씬 좁게한다. 이와 관련하여, 분화 보편적 방법으로 후자의 사용은 더 바람직한 것으로 간주된다. 또한, 전문가들은 분류 연구 차별적 분석을 시작하는 것이 좋습니다. 그리고 바로 결과에 대한 불확실성의 경우 로지스틱 회귀 분석을 사용할 수 있습니다. 이 필요성은 여러 가지 요인에 의해 발생합니다. используется при наличии четкого представления о типе независимых и зависимых переменных. 독립 변수와 종속 변수의 유형에 대한 명확한 아이디어가있을 때 로지스틱 회귀 분석을 사용한다. 따라서, 상기 3 개 개의 가능한 방법들 중 하나를 선택. 때 판별 분석은, 연구자는 항상 정적 동작을 다루고 있습니다. 그것은 모든 유형의 규모와 하나 개 따라 여러 독립적 인 범주 변수를 포함했다.

유형

, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. 로지스틱 회귀 분석을 사용하여 목표 통계적 연구는 특정 응답자가 특정 그룹에 할당 될 가능성을 결정하는 것이다. 분화는 특정 파라미터들에 따라 수행된다. 실제로, 하나 이상의 독립적 인 계수의 값에있어서, 응답자의 두 그룹으로 분류 될 수있다. . 이 경우, 이진 로지스틱 회귀있다. 또한, 특정 파라미터 그룹에 할당에 사용할 수있는 두 가지보다 크다. 이러한 상황에서 다항 로지스틱 회귀있다. 생성 된 그룹 중 어느 한 변수의 수치를 나타냈다.

예

그들은 모스크바 교외에 토지를 취득하는 제안에 관심이 있는지에 대한 질문에 응답자의 응답이있는 가정하자. 이 경우, 옵션은 "아니오"및 "예." 우리는 잠재적 인 구매자의 결정에 지배적 인 영향을 미치는 요인 무엇인지 찾아야합니다. 이 응답자 대한 질문이 지역의 인프라에 대해 질문 있습니다, 자본, 토지 면적, 존재 / 주거 건물의 부재 등등. 사용하여 바이너리 회귀과의 거리, 응답자의 두 그룹으로 배포 할 수 있습니다. 잠재적 인 구매자, 두 번째, 각각 같은 제안에 관심이없는 사람들 - 첫 번째는 구입에 관심이있는 사람들이 포함됩니다. 각 응답자의 경우, 또한, 한 카테고리 또는 다른 할당의 확률을 계산한다.

비교 특성

두 개의 실시 예와 달리 상기 다른 개수 및 종속 그룹과 독립 변수의 형태로 이루어져있다. 진 회귀 분석에서, 예를 들어, 하나 개 이상의 독립적 인 조건에서 의존 이분법 적 요인을 연구 하였다. 이 경우에, 후자는 규모의 임의의 유형일 수있다. 다항 회귀 분류 버전의 일종으로 간주됩니다. 이는 2 개 이상의 그룹에 대한 종속 변수에 관한 것이다. 독립 요소는 순서 또는 명목 척도 중 하나가 있어야합니다.

SPSS에서 로지스틱 회귀

통계 패키지 11 ~ 12, 분석의 새로운 버전을 소개 - 순서. 종속 요소는 동일한 이름 (서수) 규모에 관한 경우이 방법이 이용된다. 이러한 경우에, 독립 변수는 하나 개의 특정 유형을 선택한. 그들은 순서 또는 소액이어야합니다. 여러 종류의 분류는 가장 다양한 간주됩니다. 이 방법은 로지스틱 회귀 분석을 사용하는 모든 연구에 사용 할 수 있습니다. , однако, можно только с помощью всех трех приемов. 모델의 품질 향상, 단, 세 가지 방법을 사용하여 가능하다.

서수 분류

통계 패키지의 이전은 서수 규모에 따라 요소의 일반적인 전문적인 분석을 수행 할 수있는 기회를 제공되지 않았 음을 말한다. 모든 변수의 경우, 2 개 이상 그룹의 수와 다항 옵션을 사용했습니다. 비교적 최근에 도입 시퀀스 분석 기능을 가지고 있습니다. 그들은 계정에 규모 그것의 특성을. часто не рассматривается как отдельный прием. 한편, 방법론 매뉴얼에 서수 로지스틱 회귀는 종종 별도의 수신으로 간주되지 않는다. 다음과 같이 그 이유는 : 직렬 분석 다항을 통해 상당한 이점이 없습니다. 연구자 잘 존재 서수 공칭 종속 변수에 후자를 사용할 수있다. 이 과정에서 분류 과정은 서로 거의 구별 할 수 없다. 이것은 유지하기 위해 분석 문제가 발생되지 않습니다.

옵션의 분석

이진 회귀 - 간단한 경우를 생각해 보자. 예를 들어, 특정 수도권 대학 졸업생을위한 마케팅 조사 추정 수요의 과정이다. 설문 조사에서, 응답자가 질문을 포함했다 :

당신은 작동하고 있는가? (QL).
올해 졸업 (Q 21)을 지정합니다.
콘센트 (단언)의 평균 점수는 무엇입니까.
성별 (Q22).

позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. 로지스틱 회귀는 가변 QL에서 독립적 요인의 영향 단언 Q 21 Q 22을 평가한다. 간단히 말해, 분석의 목적은 필드, 연말, 평균 점수에 관한 정보에 기초 졸업생의 가능성 고용을 결정하는 것입니다.

로지스틱 회귀

진 회귀를 사용하여 매개 변수를 설정하려면, Analyze►Regression►Binary 물류 메뉴를 사용합니다. 로지스틱 회귀 분석에서 사용할 수있는 변수에 의존 요인의 왼쪽 목록에서 선택합니다. 그들은 QL이다. 이 변수는 종속 필드에 배치해야합니다. 단언 Q (21), Q (22), - 그 후, 당신은 사이트 공변량에게 독립적 인 요소를 입력해야합니다. 그런 다음 분석을 포함하는 방법을 선택해야합니다. 2 개 이상의 독립적 인 인자의 수는 단계에 의해 동시 기본적으로 설치된 모든 변수의 관리 및 단계의 방법을 사용하지 않는 경우. 가장 인기있는 방법은 이전 버전과 간주됩니다 LR. 선택 버튼을 사용하면 모든 응답자의 연구, 오직 특정 대상 범주에 포함 할 수 없습니다.

범주 형 변수 정의

변수 중 하나는 2 개 이상의 카테고리의 개수로 평가 될 때 범주 버튼 경우에 사용한다. 이 상황에서, 바로 그러한 옵션 배치 범주 형 공변량 역에서 범주 형 변수 창을 정의합니다. 이 예에서는 그러한 변수가 없습니다. 이 드롭 다운 목록 후, 항목 대비 편차를 선택하고 변경 버튼을 클릭합니다. 따라서, 종속 변수의 일부가 평가 요소의 각각에서 생성된다. 그들의 수는 범주의 원래 용어의 수에 해당합니다.

새로운 변수를 저장

주요 연구에서 저장 버튼을 사용하는 새로운 설정 대화 상자를 생성하도록 설정되어 있습니다. 그들은 회귀의 과정에서 계산 된 숫자를 포함합니다. 특히, 결정 변수를 생성 할 수있다 :

분류의 특정 카테고리 (Groupmembership)에 속하는.
각 연구 그룹 (확률)에 응답자를 분류하는 확률.

옵션 버튼 연구원을 사용하는 경우 상당한 기회를 수신하지 않습니다. 따라서, 무시할 수 있습니다. 메인 윈도우에서 "OK"버튼을 누른 후, 분석 결과를 표시한다.

로지스틱 회귀 적정성의 품질 관리

테이블 옴니버스 Testsof 모델 계수를 고려하십시오. 그것은 근사 모델의 품질 분석의 결과를 표시합니다. 인해 증가 옵션, 당신은 마지막 단계의 결과를 볼 필요가 있다는 사실을 (2 단계)이 설정되었습니다. 긍정적 인 결과로 간주 될 수있는 중요도가 높은 SIG (. <0.05)에서 다음 단계로의 천이의 검출 된 증가 카이 제곱 지수. 모델의 품질은 모델 라인으로 추정된다. 당신은 음의 값을 얻을 수 있지만, 전반적으로 높은 중요성 모델, 마지막 실질적으로 사용 가능한 것으로 간주 될 수 있다면 그것은 중요하게 간주되지 않습니다.

테이블

모델 요약은 생성 모델 (도 R 사각형)을 설명 총 분산 지수의 추정치를 제공한다. 값 Nagelker을 적용하는 것이 좋습니다. 이 0.50보다 높은 경우 긍정적 인 지표는 매개 변수 Nagelkerke R 광장으로 간주 될 수있다. 즉, 하나 또는 그 연구의 범주에 속하는 다른 실제 지표 회귀 모델에 의해 예측 된 결과와 비교하는 분류의 결과를 평가 한 결과. 이 목적을 테이블 분류 표하십시오. 그것은 또한 당신이 문제의 그룹의 각각에 대한 차별화의 정확성에 대해 결론을 도출 할 수 있습니다. . 다음 표는 가능한 분석뿐만 아니라 비 표준화 요인 로지스틱 회귀 분석에 입력 통계적으로 유의 한 독립적 인 요인을 찾을 수 있습니다. 이 지표에 근거하여 특정 그룹에 샘플의 각 응답자의 제휴를 예측할 수있다. 새로운 변수는 저장 버튼을 사용하여 입력 할 수 있습니다. 그들은 특정 분류 범주 (Predictedcategory) 및이 그룹에 포함 확률 (예측 확률 회원)의 구성원에 대한 정보를 포함합니다. 기본 창에서 "OK"버튼을 누른 후 다항 로지스틱 회귀 계산 결과를 나타납니다.

연구자에 대한 중요한 지표가 포함 된 첫 번째 테이블, - 모델 피팅 정보. 통계 학적으로 유의 한 높은 수준의 실질적인 문제를 해결하기 위해 모델의 사용의 높은 품질과 적합성을 가리 킵니다. 또 다른 중요한 표는 의사 R-광장입니다. 이것은 사용자가 분석을 위해 선택된 독립 변수에 의해 야기되는 종속 인자의 총 변동 비율을 추정 할 수있다. 표 우도 비율 테스트에있어서, 후자의 통계적 유의성에 대한 결론을 내릴 수있다. 매개 변수 추정은 비 표준화 계수를 반영합니다. 이들은 식의 구성에 사용된다. 또한, 각 변수의 조합에 의존하는 계수에 미치는 영향의 통계적 유의성을 판정한다. 한편, 시장 조사는하지 별도로 응답자의 범주를 구분하는 것이 필요하지만 대상 그룹의 일부로서. 이를 위해 테이블 Observedand 예측 주파수.

실용적인 응용 프로그램

분석의 고려 방법은 널리 상인의 작업에 사용됩니다. 1991 년 S 상 로지스틱 회귀 표시등이 개발되었다. 그는 자신의 "과열"을 가능성이 가격을 예측하는 데 사용할 수있는 사용이 간편하고 효율적인 도구입니다. 지표는 평행하게 연장되는 두 개의 라인에 의해 형성되는 채널의 형태로 그래프로 제시된다. 그들은 추세에서 동일한 거리를 제거 하였다. 복도의 폭은 기간에 전적으로 달려있다. 귀금속에 대한 통화 쌍에서 - 거의 모든 자산과 함께 작업 할 때 표시등이 사용됩니다.

고장 및 반전 : 실제로,이 장비의 사용이 개 핵심 전략을 생산했다. 후자의 경우 상인은 채널 내에서 가격 변동의 역학에 초점을 맞출 것이다. 일는지지 또는 저항 라인 속도의 선정에 접근 이동이 반대 방향으로 시작하는 가능성이다. 가격이 상한에 밀접하게 맞는 경우, 자산이 제거 될 수있다. 이 하한에있는 경우, 당신은 구입에 대해 생각해야한다. 전략 고장은 보증의 사용을 포함한다. 그들은 비교적 짧은 거리의 한계를 외부에 설치된다. 어떤 경우에는 가격이 짧은 시간 동안을 위반하는 계정에 복용, 당신은 안전 재생하고 정지 손실을 설정해야합니다. 동시에, 물론 관계없이 선택한 전략의 시장에서 생겨났다 상황을 냉정 극대화 인식하고 평가하는 상인을 필요로한다.

결론

따라서, 로지스틱 회귀를 사용하면 쉽고 빠르게 지정된 매개 변수에 따라 범주로 응답자를 분류 할 수 있습니다. 특정 방법의 사용 가능성을 분석 할 때. 특히, 다른 다항 회귀의 다양성. 그러나 전문가들은 복잡한 위에서 설명 된 모든 방법의 사용을 권장합니다. 이것은이 경우 모델의 품질이 상당히 높은 것 때문이다. 이는 다시, 그 적용의 범위를 확장합니다.

형성, 과학

로지스틱 회귀 : 모델과 방법

개요

뉘앙스

유형

예

비교 특성

SPSS에서 로지스틱 회귀

서수 분류

옵션의 분석

로지스틱 회귀

범주 형 변수 정의

새로운 변수를 저장

로지스틱 회귀 적정성의 품질 관리

테이블

실용적인 응용 프로그램

결론

Similar articles

형성

형성

형성

형성

형성

형성

Trending Now

음식 및 음료

마음이 편함

형성

형성

건강

예술 및 엔터테인먼트

Newest

마음이 편함

마음이 편함

기술의

가정 및 가족

예술 및 엔터테인먼트

예술 및 엔터테인먼트