റിഗ്രഷൻ വേരിയബിളുകളുടെ തമ്മിലുള്ള ബന്ധങ്ങളെ വിശകലനം ചെയ്യുന്നു
ഒരു പ്രത്യേക ഡാറ്റാഗൺ നൽകുന്ന, സംഖ്യകളുടെ ഒരു പരിധി മുൻകൂട്ടി പ്രവചിക്കാനുപയോഗിക്കുന്ന ഡാറ്റ മൈനിങ് ടെക്നിക്കാണ് റിഗ്രഷൻ. ഉദാഹരണത്തിന്, മറ്റൊരു വേരിയബിളുകൾ നൽകിയിരിക്കുന്ന ഒരു ഉൽപ്പന്നത്തിന്റെ അല്ലെങ്കിൽ സേവനത്തിന്റെ ചിലവ് പ്രവചിക്കാൻ റിഗ്രഷൻ ഉപയോഗിക്കാനിടയുണ്ട്.
ബിസിനസ്, മാർക്കറ്റിംഗ് പ്ലാനിംഗ്, സാമ്പത്തിക പ്രവചനം, പാരിസ്ഥിതിക മോഡലിങ്, ട്രെൻഡിനെക്കുറിച്ചുള്ള വിശകലനം എന്നിവക്കായി ഒന്നിലധികം വ്യവസായങ്ങളിൽ അടിച്ചമർത്തലാണ് ഉപയോഗിക്കുന്നത്.
റിഗ്രഷൻ Vs. തരംതിരിവ്
അത്തരം പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ ഉപയോഗിച്ചിരുന്ന ഡാറ്റാ ഖനനതന്ത്രങ്ങളാണ് പിൻവലിക്കലും വർഗ്ഗീകരണവും , എന്നാൽ അവ പലപ്പോഴും ആശയക്കുഴപ്പത്തിലാകുന്നു. രണ്ട് പ്രവചന വിശകലനങ്ങളിലും ഉപയോഗിക്കുന്നു, എന്നാൽ വർഗീകരണം വേർതിരിച്ചുള്ള വിഭാഗങ്ങളായി വേർതിരിക്കപ്പെടുമ്പോൾ റിഗ്രഷൻ ഒരു സംഖ്യാ അല്ലെങ്കിൽ തുടർച്ചയായ മൂല്യം പ്രവചിക്കാൻ ഉപയോഗിക്കുന്നു.
ഉദാഹരണത്തിന്, റീഗറഷൻ അതിന്റെ സ്ഥലത്തെ അടിസ്ഥാനമാക്കിയുള്ള ഒരു വീടിന്റെ മൂല്യത്തെ പ്രവചിക്കാൻ ഉപയോഗിക്കും, ചതുരശ്ര അടി, അവസാനം വിൽക്കുമ്പോഴുള്ള വിലയും, സമാന വീടുകളുടെ വിലയും മറ്റ് ഘടകങ്ങളും. പകരം വീടുകൾ ക്രമപ്പെടുത്തൽ, ലോഡ് സൈസ് അല്ലെങ്കിൽ ക്രൈം റേറ്റ് എന്നിവപോലുള്ള വിഭാഗങ്ങളായി ക്രമീകരിക്കാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ, വർഗ്ഗീകരണം ക്രമീകരിക്കും.
റിഗ്രഷൻ ടെക്നിക്സിന്റെ തരം
ഏറ്റവും ലളിതവും പഴയതുമായ റിഗ്രഷനാണ് രണ്ട് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം കണക്കുകൂട്ടാൻ ഉപയോഗിക്കുന്ന രേഖീയ റിഗ്രഷൻ. ഈ രീതി ഒരു നേർരേഖയുടെ ഗണിത സൂത്രവാക്കായ (y = mx + b) ഉപയോഗിക്കുന്നു. ലളിതമായി പറഞ്ഞാൽ, Y, X-axis എന്നിവ ഉപയോഗിച്ച് ഒരു ഗ്രാഫ് കൊടുത്താൽ അതിനർത്ഥം X, Y എന്നിവ തമ്മിലുള്ള ബന്ധം ഒരു അപരിചിതർക്കുള്ള നേർരേഖയാണ്. ഉദാഹരണത്തിന്, ജനസംഖ്യാ വർദ്ധനവ് കണക്കിലെടുത്താൽ, ഭക്ഷ്യ ഉൽപ്പാദനം അതേ തോതിലായിരിക്കും വർദ്ധിപ്പിക്കുന്നത് - ഇത് രണ്ട് സംഖ്യകൾക്കിടയിൽ ശക്തമായ, രേഖീയ ബന്ധം ആവശ്യമാണ്. ഇത് ദൃശ്യമാക്കുന്നതിന്, വൈ-ആക്സിസ് ട്രാക്ക് ജനസംഖ്യ വർദ്ധിക്കുന്ന ഒരു ഗ്രാഫ് പരിഗണിക്കുക, എക്സ്-ആക്സിസ് ഭക്ഷണരീതിയെ ട്രാക്ക് ചെയ്യുന്നു. Y മൂല്യത്തിന്റെ വർദ്ധനവ് പോലെ, X മൂല്യം അതേ നിരക്ക് വർദ്ധിപ്പിക്കും, അവ തമ്മിലുള്ള ബന്ധം ഒരു നേർവരയാണ്.
മൾട്ടിപ്പിൾ റീഗസൻസി പോലുള്ള വിപുലമായ വിദ്യകൾ, ഒന്നിലധികം വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം പ്രവചിക്കുന്നു - ഉദാഹരണത്തിന്, വരുമാനം, വിദ്യാഭ്യാസം, ജീവിക്കാൻ തിരഞ്ഞെടുക്കുന്ന സ്ഥലം എന്നിവയ്ക്കിടയിൽ ഒരു പൊരുത്തപ്പെടൽ ഉണ്ടോ? കൂടുതൽ വേരിയബിളുകൾ കൂടുതലായി പ്രവചിക്കുന്ന സങ്കീർണത വർദ്ധിപ്പിക്കുന്നു. വിവിധ തരത്തിലുള്ള മൾട്ടി റിഗ്രഷൻ ടെക്നിക്കുകൾക്ക് സ്റ്റാൻഡേർഡ്, ഹൈറാർക്കിക്കൽ, സെറ്റ്വൈസ്, സ്റ്റെഡി വൈസ് എന്നിങ്ങനെ ഓരോ ആപ്ലിക്കേഷനുകളും ഉണ്ട്.
ഈ ഘട്ടത്തിൽ, നാം പ്രവചിക്കാൻ ശ്രമിക്കുന്ന (ആശ്രയത്വമുള്ള അല്ലെങ്കിൽ പ്രവചിക്കപ്പെട്ട വേരിയബിൾ), പ്രവചന (സ്വതന്ത്ര അല്ലെങ്കിൽ മുൻകൂട്ടി ഘടകം വേരിയബിളുകൾ) ഉണ്ടാക്കാൻ ഞങ്ങൾ ഉപയോഗിക്കുന്ന ഡാറ്റ മനസിലാക്കേണ്ടത് പ്രധാനമാണ്. നമ്മുടെ ഉദാഹരണത്തിൽ, ഒരാൾ ജീവിക്കാൻ തിരഞ്ഞെടുക്കുന്ന സ്ഥലം ( പ്രവചിക്കപ്പെട്ട ചരക്ക്) നൽകിയ വരുമാനവും വിദ്യാഭ്യാസവും (ഇരുവരും മുൻകൂട്ടിപ്പറഞ്ഞ വേരിയബിളുകൾ) പ്രവചിക്കാൻ ആഗ്രഹിക്കുന്നു .
- സ്റ്റാൻഡേർഡ് മൾട്ടിപ്പിൾ റിഗ്രഷൻ, എല്ലാ പ്രഡിക്തർ വേരിയബിളുകളും ഒരേ സമയം പരിഗണിക്കുന്നു. ഉദാഹരണത്തിന് 1) വരുമാനവും വിദ്യാഭ്യാസവും (മുൻകൂട്ടിപറയുന്നവർ) തമ്മിലുള്ള ബന്ധം (അയ്യായിരം). 2) വ്യക്തിഗത മുൻകരുതലുകൾ ഓരോന്നും ഏതു ബന്ധത്തിലാണ് സംഭാവന ചെയ്യുന്നത്?
- Stepwise ഒന്നിലധികം റിഗ്രഷൻ തികച്ചും വ്യത്യസ്തമായ ചോദ്യത്തിന് ഉത്തരം നൽകുന്നു. ഒരു stepwise റിഗ്രഷൻ ആൽഗോരിതം ഏത് മുൻഗണനക്കാർക്ക് അയൽപക്കത്തെ തിരഞ്ഞെടുക്കുന്നതിന് മുൻഗണന നൽകുമെന്ന് വിശകലനം ചെയ്യും - അതായത് സ്റ്റെഡിവൈതൽ മോഡൽ predictor വേരിയബിളിന്റെ പ്രാധാന്യം ക്രമീകരിക്കുകയും തുടർന്ന് ഒരു അനുബന്ധ ഉപസെറ്റ് തിരഞ്ഞെടുക്കുകയും ചെയ്യുന്നു. ഈ തരം റിഗ്രഷൻ പ്രശ്നം റിഗ്രഷൻ സമവാക്യം വികസിപ്പിക്കുന്നതിനായി "ഘട്ടങ്ങൾ" ഉപയോഗിക്കുന്നു. ഈ തരത്തിലുള്ള റിഗ്രഷൻ പരിഗണിച്ചാൽ, എല്ലാ മുൻകരുതലുകളേയും ഫൈനൽ റിഗ്രഷൻ സമവാക്യത്തിൽ പോലും കാണാനിടയില്ല.
- Stepwise പോലെ, ഹൈപ്പർ മാർക്കറ്റ് റിഗ്രഷൻ ഒരു തുടർച്ചയായ പ്രക്രിയയാണ്, പക്ഷേ മുൻകൂട്ടി നിർവചിച്ച ക്രമത്തിൽ മുൻകൂട്ടി നിർദേശിച്ചിട്ടുള്ള ക്രമത്തിൽ മുൻകൂട്ടി നിശ്ചയിച്ചിരിക്കുന്ന വേരിയബിളുകൾ മാതൃകയിൽ നൽകിയിരിക്കുന്നു. അതായത്, ആൽഗോരിതം ഒരു ഓർഗനൈസേഷനിൽ പ്രവചിക്കാനായി നൽകുക. റിഗ്രഷൻ സമവാക്യം സൃഷ്ടിക്കുന്ന വ്യക്തിയെ ഫീൽഡിന്റെ വിദഗ്ദ്ധപരിജ്ഞാനം ഉണ്ടാക്കുമ്പോൾ ഇത് പലപ്പോഴും ഉപയോഗപ്പെടുത്തുന്നു.
- Setwise റിഗ്രഷൻ stepwise സമാനമാണ്, എന്നാൽ വ്യക്തിഗത വേരിയബിളേക്കാൾ വേരിയബിളുകൾ സെറ്റ് വിശകലനം ചെയ്യും.