• 21 May 2020

    ટેકનોલોજીના પ્રવાહો : ૧૧

    Teqnologyna pravaho : 11

    0 141

    જે પણ ક્ષેત્ર માટે વિશાળ માત્રામાં અવિરત ડેટા મળી રહે છે ત્યાં ડેટા માઇનીંગની વિવિધ રીતોનો ઉપયોગ કરીને સચોટ નિર્ણયો લઈ શકાય છે. આ માટેનાં કેટલાંક ઉદાહરણો લઈએ.
    મોબાઈલ - ટેલિકૉમ કંપનીઓ : ગ્રાહકો એક કંપનીનું જોડાણ છોડીને બીજી કંપનીની સેવાઓનો ઉપયોગ શરૂ કરી દે તે કોઈ કંપનીને પાલવે નહીં. TRAI દ્વારા ગ્રાહકોની તરફેણમાં મોબાઈલ નંબર પોર્ટેબિલિટીની સેવા ઉપલબ્ધ છે. તેની મદદથી જે પણ ગ્રાહકને પોતાને મોબાઈલ ફોનની સેવા આપનાર કંપનીના કામથી અસંતોષ રહેતો હોય તે પોતાનો નંબર બદલ્યા વિના પોતાનું જોડાણ બદલીને બીજી કંપનીનું જોડાણ મેળવી શકે છે. આવી સ્થિતિમાં મોબાઈલ ફોનની સેવા આપનાર કંપનીઓ માટે એ જાણવું અનિવાર્ય છે કે કયા કયા ગ્રાહકો તેનું જોડાણ બદલવાનું વિચારી રહ્યા છે. તે માટે મોબાઈલ ફોન કંપની જે ગ્રાહક વારંવાર કંપનીની વેબ સાઈટ દ્વારા કે ફોન દ્વારા ફરિયાદો જણાવતો હોય, જોડાણ બદલવા અંગેના વેબ પેજ વાંચતો હોય, પોતાના જોડાણમાં પસંદ કરવામાં આવેલી સેવાઓમાં ફેરફાર કરતો હોય (જેમ કે દિવસના એસએમએસ કે વેબ સર્ફિંગ માટે જીબી ડેટા ઘટાડતો હોય), ચોક્કસ સમયગાળા દરમ્યાન ગ્રાહકોની સુરક્ષા અંગેનું લખાણ વારંવાર વાંચતો તો તેવા ગ્રાહકોની જોડાણ બદલવાની શક્યતા વધારે છે તેવું અનુમાન કરી તેની જોડાણ બદલવાની માનસિક સ્થિતિમાંથી પાછો વાળવા માટે વિવિધ આકર્ષક ઑફરો મોકલી આપતી હોય છે.
    દરેક મોબાઈલ કંપની તેના પ્રત્યેક ગ્રાહકનો માસ્ટર રેકોર્ડ રાખતી હોય છે, જેમાં અનેક ચલ હોય છે, જેમ કે તેની ઉંમર, તેની વાર્ષિક કે માસિક આવક અંગેનું પૂર્વમાન, તેનું લિંગ (સ્ત્રી, પુરુષ કે અન્ય), તે બિલની રકમ સમયસર ચૂકવે છે કે નહીં, તેણે કરેલી ફરિયાદો નિયત સમયમાં ઉકેલવામાં આવેલી છે કે નહીં, તેની વિવિધ પસંદગીઓ વગેરે. ગ્રાહકની ઉપર દર્શાવેલી વિવિધ પ્રકારની વર્તણૂક તેમ જ તેણે કરેલા વ્યવહારોના વિવિધ ડેટા બેઝથી ડેટા મેળવીને ડેટા માઇનીંગનો સતત ઉપયોગ કરતા રહીને ગ્રાહકના માસ્ટર રેકોર્ડના અલગ અલગ ચલની કિંમત બદલવામાં આવતી હોય છે. આના આધારે કંપનીને ગ્રાહકના ભવિષ્યના વર્તન કે તેની પસંદગી અંગેના અનુમાન તૈયાર કરવામાં મદદ મળે છે.
    ઑનલાઈન શૉપિંગ : ફ્લિપકાર્ટ, મિન્ટ્રા, એમેઝોન, સ્નેપડિલ વગેરે ઇકોર્મસ કંપનીઓ તેમની વેબ સાઈટની મુલાકાત લેતા ગ્રાહકો સતત વધુ ને વધુ ખરીદી કરતા રહે તે માટે સક્રિય હોય છે. ગ્રાહક કોઈ એક વસ્તુ જેવી કે ચોક્કસ કંપનીનું જીન્સ અથવા પુસ્તક અંગેની વિગતો જોઈ રહ્યો હોય ત્યારે સ્ક્રીનના જમણી બાજુ કે નીચેના ભાગમાં ‘જેમણે આ વસ્તુ ખરીદી છે તેમને નીચે મુજબની વસ્તુઓમાં પણ રસ પડ્યો છે’ તેવા સંદેશા સાથે વિવિધ વસ્તુ અંગેની ભલામણો દર્શાવાતી હોય છે. ગ્રાહકોએ ચોક્કસ સમયગાળા દરમ્યાન વિવિધ વસ્તુઓની કરેલી ખરીદી, દરેકનું મૂલ્ય, તેણે કરેલી ચૂકવણીનો પ્રકાર, ખરીદી કર્યા પછી પરત કરેલી વસ્તુઓ, તેણે છેલ્લે ક્યારે ખરીદી કરી હતી, અમુક પ્રકારની જ વસ્તુઓ ખરીદે છે કે વિવિધ પ્રકારની વસ્તુઓ ખરીદે છે, તેને જણાવેલી ભલામણો મુજબ ખરીદી કરે છે કે નહીં, ગ્રાહકને ઇમેઇલ અથવા સંદેશાઓ દ્વારા જે વસ્તુઓ અંગે માહિતી મોકલવામાં આવે છે તે અંગે તેની તપાસ કે ખરીદી હોય છે કે નહીં, તે એક જ વખતે મોટી રકમની ખરીદી પછી લાંબા સમય સુધી ખરીદી કરે છે કે નહીં, તે નાની નાની રકમની વારંવાર ખરીદી કરે છે કે કેમ તે અંગેના વિવિધ પ્રકારના વધુ ને વધુ ડેટા એકત્ર કરવામાં આવતા હોય છે. આવા ડેટા પર માઇનીંગ કરીને ઇકોમર્સ કંપનીઓ પોતાના ગ્રાહકોની તેમના પ્રત્યેની નિષ્ઠા કેટલી છે તે પણ જાણી શકતી હોય છે.
    ડેટા માઇનીંગની પ્રક્રિયા કેવી રીતે અમલમાં મૂકવામાં આવશે તે માટે સરળ ઉદાહરણ લઈએ.
    આપણા ઇમેઇલ એકાઉન્ટમાં આવતા ઇમેઇલ પૈકી કયા ઇમેઇલ સામાન્ય તથા રોજબરોજના ઉપયોગ માટેના છે તથા કયા ઇમેઇલ છેતરામણા અથવા તો જાહેરાત માટેના છે તે જાણવું છે.
    પુસ્તકોનું વેચાણ કરતી ઑનલાઇન વેબ સાઇટને તેના ગ્રાહકો દ્વારા લખવામાં આવતા પુસ્તકના અવલોકન તથા સમીક્ષાના આધારે નક્કી કરવું છે કે જે તે પુસ્તકનો પ્રકાર કયો છે, દા. ત. નવલકથા, વાર્તાસંગ્રહ, પ્રવાસવર્ણન વગેરે. નવલકથાની સાથેસાથે તે પણ શોધવું છે કે સ્ત્રી-પુરુષના પ્રેમની છે કે સામાજિક છે કે ઐતિહાસિક નવલકથા છે.
    છેતરામણા કે જાહેરાતો ધરાવતા ઇમેઇલને ઉપયોગી ઇમેઇલથી દૂર કરવા માટે જે તે વ્યક્તિ કે કંપનીના ભૂતકાળના ઇમેઇલનો ડેટા સેટ મેળવવો પડે. ભૂતકાળમાં આવેલા ઇમેઇલ વિશે વ્યક્તિને ખબર હોય છે કે જે તે ઇમેઇલ બરાબર હતો કે છેતરામણો. બીજા શબ્દોમાં કહીએ તો ભૂતકાળના તમામ ઇમેઇલને લેબલ આપી શકાય કે જે તે ઇમેઇલ બરાબર હતો કે છેતરામણો. હવે આપણે એવી પદ્ધતિ તૈયાર કરવી છે, જેની મદદથી નવા આવનારા તમામ ઇમેઇલ માટે કૉમ્પ્યુટર જ આપણને જણાવી દે કે ઇમેઇલ બરાબર છે કે છેતરામણો અથવા તો જાહેરાત માટેનો.
    આપણી પાસે આવેલા ભૂતકાળના તમામ ઇમેઇલના ડેટા સેટને બે ભાગમાં વહેંચવો પડશે - તાલીમ માટેનો ડેટા તથા ચકાસણી માટેનો ડેટા. સામાન્ય રીતે 70% જેટલો ડેટા તાલીમ માટે ઉપયોગમાં લેવાય છે અને બાકીનો ત્રીસ ટકા જેટલો ડેટા ચકાસણી માટે ઉપયોગમાં લેવાય છે. ડેટા માઇનીંગની કોઈ એક ચોક્કસ રીત જેમ કે અહીં વર્ગીકરણ (Classification) રીત અને તે માટે તૈયાર કરવામાં આવેલા આલ્ગોરીધમનો ઉપયોગ કરવામાં આવશે. મૂળ ડેટા સેટને તાલીમ તથા ચકાસણી માટે અલગ કરતી વખતે ખાસ ધ્યાનમાં રાખવામાં આવે છે કે વિભાજન કોઈ પણ જાતના માનવીય પૂર્વગ્રહ વગરનું હોય. તાલીમ માટે તૈયાર કરેલા ડેટા સેટ પર વર્ગીકરણની રીત કે આલ્ગોરિધમને અમલમાં મૂકવામાં આવશે અને દરેક ઇમેઇલના લખાણમાંથી એવા શબ્દો, નમૂનાઓ, ઢબ કે પેટર્ન શોધવામાં આવશે જે જાહેરાત કે છેતરામણી વિગતો સાથે સંબંધ ધરાવતા હોય, જેમ કે “Click to win”, “Congratulation ! You won Rs. 10000”, “Your reward is waiting” વગેરે.
    તાલીમ માટેના ડેટા પરથી પોતાની મેળે શીખી રહેલી રીત અથવા આલ્ગોરિધમને હવે ચકાસણી માટેના ડેટા પર અમલમાં મૂકવામાં આવશે અને શોધવામાં આવશે કે વર્ગીકરણની રીતનો ઉપયોગ કરી રહેલું કૉમ્પ્યુટર કયા ઇમેઇલને સામાન્ય ઉપયોગના અને કયા ઇમેઇલને છેતરામણા ઇમેઇલ તરીકે અલગ તારવી શકે અથવા તો તેનું વર્ગીકરણ કરી શકે છે. કૉમ્પ્યુટર દ્વારા અલગ તારવવામાં આવેલા ઇમેઇલને અગાઉ વ્યક્તિએ પોતે જાતે તારવેલા ઇમેઇલ સાથે ચકાસીને તે આલ્ગોરિધમની કાર્યક્ષમતા કેટલી છે તે શોધી કાઢવામાં આવે છે. સંશોધન કરીને આલ્ગોરિધમમાં સતત સુધારા કરીને કાર્યક્ષમતાને સો ટકાની નજીક લઈ જવામાં આવે છે અને તેવા આલ્ગોરિધમને વ્યવહારમાં અમલમાં મૂકવામાં આવે છે.
    *****



    સંજય ચૌધરી


Your Rating
blank-star-rating
Sorry ! No Reviews found!