1. ડેટા માસ્કિંગની વિભાવના
ડેટા માસ્કિંગને ડેટા માસ્કિંગ તરીકે પણ ઓળખવામાં આવે છે. જ્યારે અમે માસ્કિંગ નિયમો અને નીતિઓ આપી છે ત્યારે મોબાઇલ ફોન નંબર, બેંક કાર્ડ નંબર અને અન્ય માહિતી જેવા સંવેદનશીલ ડેટાને કન્વર્ટ, સંશોધિત કરવા અથવા આવરી લેવાની તકનીકી પદ્ધતિ છે. આ તકનીકનો ઉપયોગ મુખ્યત્વે સંવેદનશીલ ડેટાને અવિશ્વસનીય વાતાવરણમાં સીધો ઉપયોગ કરતા અટકાવવા માટે થાય છે.
ડેટા માસ્કિંગ સિદ્ધાંત: ડેટા માસ્કિંગે મૂળ ડેટા લાક્ષણિકતાઓ, વ્યવસાયના નિયમો અને ડેટાની સુસંગતતા જાળવવી જોઈએ તેની ખાતરી કરવા માટે કે અનુગામી વિકાસ, પરીક્ષણ અને ડેટા વિશ્લેષણને માસ્કિંગ દ્વારા અસર થશે નહીં. માસ્કિંગ પહેલાં અને પછી ડેટા સુસંગતતા અને માન્યતાની ખાતરી કરો.
2. ડેટા માસ્કિંગ વર્ગીકરણ
ડેટા માસ્કિંગને સ્થિર ડેટા માસ્કિંગ (એસડીએમ) અને ગતિશીલ ડેટા માસ્કિંગ (ડીડીએમ) માં વહેંચી શકાય છે.
સ્થિર ડેટા માસ્કિંગ (એસડીએમ): સ્થિર ડેટા માસ્કિંગ માટે ઉત્પાદન પર્યાવરણથી અલગતા માટે નવા બિન-ઉત્પાદન પર્યાવરણ ડેટાબેઝની સ્થાપનાની જરૂર છે. સંવેદનશીલ ડેટા ઉત્પાદન ડેટાબેસમાંથી કા racted વામાં આવે છે અને પછી બિન-ઉત્પાદન ડેટાબેસમાં સંગ્રહિત થાય છે. આ રીતે, ડિસેન્સિટાઇઝ્ડ ડેટા ઉત્પાદન વાતાવરણથી અલગ છે, જે વ્યવસાયની જરૂરિયાતોને પૂર્ણ કરે છે અને ઉત્પાદન ડેટાની સુરક્ષાની ખાતરી આપે છે.
ગતિશીલ ડેટા માસ્કિંગ (ડીડીએમ): તેનો ઉપયોગ સામાન્ય રીતે વાસ્તવિક સમયમાં સંવેદનશીલ ડેટાને ડિસેન્સિટાઇઝ કરવા માટે ઉત્પાદન વાતાવરણમાં થાય છે. કેટલીકવાર, વિવિધ પરિસ્થિતિઓમાં સમાન સંવેદનશીલ ડેટા વાંચવા માટે માસ્કના વિવિધ સ્તરો જરૂરી છે. ઉદાહરણ તરીકે, વિવિધ ભૂમિકાઓ અને પરવાનગી વિવિધ માસ્કિંગ યોજનાઓ લાગુ કરી શકે છે.
ડેટા રિપોર્ટિંગ અને ડેટા પ્રોડક્ટ્સ માસ્કિંગ એપ્લિકેશન
આવા દૃશ્યોમાં મુખ્યત્વે આંતરિક ડેટા મોનિટરિંગ ઉત્પાદનો અથવા બિલબોર્ડ, બાહ્ય સેવા ડેટા પ્રોડક્ટ્સ અને ડેટા વિશ્લેષણના આધારે અહેવાલો, જેમ કે વ્યવસાય અહેવાલો અને પ્રોજેક્ટ સમીક્ષા શામેલ છે.
3. ડેટા માસ્કિંગ સોલ્યુશન
સામાન્ય ડેટા માસ્કિંગ યોજનાઓમાં શામેલ છે: અમાન્યતા, રેન્ડમ મૂલ્ય, ડેટા રિપ્લેસમેન્ટ, સપ્રમાણ એન્ક્રિપ્શન, સરેરાશ મૂલ્ય, set ફસેટ અને રાઉન્ડિંગ, વગેરે.
અશિષ્ટ: અમાન્યતા એ એન્ક્રિપ્શન, કાપવા અથવા સંવેદનશીલ ડેટાને છુપાવીને સંદર્ભિત કરે છે. આ યોજના સામાન્ય રીતે વાસ્તવિક ડેટાને વિશેષ પ્રતીકો (જેમ કે *) સાથે બદલી નાખે છે. ઓપરેશન સરળ છે, પરંતુ વપરાશકર્તાઓ મૂળ ડેટાના ફોર્મેટને જાણી શકતા નથી, જે અનુગામી ડેટા એપ્લિકેશનોને અસર કરી શકે છે.
યાર્દચાર: રેન્ડમ મૂલ્ય સંવેદનશીલ ડેટાના રેન્ડમ રિપ્લેસમેન્ટનો સંદર્ભ આપે છે (નંબરો અંકોને બદલી નાખે છે, અક્ષરો અક્ષરોને બદલી નાખે છે અને અક્ષરો અક્ષરોને બદલી દે છે). આ માસ્કિંગ પદ્ધતિ ચોક્કસ હદ સુધી સંવેદનશીલ ડેટાના ફોર્મેટને સુનિશ્ચિત કરશે અને અનુગામી ડેટા એપ્લિકેશનને સરળ બનાવશે. કેટલાક અર્થપૂર્ણ શબ્દો માટે માસ્કિંગ શબ્દકોશોની જરૂર પડી શકે છે, જેમ કે લોકો અને સ્થાનોના નામ.
માહિતી ફેરબદલ: ડેટા રિપ્લેસમેન્ટ એ નલ અને રેન્ડમ મૂલ્યોના માસ્કિંગ જેવું જ છે, સિવાય કે વિશેષ અક્ષરો અથવા રેન્ડમ મૂલ્યોનો ઉપયોગ કરવાને બદલે, માસ્કિંગ ડેટાને ચોક્કસ મૂલ્ય સાથે બદલવામાં આવે છે.
સપ્રમાણ એન્ક્રિપ્શન: સપ્રમાણ એન્ક્રિપ્શન એ એક ખાસ ઉલટાવી શકાય તેવું માસ્કિંગ પદ્ધતિ છે. તે એન્ક્રિપ્શન કીઓ અને એલ્ગોરિધમ્સ દ્વારા સંવેદનશીલ ડેટાને એન્ક્રિપ્ટ કરે છે. સિફરટેક્સ્ટ ફોર્મેટ લોજિકલ નિયમોમાં મૂળ ડેટા સાથે સુસંગત છે.
સરેરાશ: સરેરાશ યોજનાનો ઉપયોગ ઘણીવાર આંકડાકીય દૃશ્યોમાં થાય છે. સંખ્યાત્મક ડેટા માટે, આપણે પહેલા તેમના સરેરાશની ગણતરી કરીએ છીએ, અને પછી સરેરાશની આસપાસ ડિસેન્સિટાઇઝ્ડ મૂલ્યોનું રેન્ડમ વિતરિત કરીએ છીએ, આમ ડેટાનો સરવાળો સતત રાખીએ છીએ.
સરભર અને ગોળાકાર: આ પદ્ધતિ રેન્ડમ શિફ્ટ દ્વારા ડિજિટલ ડેટાને બદલી નાખે છે. Set ફસેટ રાઉન્ડિંગ ડેટાની સુરક્ષા જાળવી રાખતી વખતે રેન્જની આશરે પ્રામાણિકતાની ખાતરી આપે છે, જે અગાઉની યોજનાઓ કરતા વાસ્તવિક ડેટાની નજીક છે, અને મોટા ડેટા વિશ્લેષણના દૃશ્યમાં તેનું ખૂબ મહત્વ છે.
ભલામણ મોડેલ "એમએલ-એનપીબી -56060૦"ડેટા માસ્કિંગ માટે
4. સામાન્ય રીતે ઉપયોગમાં લેવામાં આવતી ડેટા માસ્કિંગ તકનીકો
(1). આંકડાકીય તકનીકો
ડેટા નમૂના અને ડેટા એકત્રીકરણ
- ડેટા સેમ્પલિંગ: ડેટા સેટના પ્રતિનિધિ સબસેટને પસંદ કરીને સેટ કરેલા મૂળ ડેટાના વિશ્લેષણ અને મૂલ્યાંકન, ડી-આઇડેન્ટિફિકેશન તકનીકોની અસરકારકતામાં સુધારો કરવા માટે એક મહત્વપૂર્ણ પદ્ધતિ છે.
- ડેટા એકત્રીકરણ: આંકડાકીય તકનીકોના સંગ્રહ તરીકે (જેમ કે સારાંશ, ગણતરી, સરેરાશ, મહત્તમ અને લઘુત્તમ) માઇક્રોડેટામાં લક્ષણો પર લાગુ, પરિણામ મૂળ ડેટા સેટમાંના તમામ રેકોર્ડ્સનું પ્રતિનિધિ છે.
(2). ગુપ્તચરલ
ડિસેન્સિટાઇઝેશનની અસરકારકતાને ડિસેન્સિટાઇઝ કરવા અથવા વધારવા માટે ક્રિપ્ટોગ્રાફી એ એક સામાન્ય પદ્ધતિ છે. વિવિધ પ્રકારના એન્ક્રિપ્શન એલ્ગોરિધમ્સ વિવિધ ડિસેન્સિટાઇઝેશન અસરો પ્રાપ્ત કરી શકે છે.
- નિરોધક એન્ક્રિપ્શન: નોન-રેન્ડમ સપ્રમાણ એન્ક્રિપ્શન. તે સામાન્ય રીતે ID ડેટા પર પ્રક્રિયા કરે છે અને જ્યારે જરૂરી હોય ત્યારે સાઇફરટેક્સ્ટને મૂળ ID પર ડિક્રિપ્ટ કરી શકે છે અને પુન restore સ્થાપિત કરી શકે છે, પરંતુ કીને યોગ્ય રીતે સુરક્ષિત કરવાની જરૂર છે.
- ઉલટાવી શકાય તેવું એન્ક્રિપ્શન: હેશ ફંક્શનનો ઉપયોગ ડેટા પર પ્રક્રિયા કરવા માટે થાય છે, જે સામાન્ય રીતે ID ડેટા માટે વપરાય છે. તેને સીધો ડિક્રિપ્ટ કરી શકાતો નથી અને મેપિંગ સંબંધ સાચવો આવશ્યક છે. આ ઉપરાંત, હેશ ફંક્શનની સુવિધાને કારણે, ડેટા ટક્કર થઈ શકે છે.
- હોમોમોર્ફિક એન્ક્રિપ્શન: સિફરટેક્સ્ટ હોમોમોર્ફિક એલ્ગોરિધમનો ઉપયોગ થાય છે. તેની લાક્ષણિકતા એ છે કે સિફરટેક્સ્ટ operation પરેશનનું પરિણામ ડિક્રિપ્શન પછી પ્લેન ટેક્સ્ટ operation પરેશન જેવું જ છે. તેથી, તેનો ઉપયોગ સામાન્ય રીતે આંકડાકીય ક્ષેત્રોની પ્રક્રિયા કરવા માટે થાય છે, પરંતુ તે પ્રભાવના કારણોસર વ્યાપકપણે ઉપયોગમાં લેવાતું નથી.
()). પદ્ધતિસર પ્રૌદ્યોગિકી
દમન તકનીક ડેટા આઇટમ્સને કા tes ી નાખે છે અથવા sh ાલ કરે છે જે ગોપનીયતા સંરક્ષણને પૂર્ણ કરતી નથી, પરંતુ તે પ્રકાશિત કરતી નથી.
- માસ્કિંગ: તે એટ્રિબ્યુટ મૂલ્યને માસ્ક કરવા માટે સૌથી સામાન્ય ડિસેન્સિટાઇઝેશન પદ્ધતિનો સંદર્ભ આપે છે, જેમ કે વિરોધી નંબર, આઈડી કાર્ડ ફૂદડી સાથે ચિહ્નિત થયેલ છે, અથવા સરનામું કાપવામાં આવે છે.
- સ્થાનિક દમન: વિશિષ્ટ લક્ષણ મૂલ્યો (ક umns લમ) કા ting ી નાખવાની પ્રક્રિયાને સંદર્ભિત કરે છે, બિન-આવશ્યક ડેટા ફીલ્ડ્સને દૂર કરે છે;
- રેકોર્ડ દમન: બિન-આવશ્યક ડેટા રેકોર્ડ્સને કા ting ી નાખવા, વિશિષ્ટ રેકોર્ડ્સ (પંક્તિઓ) કા ting ી નાખવાની પ્રક્રિયાને સંદર્ભિત કરે છે.
(4). ઉપ -ઉપનામ ટેકનોલોજી
સ્યુડોમાનિંગ એ ડી-આઇડેન્ટિફિકેશન તકનીક છે જે સીધા ઓળખકર્તા (અથવા અન્ય સંવેદનશીલ ઓળખકર્તા) ને બદલવા માટે ઉપનામનો ઉપયોગ કરે છે. ઉપનામ તકનીકો સીધા અથવા સંવેદનશીલ ઓળખકર્તાઓને બદલે, દરેક વ્યક્તિગત માહિતી વિષય માટે અનન્ય ઓળખકર્તાઓ બનાવે છે.
- તે મૂળ ID ને અનુરૂપ, મેપિંગ ટેબલને સાચવવા અને મેપિંગ કોષ્ટકની control ક્સેસને સખત રીતે નિયંત્રિત કરવા માટે સ્વતંત્ર રીતે રેન્ડમ મૂલ્યો ઉત્પન્ન કરી શકે છે.
- તમે ઉપનામ ઉત્પન્ન કરવા માટે એન્ક્રિપ્શનનો ઉપયોગ પણ કરી શકો છો, પરંતુ ડિક્રિપ્શન કીને યોગ્ય રીતે રાખવાની જરૂર છે;
આ તકનીકીનો ઉપયોગ મોટી સંખ્યામાં સ્વતંત્ર ડેટા વપરાશકર્તાઓના કિસ્સામાં થાય છે, જેમ કે ઓપન પ્લેટફોર્મ દૃશ્યમાં ઓપનઆઈડી, જ્યાં વિવિધ વિકાસકર્તાઓ સમાન વપરાશકર્તા માટે વિવિધ ઓપનઆઈડી મેળવે છે.
(5). સામાન્યીકરણ તકનીકો
સામાન્યીકરણ તકનીક એ ડી-આઇડેન્ટિફિકેશન તકનીકનો સંદર્ભ આપે છે જે ડેટા સેટમાં પસંદ કરેલા લક્ષણોની દાણાદારતાને ઘટાડે છે અને ડેટાનું વધુ સામાન્ય અને અમૂર્ત વર્ણન પ્રદાન કરે છે. સામાન્યીકરણ તકનીકનો અમલ કરવો સરળ છે અને રેકોર્ડ-સ્તરના ડેટાની પ્રામાણિકતાને સુરક્ષિત કરી શકે છે. તેનો ઉપયોગ સામાન્ય રીતે ડેટા પ્રોડક્ટ્સ અથવા ડેટા રિપોર્ટ્સમાં થાય છે.
- રાઉન્ડિંગ: પસંદ કરેલા લક્ષણ માટે રાઉન્ડિંગ બેઝ પસંદ કરવાનો સમાવેશ થાય છે, જેમ કે ઉપરની તરફ અથવા નીચેની ફોરેન્સિક્સ, પરિણામ 100, 500, 1 કે અને 10 કે
- ટોચ અને નીચે કોડિંગ તકનીકો: ઉપર (અથવા નીચે) થ્રેશોલ્ડને ટોચ (અથવા તળિયે) સ્તરને રજૂ કરતા થ્રેશોલ્ડ સાથે બદલો, "ઉપર x" અથવા "x ની નીચે" નું પરિણામ આપે છે.
(6). યોજણી તકનીકો
એક પ્રકારની ડી-આઇડેન્ટિફિકેશન તકનીક તરીકે, રેન્ડમાઇઝેશન ટેકનોલોજી રેન્ડમાઇઝેશન દ્વારા લક્ષણના મૂલ્યમાં ફેરફાર કરવાનો સંદર્ભ આપે છે, જેથી રેન્ડમાઇઝેશન પછીનું મૂલ્ય મૂળ વાસ્તવિક મૂલ્યથી અલગ હોય. આ પ્રક્રિયા એ જ ડેટા રેકોર્ડમાં અન્ય લક્ષણ મૂલ્યોમાંથી એટ્રિબ્યુટ મૂલ્ય મેળવવાની હુમલાખોરની ક્ષમતાને ઘટાડે છે, પરંતુ પરિણામી ડેટાની પ્રામાણિકતાને અસર કરે છે, જે ઉત્પાદન પરીક્ષણ ડેટામાં સામાન્ય છે.
પોસ્ટ સમય: સપ્ટે -27-2022