નેટવર્ક પેકેટ બ્રોકરમાં ડેટા માસ્કિંગ ટેકનોલોજી અને સોલ્યુશન શું છે?

૧. ડેટા માસ્કીંગનો ખ્યાલ

ડેટા માસ્કિંગને ડેટા માસ્કિંગ તરીકે પણ ઓળખવામાં આવે છે. જ્યારે આપણે માસ્કિંગના નિયમો અને નીતિઓ આપી હોય ત્યારે મોબાઇલ ફોન નંબર, બેંક કાર્ડ નંબર અને અન્ય માહિતી જેવા સંવેદનશીલ ડેટાને કન્વર્ટ કરવા, સુધારવા અથવા કવર કરવા માટે આ એક તકનીકી પદ્ધતિ છે. આ તકનીકનો ઉપયોગ મુખ્યત્વે અવિશ્વસનીય વાતાવરણમાં સંવેદનશીલ ડેટાનો સીધો ઉપયોગ થતો અટકાવવા માટે થાય છે.

ડેટા માસ્કિંગ સિદ્ધાંત: ડેટા માસ્કિંગમાં મૂળ ડેટા લાક્ષણિકતાઓ, વ્યવસાયિક નિયમો અને ડેટા સુસંગતતા જાળવી રાખવી જોઈએ જેથી ખાતરી કરી શકાય કે અનુગામી વિકાસ, પરીક્ષણ અને ડેટા વિશ્લેષણ માસ્કિંગથી પ્રભાવિત ન થાય. માસ્કિંગ પહેલાં અને પછી ડેટા સુસંગતતા અને માન્યતાની ખાતરી કરો.

2. ડેટા માસ્કિંગ વર્ગીકરણ

ડેટા માસ્કિંગને સ્ટેટિક ડેટા માસ્કિંગ (SDM) અને ડાયનેમિક ડેટા માસ્કિંગ (DDM) માં વિભાજિત કરી શકાય છે.

સ્ટેટિક ડેટા માસ્કિંગ (SDM): સ્ટેટિક ડેટા માસ્કિંગ માટે ઉત્પાદન પર્યાવરણથી અલગ કરવા માટે એક નવો બિન-ઉત્પાદન પર્યાવરણ ડેટાબેઝ સ્થાપિત કરવાની જરૂર પડે છે. સંવેદનશીલ ડેટા ઉત્પાદન ડેટાબેઝમાંથી કાઢવામાં આવે છે અને પછી બિન-ઉત્પાદન ડેટાબેઝમાં સંગ્રહિત કરવામાં આવે છે. આ રીતે, ડિસેન્સિટાઇઝ્ડ ડેટા ઉત્પાદન પર્યાવરણમાંથી અલગ કરવામાં આવે છે, જે વ્યવસાયિક જરૂરિયાતોને પૂર્ણ કરે છે અને ઉત્પાદન ડેટાની સુરક્ષા સુનિશ્ચિત કરે છે.

એસડીએમ

ડાયનેમિક ડેટા માસ્કિંગ (DDM): તેનો ઉપયોગ સામાન્ય રીતે ઉત્પાદન વાતાવરણમાં સંવેદનશીલ ડેટાને વાસ્તવિક સમયમાં ડિસેન્સિટાઇઝ કરવા માટે થાય છે. કેટલીકવાર, વિવિધ પરિસ્થિતિઓમાં સમાન સંવેદનશીલ ડેટા વાંચવા માટે વિવિધ સ્તરના માસ્કિંગની જરૂર પડે છે. ઉદાહરણ તરીકે, વિવિધ ભૂમિકાઓ અને પરવાનગીઓ વિવિધ માસ્કિંગ યોજનાઓ અમલમાં મૂકી શકે છે.

ડીડીએમ

ડેટા રિપોર્ટિંગ અને ડેટા પ્રોડક્ટ્સ માસ્કિંગ એપ્લિકેશન

આવા દૃશ્યોમાં મુખ્યત્વે આંતરિક ડેટા મોનિટરિંગ ઉત્પાદનો અથવા બિલબોર્ડ, બાહ્ય સેવા ડેટા ઉત્પાદનો અને ડેટા વિશ્લેષણ પર આધારિત અહેવાલો, જેમ કે વ્યવસાય અહેવાલો અને પ્રોજેક્ટ સમીક્ષાનો સમાવેશ થાય છે.

ડેટા રિપોર્ટિંગ પ્રોડક્ટ માસ્કિંગ

3. ડેટા માસ્કિંગ સોલ્યુશન

સામાન્ય ડેટા માસ્કિંગ યોજનાઓમાં શામેલ છે: અમાન્યતા, રેન્ડમ મૂલ્ય, ડેટા રિપ્લેસમેન્ટ, સપ્રમાણ એન્ક્રિપ્શન, સરેરાશ મૂલ્ય, ઓફસેટ અને રાઉન્ડિંગ, વગેરે.

અમાન્યતા: અમાન્યતા એટલે સંવેદનશીલ ડેટાનું એન્ક્રિપ્શન, કાપણી અથવા છુપાવવું. આ યોજના સામાન્ય રીતે વાસ્તવિક ડેટાને ખાસ પ્રતીકો (જેમ કે *) થી બદલે છે. આ કામગીરી સરળ છે, પરંતુ વપરાશકર્તાઓ મૂળ ડેટાનું ફોર્મેટ જાણી શકતા નથી, જે પછીના ડેટા એપ્લિકેશનોને અસર કરી શકે છે.

રેન્ડમ મૂલ્ય: રેન્ડમ મૂલ્ય સંવેદનશીલ ડેટાના રેન્ડમ રિપ્લેસમેન્ટનો સંદર્ભ આપે છે (સંખ્યાઓ અંકોને બદલે છે, અક્ષરો અક્ષરોને બદલે છે, અને અક્ષરો અક્ષરોને બદલે છે). આ માસ્કિંગ પદ્ધતિ ચોક્કસ હદ સુધી સંવેદનશીલ ડેટાના ફોર્મેટને સુનિશ્ચિત કરશે અને અનુગામી ડેટા એપ્લિકેશનને સરળ બનાવશે. કેટલાક અર્થપૂર્ણ શબ્દો, જેમ કે લોકો અને સ્થાનોના નામ માટે માસ્કિંગ શબ્દકોશોની જરૂર પડી શકે છે.

ડેટા રિપ્લેસમેન્ટ: ડેટા રિપ્લેસમેન્ટ નલ અને રેન્ડમ મૂલ્યોના માસ્કિંગ જેવું જ છે, સિવાય કે ખાસ અક્ષરો અથવા રેન્ડમ મૂલ્યોનો ઉપયોગ કરવાને બદલે, માસ્કિંગ ડેટાને ચોક્કસ મૂલ્યથી બદલવામાં આવે છે.

સપ્રમાણ એન્ક્રિપ્શન: સિમેટ્રિક એન્ક્રિપ્શન એ એક ખાસ ઉલટાવી શકાય તેવી માસ્કિંગ પદ્ધતિ છે. તે એન્ક્રિપ્શન કી અને અલ્ગોરિધમ દ્વારા સંવેદનશીલ ડેટાને એન્ક્રિપ્ટ કરે છે. સાઇફરટેક્સ્ટ ફોર્મેટ લોજિકલ નિયમોમાં મૂળ ડેટા સાથે સુસંગત છે.

સરેરાશ: આંકડાકીય પરિસ્થિતિઓમાં સરેરાશ યોજનાનો ઉપયોગ ઘણીવાર થાય છે. સંખ્યાત્મક ડેટા માટે, આપણે પહેલા તેમના સરેરાશની ગણતરી કરીએ છીએ, અને પછી સરેરાશની આસપાસ અસંવેદનશીલ મૂલ્યોનું રેન્ડમ વિતરણ કરીએ છીએ, આમ ડેટાનો સરવાળો અચળ રહે છે.

ઓફસેટ અને રાઉન્ડિંગ: આ પદ્ધતિ રેન્ડમ શિફ્ટ દ્વારા ડિજિટલ ડેટામાં ફેરફાર કરે છે. ઓફસેટ રાઉન્ડિંગ ડેટાની સુરક્ષા જાળવી રાખીને રેન્જની અંદાજિત અધિકૃતતા સુનિશ્ચિત કરે છે, જે અગાઉની યોજનાઓ કરતાં વાસ્તવિક ડેટાની નજીક છે, અને મોટા ડેટા વિશ્લેષણના દૃશ્યમાં તેનું ખૂબ મહત્વ છે.

ML-NPB-5660-数据脱敏

ભલામણ કરેલ મોડેલ "ML-NPB-5660 માટે તપાસ સબમિટ કરો, અમે 24 કલાકમાં તમારો સંપર્ક કરીશું."ડેટા માસ્કીંગ માટે"

૪. સામાન્ય રીતે ઉપયોગમાં લેવાતી ડેટા માસ્કિંગ તકનીકો

(૧). આંકડાકીય તકનીકો

ડેટા સેમ્પલિંગ અને ડેટા એકત્રીકરણ

- ડેટા સેમ્પલિંગ: ડેટા સેટના પ્રતિનિધિ સબસેટને પસંદ કરીને મૂળ ડેટા સેટનું વિશ્લેષણ અને મૂલ્યાંકન એ ઓળખ દૂર કરવાની તકનીકોની અસરકારકતા સુધારવા માટે એક મહત્વપૂર્ણ પદ્ધતિ છે.

- ડેટા એકત્રીકરણ: માઇક્રોડેટામાં વિશેષતાઓ પર લાગુ કરાયેલ આંકડાકીય તકનીકો (જેમ કે સારાંશ, ગણતરી, સરેરાશ, મહત્તમ અને લઘુત્તમ) ના સંગ્રહ તરીકે, પરિણામ મૂળ ડેટા સેટમાંના તમામ રેકોર્ડનું પ્રતિનિધિત્વ કરે છે.

(2). સંકેતલિપી

ક્રિપ્ટોગ્રાફી એ ડિસેન્સિટાઇઝેશનની અસરકારકતાને ડિસેન્સિટાઇઝ કરવા અથવા વધારવા માટે એક સામાન્ય પદ્ધતિ છે. વિવિધ પ્રકારના એન્ક્રિપ્શન અલ્ગોરિધમ્સ વિવિધ ડિસેન્સિટાઇઝેશન અસરો પ્રાપ્ત કરી શકે છે.

- ડિટરમિનિસ્ટિક એન્ક્રિપ્શન: એક નોન-રેન્ડમ સિમેટ્રિક એન્ક્રિપ્શન. તે સામાન્ય રીતે ID ડેટા પર પ્રક્રિયા કરે છે અને જ્યારે જરૂર પડે ત્યારે સાઇફરટેક્સ્ટને ડિક્રિપ્ટ અને મૂળ ID પર પુનઃસ્થાપિત કરી શકે છે, પરંતુ કીને યોગ્ય રીતે સુરક્ષિત કરવાની જરૂર છે.

- ઉલટાવી શકાય તેવું એન્ક્રિપ્શન: હેશ ફંક્શનનો ઉપયોગ ડેટાને પ્રોસેસ કરવા માટે થાય છે, જેનો ઉપયોગ સામાન્ય રીતે ID ડેટા માટે થાય છે. તેને સીધું ડિક્રિપ્ટ કરી શકાતું નથી અને મેપિંગ સંબંધ સાચવવો આવશ્યક છે. વધુમાં, હેશ ફંક્શનની સુવિધાને કારણે, ડેટા અથડામણ થઈ શકે છે.

- હોમોમોર્ફિક એન્ક્રિપ્શન: સાઇફરટેક્સ્ટ હોમોમોર્ફિક અલ્ગોરિધમનો ઉપયોગ થાય છે. તેની લાક્ષણિકતા એ છે કે સાઇફરટેક્સ્ટ ઓપરેશનનું પરિણામ ડિક્રિપ્શન પછી પ્લેનટેક્સ્ટ ઓપરેશન જેવું જ હોય ​​છે. તેથી, તેનો ઉપયોગ સામાન્ય રીતે સંખ્યાત્મક ક્ષેત્રો પર પ્રક્રિયા કરવા માટે થાય છે, પરંતુ કામગીરીના કારણોસર તેનો વ્યાપકપણે ઉપયોગ થતો નથી.

(૩). સિસ્ટમ ટેકનોલોજી

સપ્રેશન ટેકનોલોજી ગોપનીયતા સુરક્ષાને પૂર્ણ ન કરતી ડેટા આઇટમ્સને કાઢી નાખે છે અથવા રક્ષણ આપે છે, પરંતુ તેને પ્રકાશિત કરતી નથી.

- માસ્કિંગ: તે એટ્રિબ્યુટ વેલ્યુને છુપાવવા માટે સૌથી સામાન્ય ડિસેન્સિટાઇઝેશન પદ્ધતિનો ઉલ્લેખ કરે છે, જેમ કે વિરોધી નંબર, ID કાર્ડ પર ફૂદડી ચિહ્નિત થયેલ હોય, અથવા સરનામું કાપી નાખવામાં આવે.

- સ્થાનિક દમન: ચોક્કસ વિશેષતા મૂલ્યો (કૉલમ) કાઢી નાખવાની, બિન-આવશ્યક ડેટા ફીલ્ડ્સને દૂર કરવાની પ્રક્રિયાનો સંદર્ભ આપે છે;

- રેકોર્ડ સપ્રેશન: ચોક્કસ રેકોર્ડ્સ (પંક્તિઓ) કાઢી નાખવાની, બિન-આવશ્યક ડેટા રેકોર્ડ્સ કાઢી નાખવાની પ્રક્રિયાનો સંદર્ભ આપે છે.

(૪) ઉપનામ ટેકનોલોજી

સ્યુડોમેનિંગ એ એક ઓળખ દૂર કરવાની તકનીક છે જે પ્રત્યક્ષ ઓળખકર્તા (અથવા અન્ય સંવેદનશીલ ઓળખકર્તા) ને બદલવા માટે ઉપનામનો ઉપયોગ કરે છે. ઉપનામ તકનીકો દરેક વ્યક્તિગત માહિતી વિષય માટે પ્રત્યક્ષ અથવા સંવેદનશીલ ઓળખકર્તાઓને બદલે અનન્ય ઓળખકર્તાઓ બનાવે છે.

- તે મૂળ ID ને અનુરૂપ સ્વતંત્ર રીતે રેન્ડમ મૂલ્યો જનરેટ કરી શકે છે, મેપિંગ ટેબલ સાચવી શકે છે અને મેપિંગ ટેબલની ઍક્સેસને સખત રીતે નિયંત્રિત કરી શકે છે.

- તમે ઉપનામ બનાવવા માટે એન્ક્રિપ્શનનો પણ ઉપયોગ કરી શકો છો, પરંતુ ડિક્રિપ્શન કી યોગ્ય રીતે રાખવાની જરૂર છે;

આ ટેકનોલોજીનો ઉપયોગ મોટી સંખ્યામાં સ્વતંત્ર ડેટા વપરાશકર્તાઓના કિસ્સામાં વ્યાપકપણે થાય છે, જેમ કે ઓપન પ્લેટફોર્મ દૃશ્યમાં ઓપનઆઈડી, જ્યાં વિવિધ વિકાસકર્તાઓ એક જ વપરાશકર્તા માટે અલગ અલગ ઓપનઆઈડી મેળવે છે.

(5). સામાન્યીકરણ તકનીકો

સામાન્યીકરણ તકનીક એ ઓળખ દૂર કરવાની તકનીકનો ઉલ્લેખ કરે છે જે ડેટા સેટમાં પસંદ કરેલા લક્ષણોની ગ્રેન્યુલારિટી ઘટાડે છે અને ડેટાનું વધુ સામાન્ય અને અમૂર્ત વર્ણન પૂરું પાડે છે. સામાન્યીકરણ તકનીક અમલમાં મૂકવા માટે સરળ છે અને રેકોર્ડ-સ્તરના ડેટાની અધિકૃતતાને સુરક્ષિત કરી શકે છે. તેનો ઉપયોગ સામાન્ય રીતે ડેટા ઉત્પાદનો અથવા ડેટા રિપોર્ટ્સમાં થાય છે.

- રાઉન્ડિંગ: પસંદ કરેલ વિશેષતા માટે રાઉન્ડિંગ બેઝ પસંદ કરવાનો સમાવેશ થાય છે, જેમ કે ઉપરની તરફ અથવા નીચે તરફ ફોરેન્સિક્સ, જેના પરિણામો 100, 500, 1K અને 10K મળે છે.

- ટોચ અને નીચે કોડિંગ તકનીકો: થ્રેશોલ્ડની ઉપર (અથવા નીચે) મૂલ્યોને ટોચ (અથવા નીચે) સ્તરનું પ્રતિનિધિત્વ કરતી થ્રેશોલ્ડથી બદલો, જેનાથી "X ઉપર" અથવા "X નીચે" પરિણામ મળે છે.

(6). રેન્ડમાઇઝેશન તકનીકો

એક પ્રકારની ડી-આઇડેન્ટિફિકેશન ટેકનિક તરીકે, રેન્ડમાઇઝેશન ટેકનોલોજીનો અર્થ રેન્ડમાઇઝેશન દ્વારા એટ્રિબ્યુટના મૂલ્યમાં ફેરફાર કરવાનો છે, જેથી રેન્ડમાઇઝેશન પછીનું મૂલ્ય મૂળ વાસ્તવિક મૂલ્યથી અલગ હોય. આ પ્રક્રિયા હુમલાખોરની સમાન ડેટા રેકોર્ડમાં અન્ય એટ્રિબ્યુટ મૂલ્યોમાંથી એટ્રિબ્યુટ મૂલ્ય મેળવવાની ક્ષમતા ઘટાડે છે, પરંતુ પરિણામી ડેટાની અધિકૃતતાને અસર કરે છે, જે ઉત્પાદન પરીક્ષણ ડેટા સાથે સામાન્ય છે.


પોસ્ટ સમય: સપ્ટેમ્બર-૨૭-૨૦૨૨