होमोग्लिफ कन्वर्टर — Unicode सफ़ाई
रूपांतरण सर्वोत्तम प्रयास है: मैप किए गए कन्फ्यूज़ेबल और एनएफकेसी फोल्डिंग नियतात्मक हैं, लेकिन कुछ वैध यूनिकोड को चिह्नित नहीं किया जाएगा।
पेस्ट करें या टाइप करें - जैसे ही आप टाइप करते हैं परिणाम अपडेट हो जाते हैं (लंबे इनपुट के लिए हल्के ढंग से डिबाउंस)।
मूल दृश्य में संदिग्ध पात्रों को रेखांकित किया गया है और उन्हें "संदिग्ध" लेबल दिया गया है। रंग को हाइलाइट करने के अलावा.
अभी तक विश्लेषण करने के लिए कोई पात्र नहीं है। होमोग्लिफ़ और कन्फ्यूज़ेबल्स ब्रेकडाउन देखने के लिए ऊपर टेक्स्ट चिपकाएँ।
दृष्टिगत रूप से भ्रमित करने वाले Unicode वर्णों का पता लगाएँ और उन्हें सुरक्षित ASCII या सामान्यीकृत Unicode में बदलें। ब्राउज़र में मुफ्त।
यह होमोग्लिफ़ कनवर्टर क्या करता है
एक होमोग्लिफ़ कनवर्टर यूनिकोड वर्णों का पता लगाता है जो सामान्य लैटिन अक्षरों या अंकों (भ्रमित करने योग्य) की तरह दिख सकते हैं और दिखाते हैं कि उन्हें कैसे सामान्यीकृत या प्रतिस्थापित किया गया था। आप परीक्षण के लिए सादे ASCII से नियतात्मक स्पूफ-जैसी स्ट्रिंग बनाने के लिए जेनरेट होमोग्लिफ्स भी चला सकते हैं। यह मुफ़्त कन्फ़्यूज़ेबल कनवर्टर और यूनिकोड कन्फ़्यूज़ेबल चेकर पूरी तरह से आपके ब्राउज़र में चलता है - इसे सुरक्षा और मॉडरेशन के लिए यूनिकोड सामान्यीकरण उपकरण, स्पूफ टेक्स्ट क्लीनर, या समान दिखने वाले कैरेक्टर कनवर्टर के रूप में उपयोग करें।
इस यूनिकोड सामान्यीकरण उपकरण का उपयोग कैसे करें
- जिस पाठ का आप निरीक्षण करना चाहते हैं उसे इनपुट क्षेत्र में चिपकाएँ या टाइप करें।
- इस पर निर्भर करते हुए कि आप चिपकाए गए पाठ को साफ़ कर रहे हैं या ASCII से परीक्षण नमूने बना रहे हैं, संरक्षित पठनीय यूनिकोड, सख्त ASCII फ़ॉलबैक, या होमोग्लिफ़ उत्पन्न करें चुनें।
- मूल (हाइलाइट के साथ) और आउटपुट की साथ-साथ तुलना करें; कोड बिंदुओं और कारणों के लिए विश्लेषण तालिका की समीक्षा करें।
- परिणाम को कॉपी करने के लिए आउटपुट टेक्स्ट कॉपी करें या रीसेट करने के लिए क्लियर का उपयोग करें।
रूपांतरण मोड: पठनीय यूनिकोड बनाम यूनिकोड से ASCII बनाम जेनरेट
- प्रिजर्व रीडेबल यूनिकोड पहले बंडल किए गए कन्फ्यूजेबल मानचित्र को लागू करता है, फिर जब यह एक चरित्र बदलता है तो एनएफकेसी सामान्यीकरण करता है। आउटपुट में अभी भी गैर-ASCII अक्षर हो सकते हैं जिन्हें फ़्लैग नहीं किया गया था।
- सख्त ASCII फ़ॉलबैक समान पहचान नियमों का उपयोग करता है लेकिन मानचित्र से ASCII प्रतिस्थापन को प्राथमिकता देता है। जब तक एनएफकेसी उन्हें नहीं बदल देता, तब तक मानचित्र में जो अक्षर नहीं हैं वे वैसे ही बने रहते हैं; यह मोड स्पूफ टेक्स्ट क्लीनर वर्कफ़्लोज़ के लिए सख्त और बेहतर है।
- होमोग्लिफ़ उत्पन्न करना आपके इनपुट को बाएं से दाएं चलाता है और प्रत्येक ASCII अक्षर या अंक को उसी बंडल मानचित्र (क्लीनअप के विपरीत) से एक एकल नियतात्मक होमोग्लिफ़ से बदल देता है। बिना चुने हुए विकल्प वाले पात्र ASCII बने रहते हैं।
यहां क्या संदिग्ध गिना जाता है
क्लीनअप मोड में, किसी वर्ण को तब फ़्लैग किया जाता है जब वह एक परिभाषित प्रतिस्थापन के साथ ज्ञात भ्रमित करने योग्य होता है, या जब एनएफकेसी सामान्यीकरण इसे बदल देता है (उदाहरण के लिए पूर्ण-चौड़ाई अंक)। जनरेट मोड में, "संदिग्ध" प्रत्येक स्थिति को चिह्नित करता है जहां ASCII अक्षर या अंक प्रतिस्थापित किया गया था। यह पूर्ण यूनिकोड सुरक्षा ऑडिट नहीं है - केवल नियतात्मक नियम हैं।
सामान्य उपयोग के मामले
- चिपकाए गए स्ट्रिंग में नकली उपयोगकर्ता नाम, डोमेन, या होमोग्लिफ़ हमलों की जाँच करना।
- समान दिखने वाले चरित्र युक्तियों की संयम और विश्वास-और-सुरक्षा समीक्षा।
- होमोग्लिफ़ डिटेक्टर दृश्य के साथ एन्कोडिंग समस्याओं का डेवलपर डिबगिंग।
सीमाएँ और सुरक्षा नोट
बंडल किए गए मानचित्र में सामान्य सिरिलिक, ग्रीक और पूर्ण-चौड़ाई वाले समानार्थी शामिल हैं - प्रत्येक यूनिकोड भ्रमित करने योग्य नहीं है। जेनरेट मोड केवल अधिकृत परीक्षण के लिए है; इसका उपयोग लोगों को धोखा देने या सुरक्षा से बचने के लिए न करें। परिणाम नियतात्मक हैं, एमएल-आधारित जोखिम स्कोर नहीं। उच्च-जोखिम वाले निर्णयों के लिए हमेशा मानवीय समीक्षा के साथ संयोजन करें।
गोपनीयता
पृष्ठ लोड होने के बाद सभी पहचान और रूपांतरण जावास्क्रिप्ट में स्थानीय रूप से चलते हैं। प्रोसेसिंग के लिए कोई भी टेक्स्ट सर्वर पर नहीं भेजा जाता है।
अक्सर पूछे जाने वाले प्रश्न
होमोग्लिफ़ क्या है?
होमोग्लिफ़ एक ऐसा वर्ण है जो किसी भिन्न स्क्रिप्ट या एन्कोडिंग के किसी अन्य वर्ण की तरह दिखता है, जैसे कि सिरिलिक "ए" जो लैटिन "ए" जैसा दिखता है। हमलावर इनका उपयोग नकली डोमेन, उपयोगकर्ता नाम और संदेशों में करते हैं। यह टूल उन वर्णों को कोड बिंदुओं और प्रतिस्थापनों के साथ सामने लाता है।
यह यूनिकोड सामान्यीकरण से किस प्रकार भिन्न है?
यूनिकोड सामान्यीकरण (उदाहरण के लिए एनएफकेसी) मानक तरीके से संगतता और चौड़ाई वेरिएंट को मोड़ता है। यह उपकरण एनएफकेसी को एक छोटे से स्पष्ट भ्रमित करने योग्य मानचित्र के साथ जोड़ता है ताकि आप देख सकें कि प्रत्येक वर्ण को क्यों चिह्नित किया गया था - एक सादे यूनिकोड सामान्यीकरण टूल पास से परे उपयोगी।
क्या सख्त ASCII मोड वैध गैर-अंग्रेजी पाठ को बदल देगा?
सख्त ASCII फ़ॉलबैक उन वर्णों को प्रतिस्थापित करता है जो बंडल किए गए कन्फ़्यूज़ेबल मानचित्र में दिखाई देते हैं या NFKC के अंतर्गत बदलते हैं। अन्य गैर-ASCII अक्षरों को अपरिवर्तित छोड़ दिया गया है। वैध पाठ अभी भी बदल सकता है यदि इसमें वे मैप किए गए वर्ण शामिल हैं, इसलिए विश्लेषण सूची की समीक्षा करें।
क्या मेरा टेक्स्ट किसी सर्वर पर भेजा गया है?
नहीं, पृष्ठ लोड होने के बाद, पता लगाना और रूपांतरण केवल जावास्क्रिप्ट का उपयोग करें। यह कन्फ़्यूज़ेबल कनवर्टर आपके पेस्ट को विश्लेषण के लिए अपलोड नहीं करता है।
क्या यह हर धोखाधड़ी को पकड़ सकता है?
नहीं, कवरेज नियतात्मक और मानचित्र-आधारित है, मशीन लर्निंग नहीं। यह सामान्य समान दिखने वाले चरित्र युक्तियों में मदद करता है लेकिन पूर्ण सुरक्षा ऑडिट नहीं है।
जनरेट होमोग्लिफ़्स मोड क्या करता है?
यह आपके इनपुट में ASCII अक्षरों और अंकों को सफाई के लिए उपयोग किए जाने वाले समान बंडल मानचित्र से नियतात्मक हमशक्ल के साथ बदल देता है - अधिकृत वातावरण में परीक्षण स्ट्रिंग बनाने के लिए उपयोगी (उदाहरण के लिए मॉडरेशन क्यूए)। यह प्रतिरूपण या सुरक्षा को दरकिनार करने के लिए नहीं है।