Vokenization: वह भाषा जिसे AI देख सकता है

इमेज क्रेडिट:
छवि क्रेडिट
iStock

Vokenization: वह भाषा जिसे AI देख सकता है

Vokenization: वह भाषा जिसे AI देख सकता है

उपशीर्षक पाठ
छवियों को अब आर्टिफिशियल इंटेलिजेंस (एआई) सिस्टम प्रशिक्षण में शामिल किया जा रहा है, रोबोट जल्द ही कमांड को "देखने" में सक्षम हो सकते हैं।
    • लेखक:
    • लेखक का नाम
      क्वांटमरन दूरदर्शिता
    • 9 मई 2023

    नेचुरल लैंग्वेज प्रोसेसिंग (एनएलपी) ने आर्टिफिशियल इंटेलिजेंस (एआई) सिस्टम को शब्दों को समझकर और भावना के साथ संदर्भ का मिलान करके मानव भाषण सीखने में सक्षम बनाया है। केवल नकारात्मक पक्ष यह है कि ये एनएलपी सिस्टम विशुद्ध रूप से टेक्स्ट-आधारित हैं। वोकनाइजेशन वह सब बदलने वाला है।

    वोकनाइजेशन संदर्भ

    मानव भाषा को संसाधित करने और समझने के लिए एआई को प्रशिक्षित करने के लिए दो टेक्स्ट-आधारित मशीन लर्निंग (एमएल) प्रोग्राम का उपयोग अक्सर किया जाता है: ओपनएआई का जनरेटिव प्री-ट्रेन ट्रांसफार्मर 3 (जीपीटी-3) और गूगल का बीईआरटी (ट्रांसफॉर्मर से द्विदिश एनकोडर प्रतिनिधित्व)। एआई शब्दावली में, एनएलपी प्रशिक्षण में प्रयुक्त शब्दों को टोकन कहा जाता है। उत्तरी कैरोलिना विश्वविद्यालय (यूएनसी) के शोधकर्ताओं ने पाया कि पाठ-आधारित प्रशिक्षण कार्यक्रम सीमित हैं क्योंकि वे "देख" नहीं सकते हैं, जिसका अर्थ है कि वे दृश्य सूचना और संचार पर कब्जा नहीं कर सकते हैं। 

    उदाहरण के लिए, यदि कोई GPT-3 से पूछता है कि भेड़ का रंग क्या है, तो सिस्टम अक्सर "काली" उत्तर देगा, भले ही वह स्पष्ट रूप से सफेद हो। यह प्रतिक्रिया इसलिए है क्योंकि पाठ-आधारित प्रणाली इसे सही रंग की पहचान करने के बजाय "ब्लैक शीप" शब्द से जोड़ देगी। टोकन (वोकन) के साथ दृश्यों को शामिल करके, AI सिस्टम में शब्दों की समग्र समझ हो सकती है। वोकेनाइजेशन वोकेन्स को स्व-पर्यवेक्षित एनएलपी सिस्टम में एकीकृत करता है, जिससे उन्हें "सामान्य ज्ञान" विकसित करने की अनुमति मिलती है।

    भाषा मॉडल और कंप्यूटर दृष्टि को एकीकृत करना कोई नई अवधारणा नहीं है, और यह एआई अनुसंधान में तेजी से विस्तार करने वाला क्षेत्र है। इन दो प्रकार के AI का संयोजन उनकी व्यक्तिगत शक्तियों का लाभ उठाता है। GPT-3 जैसे भाषा मॉडल को अप्रशिक्षित शिक्षण के माध्यम से प्रशिक्षित किया जाता है, जो उन्हें आसानी से स्केल करने की अनुमति देता है। इसके विपरीत, वस्तु पहचान प्रणाली जैसे छवि मॉडल सीधे वास्तविकता से सीख सकते हैं और पाठ द्वारा प्रदान की गई अमूर्तता पर भरोसा नहीं करते हैं। उदाहरण के लिए, छवि मॉडल किसी चित्र को देखकर पहचान सकते हैं कि भेड़ सफेद है।

    विघटनकारी प्रभाव

    वोकनाइजेशन की प्रक्रिया बहुत सीधी है। भाषा के टोकन के लिए संबंधित या प्रासंगिक छवियों को निर्दिष्ट करके वोकन्स बनाए जाते हैं। फिर, एल्गोरिदम (वोकेनाइज़र) को अनसुनी शिक्षा (कोई स्पष्ट पैरामीटर / नियम नहीं) के माध्यम से वोकेन्स उत्पन्न करने के लिए डिज़ाइन किया गया है। वोकेनाइजेशन के माध्यम से प्रशिक्षित सामान्य ज्ञान एआई समस्याओं को बेहतर तरीके से संप्रेषित और हल कर सकता है क्योंकि उनके पास संदर्भ की अधिक गहन समझ है। यह दृष्टिकोण अद्वितीय है क्योंकि यह न केवल भाषा के टोकन की भविष्यवाणी करता है बल्कि छवि टोकन की भी भविष्यवाणी करता है, जो कुछ ऐसा है जो पारंपरिक बीईआरटी मॉडल करने में असमर्थ हैं।

    उदाहरण के लिए, रोबोट सहायक छवियों को पहचानने और प्रक्रियाओं को बेहतर ढंग से नेविगेट करने में सक्षम होंगे क्योंकि वे "देख" सकते हैं कि उनके लिए क्या आवश्यक है। सामग्री लिखने के लिए प्रशिक्षित आर्टिफिशियल इंटेलिजेंस सिस्टम उन लेखों को तैयार करने में सक्षम होंगे जो अधिक मानवीय लगते हैं, ऐसे विचारों के साथ जो अलग-अलग वाक्यों के बजाय बेहतर प्रवाहित होते हैं। एनएलपी अनुप्रयोगों की व्यापक पहुंच को ध्यान में रखते हुए, वोकेनाइजेशन से बेहतर प्रदर्शन करने वाले चैटबॉट, आभासी सहायक, ऑनलाइन चिकित्सा निदान, डिजिटल अनुवादक और बहुत कुछ हो सकता है।

    इसके अतिरिक्त, दृष्टि और भाषा सीखने का संयोजन चिकित्सा इमेजिंग अनुप्रयोगों में लोकप्रियता प्राप्त कर रहा है, विशेष रूप से स्वचालित चिकित्सा छवि निदान के लिए। उदाहरण के लिए, कुछ शोधकर्ता इस दृष्टिकोण के साथ पाठ विवरण के साथ रेडियोग्राफ़ छवियों पर प्रयोग कर रहे हैं, जहाँ शब्दार्थ विभाजन समय लेने वाला हो सकता है। वोकेनाइजेशन तकनीक इन अभ्यावेदन को बढ़ा सकती है और पाठ्य जानकारी का उपयोग करके स्वचालित चिकित्सा इमेजिंग में सुधार कर सकती है।

    वोकनाइजेशन के लिए आवेदन

    वोकेनाइजेशन के लिए कुछ एप्लिकेशन में शामिल हो सकते हैं:

    • सहज ज्ञान युक्त चैटबॉट जो स्क्रीनशॉट, चित्र और वेबसाइट सामग्री को संसाधित कर सकते हैं। ग्राहक सहायता चैटबॉट, विशेष रूप से, उत्पादों और सेवाओं की सटीक अनुशंसा करने में सक्षम हो सकते हैं।
    • डिजिटल अनुवादक जो छवियों और वीडियो को प्रोसेस कर सकते हैं और एक सटीक अनुवाद प्रदान कर सकते हैं जो सांस्कृतिक और स्थितिजन्य संदर्भ पर विचार करता है।
    • सोशल मीडिया बॉट स्कैनर छवियों, कैप्शन और टिप्पणियों को मर्ज करके अधिक समग्र भावना विश्लेषण करने में सक्षम हैं। यह एप्लिकेशन सामग्री मॉडरेशन में उपयोगी हो सकता है जिसके लिए हानिकारक छवियों के विश्लेषण की आवश्यकता होती है।
    • कंप्यूटर विजन और एनएलपी मशीन लर्निंग इंजीनियरों और डेटा वैज्ञानिकों के लिए रोजगार के अवसर बढ़ाना।
    • स्टार्टअप्स इन एआई सिस्टम्स का व्यावसायीकरण करने या व्यवसायों के लिए अनुकूलित समाधान प्रदान करने के लिए उनका निर्माण कर रहे हैं।

    टिप्पणी करने के लिए प्रश्न

    • आपको और कैसे लगता है कि वोकेनाइजेशन बदलेगा कि हम रोबोट के साथ कैसे बातचीत करते हैं?
    • वोकेनाइजेशन कैसे बदल सकता है कि हम कैसे व्यापार करते हैं और अपने गैजेट्स (स्मार्टफोन और स्मार्ट उपकरण) के साथ बातचीत करते हैं?

    अंतर्दृष्टि संदर्भ

    इस अंतर्दृष्टि के लिए निम्नलिखित लोकप्रिय और संस्थागत लिंक संदर्भित किए गए थे: