Vokenization: भाषा जी AI पाहू शकते

इमेज क्रेडिट:
प्रतिमा क्रेडिट
iStock

Vokenization: भाषा जी AI पाहू शकते

Vokenization: भाषा जी AI पाहू शकते

उपशीर्षक मजकूर
आता कृत्रिम बुद्धिमत्ता (AI) सिस्टीम प्रशिक्षणामध्ये प्रतिमांचा समावेश केल्यामुळे, रोबोट लवकरच कमांड "पाहण्यास" सक्षम होऊ शकतात.
    • लेखक बद्दल:
    • लेखक नाव
      Quantumrun दूरदृष्टी
    • 9 शकते, 2023

    नॅचरल लँग्वेज प्रोसेसिंग (NLP) ने कृत्रिम बुद्धिमत्ता (AI) प्रणालींना शब्द समजून घेऊन आणि भावनांशी संदर्भ जुळवून मानवी भाषण शिकण्यास सक्षम केले आहे. या NLP प्रणाली पूर्णपणे मजकूर-आधारित आहेत. Vokenization हे सर्व बदलणार आहे.

    Vokenization संदर्भ

    दोन मजकूर-आधारित मशीन लर्निंग (ML) प्रोग्राम्सचा वापर अनेकदा AI ला मानवी भाषेवर प्रक्रिया करण्यासाठी आणि समजून घेण्यासाठी प्रशिक्षण देण्यासाठी केला जातो: OpenAI चे जनरेटिव्ह प्री-ट्रेन्ड ट्रान्सफॉर्मर 3 (GPT-3) आणि Google चे BERT (ट्रान्सफॉर्मर्सकडून द्विदिशात्मक एन्कोडर प्रतिनिधित्व). एआय परिभाषेत, एनएलपी प्रशिक्षणात वापरल्या जाणार्‍या शब्दांना टोकन म्हणतात. युनिव्हर्सिटी ऑफ नॉर्थ कॅरोलिना (UNC) च्या संशोधकांनी निरीक्षण केले की मजकूर-आधारित प्रशिक्षण कार्यक्रम मर्यादित आहेत कारण ते "पाहू शकत नाहीत" म्हणजे ते दृश्य माहिती आणि संप्रेषण कॅप्चर करू शकत नाहीत. 

    उदाहरणार्थ, जर कोणी GPT-3 ला विचारले की मेंढीचा रंग कोणता आहे, तर सिस्टम स्पष्टपणे पांढरा असला तरीही "काळा" उत्तर देईल. हा प्रतिसाद आहे कारण मजकूर-आधारित प्रणाली योग्य रंग ओळखण्याऐवजी "ब्लॅक शीप" या संज्ञेशी जोडेल. टोकन्स (व्होकन) सह व्हिज्युअल समाविष्ट करून, एआय प्रणालींना अटींची समग्र समज असू शकते. Vokenization स्व-पर्यवेक्षित NLP प्रणालींमध्ये वोकन्स समाकलित करते, ज्यामुळे त्यांना "सामान्य ज्ञान" विकसित होऊ शकते.

    भाषा मॉडेल्स आणि कॉम्प्युटर व्हिजन एकत्रित करणे ही नवीन संकल्पना नाही आणि हे AI संशोधनात झपाट्याने विस्तारणारे क्षेत्र आहे. या दोन प्रकारच्या AI चे संयोजन त्यांच्या वैयक्तिक सामर्थ्याचा लाभ घेते. GPT-3 सारख्या भाषा मॉडेल्सना पर्यवेक्षित शिक्षणाद्वारे प्रशिक्षित केले जाते, जे त्यांना सहजतेने मोजू देते. याउलट, ऑब्जेक्ट रेकग्निशन सिस्टीम सारखी प्रतिमा मॉडेल्स प्रत्यक्ष वास्तवातून शिकू शकतात आणि मजकूराद्वारे प्रदान केलेल्या अमूर्ततेवर अवलंबून नाहीत. उदाहरणार्थ, प्रतिमा मॉडेल हे ओळखू शकतात की एक मेंढी चित्र पाहून पांढरी आहे.

    व्यत्यय आणणारा प्रभाव

    vokenization प्रक्रिया खूपच सरळ आहे. भाषेच्या टोकन्सना संबंधित किंवा संबंधित प्रतिमा नियुक्त करून Vokens तयार केले जातात. त्यानंतर, अल्गोरिदम (वोकेनायझर) हे पर्यवेक्षण न केलेल्या शिक्षणाद्वारे (कोणतेही स्पष्ट पॅरामीटर्स/नियम नाहीत) व्होकन्स तयार करण्यासाठी डिझाइन केलेले आहेत. वोकेनायझेशनद्वारे प्रशिक्षित कॉमन सेन्स एआय संवाद साधू शकते आणि समस्या अधिक चांगल्या प्रकारे सोडवू शकते कारण त्यांना संदर्भाची अधिक सखोल माहिती आहे. हा दृष्टीकोन अद्वितीय आहे कारण तो केवळ भाषेच्या टोकनचा अंदाज लावत नाही तर प्रतिमा टोकन्सचाही अंदाज लावतो, जे पारंपारिक BERT मॉडेल करू शकत नाहीत.

    उदाहरणार्थ, रोबोटिक सहाय्यक प्रतिमा ओळखण्यास आणि प्रक्रिया अधिक चांगल्या प्रकारे नेव्हिगेट करण्यास सक्षम असतील कारण ते त्यांच्यासाठी काय आवश्यक आहे ते "पाहू" शकतात. सामग्री लिहिण्यासाठी प्रशिक्षित कृत्रिम बुद्धिमत्ता प्रणाली विसंगत वाक्यांऐवजी, अधिक मानवी वाटणारे लेख तयार करण्यास सक्षम असेल, ज्या कल्पना चांगल्या प्रकारे प्रवाहित होतील. एनएलपी ऍप्लिकेशन्सची व्यापक पोहोच लक्षात घेता, व्होकनायझेशनमुळे चॅटबॉट्स, आभासी सहाय्यक, ऑनलाइन वैद्यकीय निदान, डिजिटल अनुवादक आणि बरेच काही चांगले कार्यप्रदर्शन होऊ शकते.

    याव्यतिरिक्त, दृष्टी आणि भाषा शिक्षणाचे संयोजन वैद्यकीय इमेजिंग ऍप्लिकेशन्समध्ये लोकप्रिय होत आहे, विशेषत: स्वयंचलित वैद्यकीय प्रतिमा निदानासाठी. उदाहरणार्थ, काही संशोधक रेडिओग्राफ प्रतिमांवर सोबतच्या मजकुराच्या वर्णनासह या पद्धतीचा प्रयोग करत आहेत, जेथे शब्दार्थ विभागणी वेळखाऊ असू शकते. व्होकेनायझेशन तंत्र हे प्रतिनिधित्व वाढवू शकते आणि मजकूर माहितीचा वापर करून स्वयंचलित वैद्यकीय इमेजिंग सुधारू शकते.

    vokenization साठी अर्ज

    वोकेनाइझेशनसाठी काही अनुप्रयोगांमध्ये हे समाविष्ट असू शकते:

    • अंतर्ज्ञानी चॅटबॉट्स जे स्क्रीनशॉट, चित्रे आणि वेबसाइट सामग्रीवर प्रक्रिया करू शकतात. ग्राहक समर्थन चॅटबॉट्स, विशेषतः, उत्पादने आणि सेवांची अचूकपणे शिफारस करण्यास सक्षम असू शकतात.
    • डिजिटल अनुवादक जे प्रतिमा आणि व्हिडिओंवर प्रक्रिया करू शकतात आणि सांस्कृतिक आणि परिस्थितीजन्य संदर्भ विचारात घेणारे अचूक भाषांतर देऊ शकतात.
    • सोशल मीडिया बॉट स्कॅनर प्रतिमा, मथळे आणि टिप्पण्या विलीन करून अधिक समग्र भावना विश्लेषण करण्यास सक्षम आहेत. हा ॲप्लिकेशन सामग्री नियंत्रणामध्ये उपयुक्त ठरू शकतो ज्यासाठी हानिकारक प्रतिमांचे विश्लेषण आवश्यक आहे.
    • संगणक दृष्टी आणि NLP मशीन लर्निंग अभियंते आणि डेटा वैज्ञानिकांसाठी रोजगाराच्या संधी वाढवणे.
    • स्टार्टअप्स या एआय सिस्टीमचे व्यावसायिकीकरण करण्यासाठी किंवा व्यवसायांसाठी सानुकूलित उपाय प्रदान करण्यासाठी तयार करत आहेत.

    टिप्पणी करण्यासाठी प्रश्न

    • आपण यंत्रमानवांशी संवाद कसा साधतो, असे आपणास कसे वाटते?
    • आम्ही व्यवसाय कसा चालवतो आणि आमच्या गॅझेट्सशी (स्मार्टफोन आणि स्मार्ट उपकरणे) संवाद कसा साधतो हे आवाजीकरण कसे बदलू शकते?

    अंतर्दृष्टी संदर्भ

    या अंतर्दृष्टीसाठी खालील लोकप्रिय आणि संस्थात्मक दुवे संदर्भित केले गेले: