Vokenization: भाषा जुन AI ले देख्न सक्छ

छवि क्रेडिट:
छवि क्रेडिट
IStock

Vokenization: भाषा जुन AI ले देख्न सक्छ

Vokenization: भाषा जुन AI ले देख्न सक्छ

उपशीर्षक पाठ
तस्बिरहरू अब कृत्रिम बुद्धिमत्ता (एआई) प्रणाली प्रशिक्षणमा समावेश गरिएपछि, रोबोटहरूले चाँडै आदेशहरू "हेर्न" सक्षम हुनेछन्।
    • लेखक:
    • लेखक नाम
      Quantumrun दूरदर्शिता
    • 9 सक्छ, 2023

    प्राकृतिक भाषा प्रशोधन (NLP) ले कृत्रिम बुद्धिमत्ता (AI) प्रणालीहरूलाई शब्दहरू बुझेर र भावनासँग मिल्दो सन्दर्भमा मानव बोली सिक्न सक्षम बनाएको छ। केवल नकारात्मक पक्ष यो हो कि यी NLP प्रणालीहरू विशुद्ध पाठ-आधारित छन्। Vokenization त्यो सबै परिवर्तन गर्न लागिरहेको छ।

    Vokenization सन्दर्भ

    दुई पाठ-आधारित मेसिन लर्निङ (ML) कार्यक्रमहरू प्राय: AI लाई प्रशोधन गर्न र मानव भाषा बुझ्न प्रशिक्षण दिन प्रयोग गरिन्छ: OpenAI को जेनेरेटिभ प्रि-ट्रेन्ड ट्रान्सफर्मर 3 (GPT-3) र Google को BERT (ट्रान्सफर्मरबाट द्विदिशात्मक एन्कोडर प्रतिनिधित्व)। AI शब्दावलीमा, NLP तालिममा प्रयोग हुने शब्दहरूलाई टोकन भनिन्छ। युनिभर्सिटी अफ नर्थ क्यारोलिना (UNC) का अन्वेषकहरूले पाठ-आधारित प्रशिक्षण कार्यक्रमहरू सीमित छन् किनभने तिनीहरूले "हेर्न" सक्दैनन्, जसको अर्थ तिनीहरूले भिजुअल जानकारी र सञ्चारलाई खिच्न सक्दैनन्। 

    उदाहरणका लागि, यदि कसैले GPT-3 लाई भेडाको रङ के हो भनेर सोध्यो भने, प्रणालीले प्रायः "कालो" जवाफ दिनेछ भले पनि यो स्पष्ट रूपमा सेतो छ। यो प्रतिक्रिया हो किनभने पाठ-आधारित प्रणालीले यसलाई सही रङ पहिचान गर्नुको सट्टा "कालो भेडा" शब्दसँग सम्बद्ध गर्नेछ। टोकनहरू (voken) सँग भिजुअलहरू समावेश गरेर, AI प्रणालीहरूमा सर्तहरूको समग्र समझ हुन सक्छ। Vokenization ले स्व-निरीक्षण गरिएको NLP प्रणालीहरूमा भोकनहरूलाई एकीकृत गर्दछ, तिनीहरूलाई "सामान्य ज्ञान" विकास गर्न अनुमति दिन्छ।

    भाषा मोडेल र कम्प्यूटर दृष्टि एकीकरण कुनै नयाँ अवधारणा होइन, र यो एआई अनुसन्धान मा एक द्रुत विस्तार क्षेत्र हो। यी दुई प्रकारका AI को संयोजनले तिनीहरूको व्यक्तिगत शक्तिको लाभ उठाउँछ। GPT-3 जस्ता भाषा मोडेलहरू असुरक्षित शिक्षा मार्फत प्रशिक्षित हुन्छन्, जसले तिनीहरूलाई सजिलै मापन गर्न अनुमति दिन्छ। यसको विपरित, वस्तु पहिचान प्रणाली जस्ता छवि मोडेलहरूले वास्तविकताबाट प्रत्यक्ष रूपमा सिक्न सक्छन् र पाठद्वारा प्रदान गरिएको अमूर्ततामा भर पर्दैनन्। उदाहरणका लागि, छवि मोडेलहरूले तस्वीर हेरेर भेडा सेतो छ भनेर चिन्न सक्छन्।

    विघटनकारी प्रभाव

    Vokenization को प्रक्रिया धेरै सीधा छ। Vokens भाषा टोकनहरूमा सम्बन्धित वा सान्दर्भिक छविहरू असाइन गरेर सिर्जना गरिन्छ। त्यसपछि, एल्गोरिदम (भोकेनाइजर) असुरक्षित सिकाइ (कुनै स्पष्ट प्यारामिटर/नियमहरू छैनन्) मार्फत भोकनहरू उत्पन्न गर्न डिजाइन गरिएको हो। भोकनाइजेसन मार्फत प्रशिक्षित सामान्य ज्ञान एआईले कुराकानी गर्न र समस्याहरू राम्रोसँग समाधान गर्न सक्छ किनभने तिनीहरूसँग सन्दर्भको अझ गहिरो बुझाइ छ। यो दृष्टिकोण अद्वितीय छ किनभने यसले भाषा टोकनहरू मात्र भविष्यवाणी गर्दैन तर छवि टोकनहरूको पनि भविष्यवाणी गर्दछ, जुन परम्परागत BERT मोडेलहरूले गर्न असमर्थ छन्।

    उदाहरणका लागि, रोबोट सहायकहरूले छविहरू पहिचान गर्न र प्रक्रियाहरू राम्रोसँग नेभिगेट गर्न सक्षम हुनेछन् किनभने तिनीहरूले "हेर्न" तिनीहरूलाई के आवश्यक छ। सामग्री लेख्न प्रशिक्षित आर्टिफिसियल इन्टेलिजेन्स प्रणालीहरूले अव्यवस्थित वाक्यहरूको सट्टा, राम्रोसँग प्रवाह गर्ने विचारहरू सहित, अधिक मानवीय आवाज हुने लेखहरू सिर्जना गर्न सक्षम हुनेछन्। NLP अनुप्रयोगहरूको फराकिलो पहुँचलाई ध्यानमा राख्दै, भोकनाइजेसनले राम्रो प्रदर्शन गर्ने च्याटबटहरू, भर्चुअल सहायकहरू, अनलाइन चिकित्सा निदानहरू, डिजिटल अनुवादकहरू, र थपमा नेतृत्व गर्न सक्छ।

    थप रूपमा, दृष्टि र भाषा सिकाइको संयोजन मेडिकल इमेजिङ अनुप्रयोगहरूमा लोकप्रियता प्राप्त गर्दैछ, विशेष गरी स्वचालित चिकित्सा छवि निदानको लागि। उदाहरणका लागि, केही शोधकर्ताहरूले रेडियोग्राफ छविहरूमा पाठ विवरणहरू सहित यस दृष्टिकोणको साथ प्रयोग गरिरहेका छन्, जहाँ सिमेन्टिक विभाजन समय-उपभोग हुन सक्छ। vokenization प्रविधिले यी प्रतिनिधित्वहरू बढाउन र पाठ जानकारी प्रयोग गरेर स्वचालित मेडिकल इमेजिङ सुधार गर्न सक्छ।

    Vokenization को लागी आवेदन

    Vokenization को लागी केहि अनुप्रयोगहरु समावेश हुन सक्छ:

    • स्क्रिनसटहरू, चित्रहरू, र वेबसाइट सामग्रीहरू प्रशोधन गर्न सक्ने सहज च्याटबटहरू। ग्राहक समर्थन च्याटबटहरू, विशेष गरी, उत्पादन र सेवाहरू सही रूपमा सिफारिस गर्न सक्षम हुन सक्छन्।
    • डिजिटल अनुवादकहरू जसले छविहरू र भिडियोहरू प्रशोधन गर्न सक्छन् र सांस्कृतिक र परिस्थितिगत सन्दर्भलाई विचार गर्ने सही अनुवाद प्रदान गर्न सक्छन्।
    • सामाजिक मिडिया बोट स्क्यानरहरूले छविहरू, क्याप्शनहरू, र टिप्पणीहरू मर्ज गरेर थप समग्र भावना विश्लेषण गर्न सक्षम छन्। यो अनुप्रयोग हानिकारक छविहरूको विश्लेषण आवश्यक सामग्री मध्यस्थता मा उपयोगी हुन सक्छ।
    • कम्प्युटर भिजन र NLP मेसिन लर्निङ इन्जिनियरहरू र डेटा वैज्ञानिकहरूको लागि रोजगारीका अवसरहरू बढाउँदै।
    • स्टार्टअपहरूले यी AI प्रणालीहरूलाई व्यावसायिक बनाउन वा व्यवसायहरूको लागि अनुकूलित समाधानहरू प्रदान गर्नका लागि निर्माण गर्दछ।

    टिप्पणी गर्न प्रश्नहरू

    • हामी कसरी रोबोटहरूसँग अन्तर्क्रिया गर्छौं भनेर भोकनाइजेसनले कसरी परिवर्तन गर्नेछ जस्तो तपाईंलाई लाग्छ?
    • हामीले कसरी व्यापार सञ्चालन गर्ने र हाम्रा ग्याजेटहरू (स्मार्टफोन र स्मार्ट उपकरणहरू) सँग अन्तरक्रिया गर्ने तरिकालाई भोकनाइजेसनले कसरी परिवर्तन गर्न सक्छ?

    अन्तरदृष्टि सन्दर्भहरू

    निम्न लोकप्रिय र संस्थागत लिङ्कहरू यस अन्तरदृष्टिको लागि सन्दर्भ गरिएको थियो: