Vokenization: ٻولي جيڪا AI ڏسي سگهي ٿي

تصويري ڪريڊٽ:
تصوير جي ڪريڊٽ
ايٽڪ

Vokenization: ٻولي جيڪا AI ڏسي سگهي ٿي

Vokenization: ٻولي جيڪا AI ڏسي سگهي ٿي

ذيلي عنوان متن
تصويرن سان گڏ هاڻي مصنوعي ذهانت (AI) سسٽم ٽريننگ ۾ شامل ڪيو ويو آهي، روبوٽ جلد ئي "ڏس" حڪمن جي قابل هوندا.
    • الاهي:
    • ليکڪ جو نالو
      Quantumrun اڳڪٿي
    • مئي 9، 2023

    قدرتي ٻولي پروسيسنگ (اين ايل پي) مصنوعي ذهانت (AI) سسٽم کي فعال ڪيو آهي ته جيئن لفظن کي سمجهڻ ۽ جذبات سان ملندڙ حوالي سان انساني تقرير سکڻ. صرف نقصان اهو آهي ته اهي اين ايل پي سسٽم خالص متن تي ٻڌل آهن. Vokenization اهو سڀ ڪجهه تبديل ڪرڻ بابت آهي.

    آواز جي حوالي سان

    ٻه ٽيڪسٽ بيسڊ مشين لرننگ (ML) پروگرام اڪثر ڪري AI کي تربيت ڏيڻ لاءِ استعمال ڪيا ويندا آهن ته جيئن انساني ٻولي کي پروسيس ڪري ۽ سمجهي سگهجي: OpenAI's Generative Pre-trained Transformer 3 (GPT-3) ۽ گوگل جو BERT (ٽرانسفارمرز کان ٻه طرفي انڪوڊر نمائندگي). AI اصطلاحن ۾، NLP ٽريننگ ۾ استعمال ٿيندڙ لفظن کي ٽوڪن سڏيو ويندو آهي. اتر ڪيرولينا يونيورسٽي (UNC) جي محققن ڏٺو ته متن تي ٻڌل ٽريننگ پروگرام محدود آهن ڇاڪاڻ ته اهي ”ڏس“ نٿا سگهن، مطلب ته اهي بصري معلومات ۽ ڪميونيڪيشن کي پڪڙي نٿا سگهن. 

    مثال طور، جيڪڏهن ڪو GPT-3 کان پڇي ته رڍن جو رنگ ڪهڙو آهي، سسٽم اڪثر جواب ڏيندو "ڪارو" جيتوڻيڪ اهو واضح طور تي اڇو آهي. اهو جواب ان ڪري آهي جو ٽيڪسٽ بيسڊ سسٽم ان کي صحيح رنگ جي سڃاڻپ ڪرڻ بدران ”ڪاري رڍ“ جي اصطلاح سان ڳنڍيندو. ٽوڪن (voken) سان بصري کي شامل ڪرڻ سان، AI سسٽم کي اصطلاحن جي مجموعي سمجھ حاصل ڪري سگھي ٿي. Vokenization vokens کي ضم ڪري ٿو پاڻ جي نگراني ڪيل NLP سسٽم ۾، انهن کي "عام احساس" کي ترقي ڪرڻ جي اجازت ڏئي ٿو.

    ٻوليءَ جي ماڊلز ۽ ڪمپيوٽر وژن کي ضم ڪرڻ ڪو نئون تصور نه آهي، ۽ اهو AI تحقيق ۾ تيزي سان وڌندڙ ميدان آهي. انهن ٻن قسمن جي AI جو ميلاپ انهن جي انفرادي قوتن کي فائدو ڏئي ٿو. ٻوليءَ جا ماڊل جهڙوڪ GPT-3 غير نگراني ٿيل سکيا ذريعي تربيت يافته آهن، جيڪا انهن کي آساني سان ماپڻ جي اجازت ڏئي ٿي. ان جي ابتڙ، تصويري ماڊل جهڙوڪ اعتراض جي سڃاڻپ سسٽم سڌو سنئون حقيقت کان سکي سگهن ٿا ۽ متن پاران مهيا ڪيل تجريد تي ڀروسو نٿا ڪن. مثال طور، تصوير جا ماڊل سڃاڻي سگھن ٿا ته رڍ اڇي آھي تصوير کي ڏسي.

    خراب ڪندڙ اثر

    vokenization جو عمل تمام سادو آهي. Vokens ٺاهيا ويا آھن ترتيب ڏيڻ سان لاڳاپيل يا لاڳاپيل تصويرون ٻوليء جي ٽوڪن کي. ان کان پوء، الگورتھم (vokenizer) ٺاهيا ويا آھن آوازن کي پيدا ڪرڻ لاءِ غير نگراني ٿيل سکيا (ڪوبه واضح پيرا ميٽر/ ضابطو نه). عام فهم AI vokenization ذريعي تربيت حاصل ڪري سگهي ٿي گفتگو ڪري سگهي ٿي ۽ مسئلن کي بهتر حل ڪري سگهي ٿي ڇاڪاڻ ته انهن وٽ سياق و سباق جي وڌيڪ کوٽائي آهي. اهو طريقو منفرد آهي ڇاڪاڻ ته اهو نه رڳو ٻولي ٽوڪن جي اڳڪٿي ڪري ٿو پر تصويري ٽوڪن جي به اڳڪٿي ڪري ٿو، جيڪو ڪجهه آهي جيڪو روايتي BERT ماڊل ڪرڻ کان قاصر آهن.

    مثال طور، روبوٽ اسسٽنٽ تصويرن کي سڃاڻڻ ۽ عمل کي بهتر طريقي سان نيويگيٽ ڪرڻ جي قابل هوندا ڇاڪاڻ ته اهي ”ڏس“ سگهن ٿا انهن مان ڇا گهربل آهي. مصنوعي ذهانت وارو نظام جيڪو مواد لکڻ لاءِ تربيت يافته آهي اهي آرٽيڪل ٺاهڻ جي قابل هوندا جيڪي وڌيڪ انساني آواز ڪن ٿا، خيالن سان جيڪي بهتر وهن ٿا، بي ترتيب جملن جي بدران. NLP ايپليڪيشنن جي وسيع پهچ کي نظر ۾ رکندي، ويڪسائيزيشن بهتر ڪارڪردگيءَ واري چيٽ بوٽس، ورچوئل اسسٽنٽ، آن لائن طبي تشخيص، ڊجيٽل مترجم، ۽ وڌيڪ ڪري سگھي ٿي.

    اضافي طور تي، وژن ۽ ٻولي جي سکيا جو ميلاپ طبي تصويري ايپليڪيشنن ۾ مقبوليت حاصل ڪري رهيو آهي، خاص طور تي خودڪار طبي تصوير جي تشخيص لاء. مثال طور، ڪجهه محقق هن طريقي سان تجربا ڪري رهيا آهن ريڊيوگراف تصويرن تي متن جي وضاحتن سان گڏ، جتي لفظي ڀاڱي وقت سازي ٿي سگهي ٿي. vokenization ٽيڪنڪ انهن نمائندگي کي وڌائي سگهي ٿي ۽ ٽيڪسٽ معلومات کي استعمال ڪندي خودڪار طبي تصويري کي بهتر بڻائي سگهي ٿي.

    vokenization لاء درخواستون

    vokenization لاء ڪجهه ايپليڪيشنن ۾ شامل ٿي سگھي ٿي:

    • وجداني چيٽ بوٽس جيڪي پروسيس ڪري سگھن ٿا اسڪرين شاٽ، تصويرون، ۽ ويب سائيٽ جي مواد. ڪسٽمر سپورٽ chatbots، خاص طور تي، شايد قابل ٿي سگھن ٿيون صحيح طور تي پروڊڪٽس ۽ خدمتن جي سفارش ڪن.
    • ڊجيٽل ترجمو ڪندڙ جيڪي تصويرون ۽ وڊيوز کي پروسيس ڪري سگھن ٿا ۽ صحيح ترجمو مهيا ڪري سگھن ٿا جيڪو ثقافتي ۽ صورتحال جي حوالي سان سمجهي ٿو.
    • سوشل ميڊيا بوٽ اسڪينر تصويرن، ڪيپشنز ۽ تبصرن کي ضم ڪندي وڌيڪ مجموعي جذبي جو تجزيو ڪرڻ جي قابل ٿي رهيا آهن. هي ايپليڪيشن مواد جي اعتدال ۾ ڪارائتو ٿي سگهي ٿي جيڪا نقصانڪار تصويرن جي تجزيو جي ضرورت آهي.
    • ڪمپيوٽر ويزن ۽ اين ايل پي مشين لرننگ انجنيئرز ۽ ڊيٽا سائنسدانن لاءِ روزگار جا موقعا وڌائڻ.
    • انهن AI سسٽم تي شروعاتي تعمير ڪرڻ انهن کي تجارتي ڪرڻ يا ڪاروبار لاءِ ڪسٽمائيز حل فراهم ڪرڻ.

    تبصرو ڪرڻ لاء سوال

    • ٻي صورت ۾ توهان ڪيئن ٿا سوچيو ته vokenization تبديل ٿي ويندي ته اسان روبوٽس سان ڪيئن لهه وچڙ ۾ آهيون؟
    • آواز ڪيئن بدلجي سگهي ٿو ته اسان ڪيئن ڪاروبار هلون ۽ اسان جي گيجٽس (اسمارٽ فونز ۽ سمارٽ اپلائنسز) سان لهه وچڙ ۾ هلون؟

    بصيرت جا حوالا

    هيٺ ڏنل مشهور ۽ ادارتي لنڪ هن بصيرت لاء حوالو ڏنو ويو آهي: