Vokenization. Լեզուն, որը AI-ն կարող է տեսնել

ՊԱՏԿԵՐԻ ՎԱՐԿ.
Image վարկային
iStock- ը

Vokenization. Լեզուն, որը AI-ն կարող է տեսնել

Vokenization. Լեզուն, որը AI-ն կարող է տեսնել

Ենթավերնագրի տեքստը
Քանի որ պատկերներն այժմ ներառված են արհեստական ​​ինտելեկտի (AI) համակարգերի ուսուցման մեջ, ռոբոտները շուտով կարող են «տեսնել» հրամանները:
    • Հեղինակ:
    • Հեղինակ անունը
      Quantumrun Հեռատեսություն
    • Թող 9, 2023

    Բնական լեզվի մշակումը (NLP) արհեստական ​​ինտելեկտի (AI) համակարգերին հնարավորություն է ընձեռել սովորել մարդկային խոսքը՝ հասկանալով բառերը և համատեքստը համապատասխանեցնելով զգացմունքներին: Միակ բացասական կողմն այն է, որ այս NLP համակարգերը զուտ տեքստային են: Vokenization-ը պատրաստվում է փոխել այդ ամենը:

    Վոկենիզացիայի համատեքստ

    Տեքստի վրա հիմնված մեքենայական ուսուցման (ML) երկու ծրագրեր հաճախ օգտագործվում են AI-ին մարդու լեզուն մշակելու և հասկանալու համար սովորեցնելու համար՝ OpenAI-ի Generative Pre-trained Transformer 3 (GPT-3) և Google-ի BERT (Երկուղղորդված կոդավորիչի ներկայացում Transformers-ից): AI տերմինաբանության մեջ NLP թրեյնինգում օգտագործվող բառերը կոչվում են նշաններ: Հյուսիսային Կարոլինայի համալսարանի (UNC) հետազոտողները նկատել են, որ տեքստի վրա հիմնված վերապատրաստման ծրագրերը սահմանափակ են, քանի որ նրանք չեն կարող «տեսնել», ինչը նշանակում է, որ նրանք չեն կարող գրավել տեսողական տեղեկատվություն և հաղորդակցություն: 

    Օրինակ, եթե ինչ-որ մեկը հարցնի GPT-3-ին, թե որն է ոչխարի գույնը, համակարգը հաճախ կպատասխանի «սև», նույնիսկ եթե այն հստակ սպիտակ է: Այս պատասխանը պայմանավորված է նրանով, որ տեքստի վրա հիմնված համակարգը այն կապելու է «սև ոչխար» տերմինի հետ՝ ճիշտ գույնը որոշելու փոխարեն: Ներառելով վիզուալները նշանների հետ (voken), AI համակարգերը կարող են ունենալ տերմինների ամբողջական պատկերացում: Vokenization-ը ինտեգրում է վոկենները ինքնուրույն վերահսկվող NLP համակարգերի մեջ՝ թույլ տալով նրանց զարգացնել «ողջախոհությունը»:

    Լեզուների մոդելների և համակարգչային տեսլականի ինտեգրումը նոր հայեցակարգ չէ, և այն արագորեն ընդլայնվող ոլորտ է AI հետազոտության մեջ: Այս երկու տեսակի AI-ի համադրությունը նպաստում է նրանց անհատական ​​ուժեղ կողմերին: Լեզուների այնպիսի մոդելներ, ինչպիսին է GPT-3-ը, վերապատրաստվում են չվերահսկվող ուսուցման միջոցով, ինչը թույլ է տալիս նրանց հեշտությամբ մասշտաբել: Ի հակադրություն, պատկերների մոդելները, ինչպիսիք են օբյեկտների ճանաչման համակարգերը, կարող են ուղղակիորեն դասեր քաղել իրականությունից և չեն հիմնվում տեքստի կողմից տրամադրված վերացականության վրա: Օրինակ, պատկերի մոդելները կարող են ճանաչել, որ ոչխարը սպիտակ է` նայելով նկարին:

    Խանգարող ազդեցություն

    Ձայնացման գործընթացը բավականին պարզ է: Վոկենները ստեղծվում են լեզվական նշաններին համապատասխան կամ համապատասխան պատկերներ վերագրելով: Այնուհետև ալգորիթմները (վոկենիզատոր) նախագծված են չվերահսկվող ուսուցման միջոցով ձայներ ստեղծելու համար (առանց հստակ պարամետրերի/կանոնների): Վոկենիզացիայի միջոցով վարժեցված ողջախոհ AI-ն կարող է ավելի լավ հաղորդակցվել և լուծել խնդիրները, քանի որ նրանք ավելի խորն են հասկանում համատեքստը: Այս մոտեցումը եզակի է, քանի որ այն ոչ միայն կանխագուշակում է լեզվական նշանները, այլև կանխատեսում է պատկերի նշաններ, ինչը ավանդական BERT մոդելներն անկարող են անել:

    Օրինակ, ռոբոտ օգնականները կկարողանան ճանաչել պատկերները և ավելի լավ կողմնորոշվել գործընթացներում, քանի որ նրանք կարող են «տեսնել» այն, ինչ պահանջվում է նրանցից: Արհեստական ​​ինտելեկտի համակարգերը, որոնք պատրաստված են բովանդակություն գրելու համար, կկարողանան ստեղծել հոդվածներ, որոնք ավելի մարդկային են հնչում, գաղափարներով, որոնք ավելի լավ են հոսում, այլ ոչ թե տարանջատված նախադասությունների: Հաշվի առնելով NLP հավելվածների լայն հասանելիությունը՝ վոկենիզացիան կարող է հանգեցնել ավելի լավ կատարող չաթ-բոտերի, վիրտուալ օգնականների, առցանց բժշկական ախտորոշումների, թվային թարգմանիչների և այլնի:

    Բացի այդ, տեսողության և լեզվի ուսուցման համադրությունը դառնում է ժողովրդականություն բժշկական պատկերազարդման հավելվածներում, հատկապես բժշկական պատկերների ավտոմատ ախտորոշման համար: Օրինակ, որոշ հետազոտողներ փորձարկում են այս մոտեցումը ռադիոգրաֆիայի պատկերների վրա՝ ուղեկցող տեքստային նկարագրություններով, որտեղ իմաստային հատվածավորումը կարող է ժամանակատար լինել: Վոկենիզացիայի տեխնիկան կարող է ուժեղացնել այս ներկայացումները և բարելավել ավտոմատացված բժշկական պատկերավորումը՝ օգտագործելով տեքստային տեղեկատվությունը:

    Վոկենիզացիայի դիմումներ

    Վոկենիզացիայի որոշ հավելվածներ կարող են ներառել.

    • Ինտուիտիվ չաթ-բոտեր, որոնք կարող են մշակել սքրինշոթներ, նկարներ և կայքի բովանդակություն: Հաճախորդների աջակցման չաթ-բոտերը, մասնավորապես, կարող են ճշգրիտ առաջարկել ապրանքներն ու ծառայությունները:
    • Թվային թարգմանիչներ, որոնք կարող են մշակել պատկերներ և տեսանյութեր և ապահովել ճշգրիտ թարգմանություն՝ հաշվի առնելով մշակութային և իրավիճակային համատեքստը:
    • Սոցիալական լրատվամիջոցների բոտ սկաներները կարող են ավելի ամբողջական տրամադրությունների վերլուծություն իրականացնել՝ միաձուլելով պատկերները, ենթագրերը և մեկնաբանությունները: Այս հավելվածը կարող է օգտակար լինել բովանդակության չափավորության մեջ, որը պահանջում է վնասակար պատկերների վերլուծություն:
    • Համակարգչային տեսողության և NLP մեքենայական ուսուցման ինժեներների և տվյալների գիտնականների աշխատանքի հնարավորությունների ավելացում:
    • Այս AI համակարգերի վրա հիմնված ստարտափներ՝ դրանք առևտրայնացնելու կամ բիզնեսի համար հարմարեցված լուծումներ տրամադրելու համար:

    Հարցեր մեկնաբանելու համար

    • Ի՞նչ եք կարծում, այլ կերպ վոկենիզացիան կփոխի մեր փոխազդեցությունը ռոբոտների հետ:
    • Ինչպե՞ս կարող է վոկենիզացիան փոխել, թե ինչպես ենք մենք վարում բիզնեսը և փոխազդում մեր գաջեթների հետ (սմարթֆոններ և խելացի սարքեր):

    Insight հղումներ

    Հետևյալ հանրաճանաչ և ինստիտուցիոնալ հղումները վկայակոչվել են այս պատկերացման համար.