Vokenizzazzjoni: Lingwa li l-AI tista' tara

KREDITU TAL-IMMAĠNI:
Immaġni kreditu
iStock

Vokenizzazzjoni: Lingwa li l-AI tista' tara

Vokenizzazzjoni: Lingwa li l-AI tista' tara

Test tas-subintestatura
Bl-immaġini li issa qed jiġu inkorporati fit-taħriġ tas-sistemi tal-intelliġenza artifiċjali (AI), ir-robots jistgħu dalwaqt ikunu jistgħu "jaraw" kmandi.
    • awtur:
    • isem awtur
      Quantumrun Foresight
    • Jista 9, 2023

    L-ipproċessar tal-lingwa naturali (NLP) ippermetta lis-sistemi tal-intelliġenza artifiċjali (AI) jitgħallmu diskors uman billi jifhmu l-kliem u jqabblu l-kuntest mas-sentiment. L-uniku żvantaġġ huwa li dawn is-sistemi NLP huma purament ibbażati fuq it-test. Il-vokenizzazzjoni waslet biex tbiddel dak kollu.

    Il-kuntest tal-vokenizzazzjoni

    Żewġ programmi ta' tagħlim tal-magni (ML) ibbażati fuq it-test spiss jintużaw biex iħarrġu l-AI biex tipproċessa u tifhem il-lingwa umana: Generative Pre-trained Transformer 3 (GPT-3) ta' OpenAI u BERT ta' Google (Bidirectional Encoder Representations from Transformers). Fit-terminoloġija tal-AI, il-kliem użat fit-taħriġ tal-NLP jissejħu tokens. Riċerkaturi mill-Università ta’ North Carolina (UNC) osservaw li l-programmi ta’ taħriġ ibbażati fuq test huma limitati għax ma jistgħux “jaraw”, jiġifieri ma jistgħux jaqbdu informazzjoni u komunikazzjoni viżiva. 

    Pereżempju, jekk xi ħadd jistaqsi lil GPT-3 x'inhu l-kulur tan-nagħaġ, is-sistema ta 'spiss twieġeb "iswed" anki jekk tkun abjad ċar. Din it-tweġiba hija minħabba li s-sistema bbażata fuq it-test se tassoċjaha mat-terminu "nagħaġ iswed" minflok tidentifika l-kulur korrett. Billi jinkorporaw viżwali ma 'tokens (voken), is-sistemi AI jista' jkollhom fehim olistiku tat-termini. Il-vokenizzazzjoni tintegra l-vokens f'sistemi NLP sorveljati waħedhom, u tippermettilhom jiżviluppaw "sens komun."

    L-integrazzjoni tal-mudelli tal-lingwa u l-viżjoni bil-kompjuter mhijiex kunċett ġdid, u huwa qasam li qed jespandi malajr fir-riċerka tal-AI. Il-kombinazzjoni ta 'dawn iż-żewġ tipi ta' AI tissaħħaħ is-saħħiet individwali tagħhom. Mudelli lingwistiċi bħal GPT-3 huma mħarrġa permezz ta 'tagħlim mhux sorveljat, li jippermettilhom skala faċilment. B'kuntrast, mudelli ta 'immaġni bħal sistemi ta' rikonoxximent ta 'oġġetti jistgħu jitgħallmu direttament mir-realtà u ma jiddependux fuq l-astrazzjoni pprovduta mit-test. Pereżempju, mudelli taʼ immaġni jistgħu jagħrfu li nagħġa hija bajda billi tħares lejn stampa.

    Impatt li jfixkel

    Il-proċess ta 'vokenization huwa pjuttost sempliċi. Il-vokens jinħolqu billi jiġu assenjati immaġini korrispondenti jew rilevanti lil tokens tal-lingwa. Imbagħad, algoritmi (vokenizer) huma ddisinjati biex jiġġeneraw vokens permezz ta 'tagħlim mhux sorveljat (l-ebda parametri/regoli espliċiti). L-AI tas-sens komun imħarrġa permezz tal-vokenizzazzjoni tista 'tikkomunika u ssolvi l-problemi aħjar minħabba li għandhom fehim aktar fil-fond tal-kuntest. Dan l-approċċ huwa uniku għaliex mhux biss ibassar tokens tal-lingwa iżda wkoll ibassar tokens tal-immaġni, li hija xi ħaġa li mudelli tradizzjonali BERT ma jistgħux jagħmlu.

    Pereżempju, l-assistenti robotiċi jkunu jistgħu jagħrfu l-immaġini u jinnavigaw il-proċessi aħjar minħabba li jistgħu "jaraw" dak li hu meħtieġ minnhom. Sistemi ta’ intelliġenza artifiċjali mħarrġa biex jiktbu kontenut se jkunu jistgħu jfasslu artikli li jinstemgħu aktar umani, b’ideat li jiċċirkolaw aħjar, minflok sentenzi magħquda. Meta wieħed iqis il-firxa wiesgħa tal-applikazzjonijiet NLP, il-vokenizzazzjoni tista 'twassal għal chatbots ta' prestazzjoni aħjar, assistenti virtwali, dijanjosi mediċi onlajn, tradutturi diġitali, u aktar.

    Barra minn hekk, il-kombinazzjoni tal-viżjoni u t-tagħlim tal-lingwa qed tikseb popolarità fl-applikazzjonijiet tal-immaġini mediċi, speċifikament għad-dijanjosi awtomatizzata tal-immaġni medika. Pereżempju, xi riċerkaturi qed jesperimentaw b'dan l-approċċ fuq immaġini radjografiċi b'deskrizzjonijiet ta 'test li jakkumpanjaw, fejn is-segmentazzjoni semantika tista' tieħu ħafna ħin. It-teknika ta 'vokenization tista' ttejjeb dawn ir-rappreżentazzjonijiet u ttejjeb l-immaġini mediċi awtomatizzati billi tuża l-informazzjoni tat-test.

    Applikazzjonijiet għal vokenizzazzjoni

    Xi applikazzjonijiet għall-vokenizzazzjoni jistgħu jinkludu:

    • Chatbots intuwittivi li jistgħu jipproċessaw screenshots, stampi u kontenut tal-websajt. Chatbots ta 'appoġġ għall-klijenti, b'mod partikolari, jistgħu jkunu kapaċi jirrakkomandaw b'mod preċiż prodotti u servizzi.
    • Tradutturi diġitali li jistgħu jipproċessaw immaġini u vidjows u jipprovdu traduzzjoni preċiża li tqis il-kuntest kulturali u tas-sitwazzjoni.
    • L-iskaners tal-bot tal-midja soċjali li jkunu jistgħu jwettqu analiżi tas-sentiment aktar olistiku billi jingħaqdu immaġini, captions, u kummenti. Din l-applikazzjoni tista 'tkun utli fil-moderazzjoni tal-kontenut li teħtieġ l-analiżi ta' immaġini ta 'ħsara.
    • Żieda fl-opportunitajiet ta’ impjieg għal inġiniera tal-viżjoni bil-kompjuter u NLP tat-tagħlim tal-magni u xjentisti tad-dejta.
    • Startups li jibnu fuq dawn is-sistemi AI biex jikkummerċjalizzawhom jew jipprovdu soluzzjonijiet personalizzati għan-negozji.

    Mistoqsijiet biex tikkummenta dwarhom

    • Kif inkella taħseb li l-vokenizzazzjoni se tbiddel kif aħna jinteraġixxu mar-robots?
    • Kif tista' tbiddel il-vokenizzazzjoni kif inwettqu n-negozju u jinteraġixxu mal-aġġeġġi tagħna (smartphones u apparat intelliġenti)?

    Referenzi ta' għarfien

    Ir-rabtiet popolari u istituzzjonali li ġejjin ġew referenzjati għal din l-għarfien: