Vokenization: Ede ti AI le rii

KẸDI Aworan:
Didun aworan
iStock

Vokenization: Ede ti AI le rii

Vokenization: Ede ti AI le rii

Àkọlé àkòrí
Pẹlu awọn aworan ni bayi ti a dapọ si ikẹkọ awọn ọna ṣiṣe itetisi atọwọda (AI), awọn roboti le laipẹ ni anfani lati “wo” awọn aṣẹ.
    • Nipa Author:
    • Orukọ onkọwe
      Quantumrun Iwoju
    • O le 9, 2023

    Ṣiṣẹda ede Adayeba (NLP) ti mu awọn ọna ṣiṣe itetisi atọwọda (AI) ṣiṣẹ lati kọ ẹkọ ọrọ eniyan nipa agbọye awọn ọrọ ati ipo ibaramu pẹlu itara naa. Ilọkuro nikan ni pe awọn eto NLP wọnyi jẹ orisun-ọrọ nikan. Vokenization jẹ nipa lati yi gbogbo awọn ti o.

    Ọrọ sisọ ọrọ

    Awọn eto ikẹkọ orisun-ọrọ meji (ML) nigbagbogbo ni a lo lati ṣe ikẹkọ AI lati ṣe ilana ati loye ede eniyan: OpenAI's Generative Pre-trained Transformer 3 (GPT-3) ati Google's BERT (Awọn Aṣoju Encoder Bidirectional lati Awọn Ayirapada). Ni awọn ọrọ AI, awọn ọrọ ti a lo ninu ikẹkọ NLP ni a pe ni awọn ami-ami. Awọn oniwadi lati Ile-ẹkọ giga ti North Carolina (UNC) ṣe akiyesi pe awọn eto ikẹkọ ti o da lori ọrọ jẹ opin nitori wọn ko le “ri,” afipamo pe wọn ko le gba alaye wiwo ati ibaraẹnisọrọ. 

    Fun apẹẹrẹ, ti ẹnikan ba beere GPT-3 kini awọ ti agutan jẹ, eto naa yoo dahun nigbagbogbo "dudu" paapaa ti o ba jẹ funfun. Idahun yii jẹ nitori eto ti o da lori ọrọ yoo so pọ mọ ọrọ naa “agutan dudu” dipo idamo awọ to pe. Nipa iṣakojọpọ awọn wiwo pẹlu awọn ami (voken), awọn eto AI le ni oye pipe ti awọn ofin. Vokenization ṣepọ awọn vokens sinu awọn ọna ṣiṣe NLP ti ara ẹni, gbigba wọn laaye lati ṣe idagbasoke “ori ti o wọpọ.”

    Ṣiṣepọ awọn awoṣe ede ati iran kọnputa kii ṣe imọran tuntun, ati pe o jẹ aaye ti o pọ si ni iyara ni iwadii AI. Ijọpọ ti awọn iru meji ti AI n mu awọn agbara kọọkan wọn ṣiṣẹ. Awọn awoṣe ede bii GPT-3 jẹ ikẹkọ nipasẹ ikẹkọ ti ko ni abojuto, eyiti o fun wọn laaye lati ṣe iwọn ni irọrun. Ni idakeji, awọn awoṣe aworan bi awọn ọna ṣiṣe idanimọ ohun le kọ ẹkọ taara lati otito ati ki o ma ṣe gbẹkẹle abstraction ti a pese nipasẹ ọrọ naa. Fun apẹẹrẹ, awọn awoṣe aworan le ṣe akiyesi pe agutan kan funfun nipa wiwo aworan kan.

    Ipa idalọwọduro

    Awọn ilana ti vokenization jẹ lẹwa qna. Vokens ni a ṣẹda nipasẹ fifi awọn aworan ti o baamu tabi ti o yẹ si awọn ami ede. Lẹhinna, awọn algoridimu (vokenizer) jẹ apẹrẹ lati ṣe agbejade awọn vokens nipasẹ ẹkọ ti ko ni abojuto (ko si awọn ayeraye / awọn ofin ti o han gbangba). Imọye ti o wọpọ AI ikẹkọ nipasẹ vokenization le ṣe ibasọrọ ati yanju awọn iṣoro dara julọ nitori wọn ni oye ti o jinlẹ diẹ sii ti ọrọ-ọrọ. Ọna yii jẹ alailẹgbẹ nitori pe kii ṣe asọtẹlẹ awọn ami ede nikan ṣugbọn tun sọ asọtẹlẹ awọn ami aworan, eyiti o jẹ nkan ti awọn awoṣe BERT ti aṣa ko le ṣe.

    Fun apẹẹrẹ, awọn oluranlọwọ roboti yoo ni anfani lati ṣe idanimọ awọn aworan ati lilọ kiri awọn ilana dara julọ nitori wọn le “wo” ohun ti o nilo fun wọn. Awọn eto itetisi atọwọdọwọ ti a kọ lati kọ akoonu yoo ni anfani lati ṣe iṣẹ ọwọ awọn nkan ti o dun eniyan diẹ sii, pẹlu awọn imọran ti o ṣan daradara, dipo awọn gbolohun ọrọ ti o pin. Ṣiyesi arọwọto jakejado ti awọn ohun elo NLP, vokenization le ja si awọn chatbots ti n ṣiṣẹ daradara, awọn oluranlọwọ foju, awọn iwadii iṣoogun ori ayelujara, awọn onitumọ oni nọmba, ati diẹ sii.

    Ni afikun, apapọ iran ati ẹkọ ede n gba olokiki ni awọn ohun elo aworan iṣoogun, pataki fun iwadii aworan iṣoogun adaṣe. Fun apẹẹrẹ, diẹ ninu awọn oniwadi n ṣe idanwo pẹlu ọna yii lori awọn aworan redio pẹlu awọn apejuwe ọrọ ti o tẹle, nibiti ipin itumọ le jẹ akoko-n gba. Ilana vokenization le mu awọn aṣoju wọnyi pọ si ati ilọsiwaju aworan iṣoogun adaṣe nipa lilo alaye ọrọ naa.

    Awọn ohun elo fun vokenization

    Diẹ ninu awọn ohun elo fun vokenization le pẹlu:

    • Awọn botini ti o ni oye ti o le ṣe ilana awọn sikirinisoti, awọn aworan, ati akoonu oju opo wẹẹbu. Awọn chatbots atilẹyin alabara, ni pataki, le ni anfani lati ṣeduro awọn ọja ati iṣẹ ni deede.
    • Awọn onitumọ oni nọmba ti o le ṣe ilana awọn aworan ati awọn fidio ati pese itumọ deede ti o ni imọran aṣa ati ipo ipo.
    • Awọn aṣayẹwo bot media awujọ ni anfani lati ṣe itupalẹ itara pipe diẹ sii nipasẹ sisọpọ awọn aworan, awọn akọle, ati awọn asọye. Ohun elo yii le wulo ni iwọntunwọnsi akoonu ti o nilo itupalẹ awọn aworan ipalara.
    • Alekun awọn aye oojọ fun iran kọnputa ati awọn onimọ-ẹrọ ikẹkọ ẹrọ NLP ati awọn onimọ-jinlẹ data.
    • Awọn ibẹrẹ ti n kọ lori awọn eto AI wọnyi lati ṣe iṣowo wọn tabi pese awọn solusan adani fun awọn iṣowo.

    Awọn ibeere lati sọ asọye

    • Bawo ni ohun miiran ti o ro vokenization yoo yi bi a ti nlo pẹlu awọn roboti?
    • Bawo ni vokenization ṣe le yipada bawo ni a ṣe nṣe iṣowo ati ṣe ajọṣepọ pẹlu awọn ohun elo wa (awọn foonu alagbeka ati awọn ohun elo ọlọgbọn)?

    Awọn itọkasi oye

    Awọn ọna asopọ olokiki ati ti ile-iṣẹ wọnyi ni itọkasi fun oye yii: