Vokenizasiya: AI-nin görə biləcəyi dil

ŞƏKİL KREDİTİ:
Şəkil krediti
iStock

Vokenizasiya: AI-nin görə biləcəyi dil

Vokenizasiya: AI-nin görə biləcəyi dil

Alt başlıq mətni
Artıq süni intellekt (AI) sistemlərinin təliminə daxil edilən şəkillərlə robotlar tezliklə əmrləri "görə" bilər.
    • Author:
    • Author adı
      Quantumrun Uzaqgörməsi
    • 9 May 2023

    Təbii dil emalı (NLP) süni intellekt (AI) sistemlərinə sözləri başa düşmək və kontekstlə əhval-ruhiyyəni uyğunlaşdırmaqla insan nitqini öyrənməyə imkan verib. Yeganə mənfi cəhət odur ki, bu NLP sistemləri sırf mətn əsaslıdır. Vokenizasiya bütün bunları dəyişdirmək üzrədir.

    Vokenizasiya konteksti

    İnsan dilini emal etmək və başa düşmək üçün süni intellektə öyrətmək üçün tez-tez iki mətn əsaslı maşın öyrənməsi (ML) proqramı istifadə olunur: OpenAI-nin Generativ Öncədən Təlimli Transformator 3 (GPT-3) və Google-un BERT (Transformers-dən Bidirectional Encoder Representations). Süni intellekt terminologiyasında NLP təlimində istifadə olunan sözlər token adlanır. Şimali Karolina Universitetinin (UNC) tədqiqatçıları qeyd ediblər ki, mətn əsaslı təlim proqramları məhduddur, çünki onlar "görə bilmirlər", yəni vizual məlumat və ünsiyyəti ələ keçirə bilmirlər. 

    Məsələn, kimsə GPT-3-dən qoyunun rənginin nə olduğunu soruşsa, sistem açıq-aydın ağ olsa belə, çox vaxt "qara" cavabını verəcəkdir. Bu cavab ona görədir ki, mətn əsaslı sistem düzgün rəngi müəyyən etmək əvəzinə onu "qara qoyun" termini ilə əlaqələndirəcək. Vizualları ayələr (voken) ilə birləşdirməklə, AI sistemləri terminləri vahid şəkildə başa düşə bilər. Vokenizasiya vokenləri öz-özünə idarə olunan NLP sistemlərinə inteqrasiya edərək, onlara "sağlam düşüncəni" inkişaf etdirməyə imkan verir.

    Dil modellərinin və kompüter görmə qabiliyyətinin inteqrasiyası yeni konsepsiya deyil və bu, süni intellekt tədqiqatında sürətlə genişlənən sahədir. Bu iki növ AI-nin birləşməsi onların fərdi güclü tərəflərindən istifadə edir. GPT-3 kimi dil modelləri nəzarətsiz öyrənmə yolu ilə öyrədilir ki, bu da onlara asanlıqla miqyas almağa imkan verir. Bunun əksinə olaraq, obyekt tanıma sistemləri kimi təsvir modelləri reallıqdan birbaşa öyrənə bilər və mətnin təqdim etdiyi abstraksiyaya etibar etmir. Məsələn, şəkil modelləri qoyunun ağ olduğunu şəklə baxaraq tanıya bilər.

    Dağıdıcı təsir

    Vokenizasiya prosesi olduqca sadədir. Vokenlər dil işarələrinə uyğun və ya uyğun təsvirlər təyin etməklə yaradılır. Sonra, alqoritmlər (vokenizer) nəzarətsiz öyrənmə (açıq parametrlər/qaydalar) vasitəsilə vokenlər yaratmaq üçün nəzərdə tutulmuşdur. Səsləndirmə yolu ilə öyrədilmiş sağlam düşüncəli süni intellekt daha yaxşı ünsiyyət qura və problemləri həll edə bilər, çünki onlar kontekst haqqında daha dərindən anlayışa malikdirlər. Bu yanaşma unikaldır, çünki o, təkcə dil işarələrini proqnozlaşdırmaqla yanaşı, ənənəvi BERT modellərinin edə bilmədiyi bir şey olan görüntü işarələrini də proqnozlaşdırır.

    Məsələn, robot köməkçilər şəkilləri tanıya və prosesləri daha yaxşı idarə edə biləcəklər, çünki onlardan nə tələb olunduğunu “görə” bilərlər. Məzmun yazmaq üçün öyrədilmiş süni intellekt sistemləri ayrı-ayrı cümlələr yerinə daha insani səslənən, daha yaxşı axan ideyalarla məqalələr hazırlaya biləcək. NLP tətbiqlərinin geniş əhatə dairəsini nəzərə alsaq, vokenizasiya daha yaxşı performans göstərən chatbotlara, virtual köməkçilərə, onlayn tibbi diaqnozlara, rəqəmsal tərcüməçilərə və s.

    Bundan əlavə, görmə və dil öyrənmənin birləşməsi tibbi görüntüləmə tətbiqlərində, xüsusən də avtomatlaşdırılmış tibbi görüntü diaqnostikası üçün populyarlıq qazanır. Məsələn, bəzi tədqiqatçılar semantik seqmentasiyanın çox vaxt apara biləcəyi müşayiət olunan mətn təsvirləri ilə radioqrafiya şəkillərində bu yanaşma ilə təcrübə aparırlar. Vokenizasiya texnikası bu təsvirləri təkmilləşdirə və mətn məlumatından istifadə etməklə avtomatlaşdırılmış tibbi təsviri təkmilləşdirə bilər.

    Vokenizasiya üçün ərizələr

    Vokenizasiya üçün bəzi tətbiqlərə aşağıdakılar daxil ola bilər:

    • Ekran görüntülərini, şəkilləri və veb sayt məzmununu emal edə bilən intuitiv chatbotlar. Xüsusilə müştəri dəstəyi chatbotları məhsul və xidmətləri dəqiq tövsiyə edə bilər.
    • Şəkil və videoları emal edə bilən və mədəni və situasiya kontekstini nəzərə alan dəqiq tərcüməni təmin edən rəqəmsal tərcüməçilər.
    • Sosial media bot skanerləri şəkilləri, başlıqları və şərhləri birləşdirərək daha vahid əhval-ruhiyyə təhlili apara bilir. Bu proqram zərərli şəkillərin təhlilini tələb edən məzmun moderasiyasında faydalı ola bilər.
    • Kompüter görmə və NLP maşın öyrənmə mühəndisləri və məlumat alimləri üçün iş imkanlarının artırılması.
    • Bu AI sistemləri üzərində qurulan startaplar onları kommersiyalaşdırmaq və ya biznes üçün fərdi həllər təqdim etmək.

    Şərh etmək üçün suallar

    • Sizcə, vokenizasiya robotlarla qarşılıqlı əlaqəmizi necə dəyişəcək?
    • Səsləndirmə işimizi və qadcetlərimizlə (smartfonlar və ağıllı cihazlar) qarşılıqlı əlaqəmizi necə dəyişə bilər?

    Anlayış istinadları

    Bu fikir üçün aşağıdakı məşhur və institusional bağlantılara istinad edilmişdir: