Дауыстандыру: AI көре алатын тіл

Кредит суреті:
Сурет несиесі
iStock

Дауыстандыру: AI көре алатын тіл

Дауыстандыру: AI көре алатын тіл

Тақырып мәтіні
Суреттер қазір жасанды интеллект (AI) жүйелерін оқытуға енгізілгендіктен, роботтар жақын арада командаларды «көре» алады.
    • автор:
    • Автордың аты-жөні
      Кванттық болжау
    • Мамыр 9, 2023

    Табиғи тілді өңдеу (NLP) жасанды интеллект (AI) жүйелеріне сөздерді түсіну және контекстті сезіммен сәйкестендіру арқылы адамның сөйлеуін үйренуге мүмкіндік берді. Жалғыз кемшілігі - бұл NLP жүйелері тек мәтінге негізделген. Вокенизация мұның бәрін өзгертеді.

    Вокенизация контекст

    Екі мәтінге негізделген машиналық оқыту (ML) бағдарламасы AI-ны адам тілін өңдеуге және түсінуге үйрету үшін жиі пайдаланылады: OpenAI's Generative Pre-trained Transformer 3 (GPT-3) және Google компаниясының BERT (Transformers екі бағытты кодтаушы өкілдіктері). AI терминологиясында NLP тренингінде қолданылатын сөздер токендер деп аталады. Солтүстік Каролина университетінің (UNC) зерттеушілері мәтінге негізделген оқу бағдарламалары шектеулі екенін байқады, өйткені олар «көре алмайды», яғни олар көрнекі ақпарат пен коммуникацияны ала алмайды. 

    Мысалы, егер біреу GPT-3-тен қойдың түсі қандай деп сұраса, жүйе анық ақ болса да, жиі «қара» деп жауап береді. Бұл жауап мәтінге негізделген жүйе оны дұрыс түсті анықтаудың орнына «қара қой» терминімен байланыстыратындықтан. Көрнекі бейнелерді таңбалауыштармен (вокер) қосу арқылы AI жүйелері терминдерді тұтас түсінуге ие болады. Вокенизация вокендерді өзін-өзі басқаратын NLP жүйелеріне біріктіреді, бұл оларға «сауатты сезімді» дамытуға мүмкіндік береді.

    Тілдік модельдерді және компьютерлік көруді біріктіру жаңа тұжырымдама емес және бұл AI зерттеулеріндегі қарқынды дамып келе жатқан сала. Осы екі АИ түрінің үйлесімі олардың жеке күшті жақтарын пайдаланады. GPT-3 сияқты тіл үлгілері бақылаусыз оқыту арқылы оқытылады, бұл оларға оңай масштабтауға мүмкіндік береді. Керісінше, нысанды тану жүйелері сияқты кескін модельдері шындықтан тікелей сабақ ала алады және мәтінмен қамтамасыз етілген абстракцияға сенбейді. Мысалы, кескін модельдері суретке қарап қойдың ақ екенін тани алады.

    Деструктивті әсер

    Дауыс беру процесі өте қарапайым. Вокендер тілдік лексемаларға сәйкес немесе сәйкес кескіндерді тағайындау арқылы жасалады. Содан кейін, алгоритмдер (вокенизатор) бақылаусыз оқыту арқылы дауыстарды генерациялауға арналған (анық параметрлер/ережелер жоқ). Дауыс беру арқылы үйретілген ақылды AI проблемаларды жақсырақ шеше алады, өйткені олар контекстті тереңірек түсінеді. Бұл тәсіл бірегей, өйткені ол тек тілдік таңбалауыштарды болжап қана қоймайды, сонымен қатар кескін таңбалауыштарын болжайды, бұл дәстүрлі BERT үлгілері жасай алмайтын нәрсе.

    Мысалы, роботтық көмекшілер кескіндерді тани алады және процестерді жақсырақ басқара алады, өйткені олар олардан не талап етілетінін «көре алады». Мазмұнды жазуға үйретілген жасанды интеллект жүйелері бөлінбеген сөйлемдердің орнына жақсырақ ағынды идеялары бар, адамға көбірек ұқсайтын мақалаларды жасай алады. NLP қолданбаларының кең ауқымын ескере отырып, вокенизация жақсырақ жұмыс істейтін чат-боттарға, виртуалды көмекшілерге, онлайн медициналық диагноздарға, сандық аудармашыларға және т.б. әкелуі мүмкін.

    Бұған қоса, көру мен тілді үйренудің үйлесімі медициналық кескіндеме қолданбаларында, әсіресе автоматтандырылған медициналық кескін диагностикасы үшін танымал болуда. Мысалы, кейбір зерттеушілер семантикалық сегментация уақытты қажет ететін ілеспе мәтіндік сипаттамалары бар радиографиялық кескіндерге осы тәсілді тәжірибеден өткізуде. Дауыс беру техникасы осы көріністерді жақсарта алады және мәтіндік ақпаратты пайдалану арқылы автоматтандырылған медициналық бейнелеуді жақсарта алады.

    Дауыс беруге арналған өтініштер

    Дауыс беруге арналған кейбір қосымшалар мыналарды қамтуы мүмкін:

    • Скриншоттарды, суреттерді және веб-сайт мазмұнын өңдей алатын интуитивті чат-боттар. Тұтынушыларды қолдау чат-боттары, атап айтқанда, өнімдер мен қызметтерді дәл ұсына алады.
    • Суреттер мен бейнелерді өңдей алатын және мәдени және ситуациялық контекстті қарастыратын дәл аударманы қамтамасыз ететін сандық аудармашылар.
    • Әлеуметтік медиа бот сканерлері суреттерді, жазуларды және түсініктемелерді біріктіру арқылы толыққанды сезім талдауын жүргізе алады. Бұл қолданба зиянды кескіндерді талдауды қажет ететін мазмұнды модерациялауда пайдалы болуы мүмкін.
    • Компьютерлік көру және NLP машиналық оқыту инженерлері мен деректер ғалымдары үшін жұмысқа орналасу мүмкіндіктерін арттыру.
    • Стартаптар осы AI жүйелерін коммерцияландыру немесе бизнес үшін теңшелген шешімдерді ұсыну үшін құрастырады.

    Түсініктеме беруге арналған сұрақтар

    • Сіздің ойыңызша, вокенизация роботтармен қарым-қатынасымызды қалай өзгертеді?
    • Дауыс беру бизнесті жүргізу және гаджеттермен (смартфондар мен смарт құрылғылар) өзара әрекеттесуді қалай өзгерте алады?

    Инсайт сілтемелері

    Бұл түсінік үшін келесі танымал және институционалдық сілтемелерге сілтеме жасалды: