Vokenization៖ ភាសាដែល AI អាចមើលឃើញ

ឥណទានរូបភាព៖
ឥណទានរូបភាព
iStock

Vokenization៖ ភាសាដែល AI អាចមើលឃើញ

Vokenization៖ ភាសាដែល AI អាចមើលឃើញ

អត្ថបទចំណងជើងរង
ជាមួយនឹងរូបភាពឥឡូវនេះត្រូវបានដាក់បញ្ចូលទៅក្នុងប្រព័ន្ធឆ្លាតវៃសិប្បនិម្មិត (AI) ការបណ្តុះបណ្តាល មនុស្សយន្តអាចនឹងអាច "មើលឃើញ" ពាក្យបញ្ជាក្នុងពេលឆាប់ៗនេះ។
    • អ្នកនិពន្ធ:
    • ឈ្មោះអ្នកនិពន្ធ
      ការទស្សន៍ទាយ Quantumrun
    • ថ្ងៃទី 9 ខែ ឧសភា ឆ្នាំ 2023

    ដំណើរការភាសាធម្មជាតិ (NLP) បានបើកដំណើរការប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) ដើម្បីរៀនការនិយាយរបស់មនុស្សដោយការយល់ដឹងពាក្យ និងបរិបទដែលត្រូវគ្នាជាមួយនឹងមនោសញ្ចេតនា។ គុណវិបត្តិតែមួយគត់គឺថាប្រព័ន្ធ NLP ទាំងនេះគឺផ្អែកលើអត្ថបទសុទ្ធសាធ។ Vokenization ហៀបនឹងផ្លាស់ប្តូរអ្វីៗទាំងអស់។

    បរិបទ Vokenization

    កម្មវិធីសិក្សាម៉ាស៊ីនអត្ថបទ (ML) ចំនួនពីរត្រូវបានគេប្រើជាញឹកញាប់ដើម្បីបណ្តុះបណ្តាល AI ដើម្បីដំណើរការ និងយល់ភាសាមនុស្ស៖ OpenAI's Generative Pre-trained Transformer 3 (GPT-3) និង BERT របស់ Google (តំណាងអ៊ិនកូដទ្វេទិសពី Transformers) ។ នៅក្នុងវាក្យស័ព្ទ AI ពាក្យដែលប្រើក្នុងការបណ្តុះបណ្តាល NLP ត្រូវបានគេហៅថាសញ្ញាសម្ងាត់។ អ្នកស្រាវជ្រាវមកពីសាកលវិទ្យាល័យ North Carolina (UNC) បានសង្កេតឃើញថា កម្មវិធីបណ្តុះបណ្តាលផ្អែកលើអត្ថបទមានកម្រិត ដោយសារពួកគេមិនអាច "មើលឃើញ" មានន័យថា ពួកគេមិនអាចចាប់យកព័ត៌មានដែលមើលឃើញ និងការទំនាក់ទំនងបានទេ។ 

    ជាឧទាហរណ៍ ប្រសិនបើនរណាម្នាក់សួរ GPT-3 ថាតើពណ៌របស់ចៀមជាអ្វី ប្រព័ន្ធនឹងឆ្លើយជាញឹកញាប់ថា "ខ្មៅ" ទោះបីជាវាមានពណ៌សយ៉ាងច្បាស់ក៏ដោយ។ ការឆ្លើយតបនេះគឺដោយសារតែប្រព័ន្ធផ្អែកលើអត្ថបទនឹងភ្ជាប់វាជាមួយពាក្យ "ចៀមខ្មៅ" ជំនួសឱ្យការកំណត់អត្តសញ្ញាណពណ៌ត្រឹមត្រូវ។ តាមរយៈការបញ្ចូលរូបភាពជាមួយសញ្ញាសម្ងាត់ (ហៅកាត់) ប្រព័ន្ធ AI អាចមានការយល់ដឹងរួមអំពីពាក្យ។ Vokenization រួមបញ្ចូល vokens ទៅក្នុងប្រព័ន្ធ NLP ដែលគ្រប់គ្រងដោយខ្លួនឯង ដែលអនុញ្ញាតឱ្យពួកគេបង្កើត "សុភវិនិច្ឆ័យ" ។

    ការរួមបញ្ចូលគំរូភាសា និងចក្ខុវិស័យកុំព្យូទ័រមិនមែនជាគំនិតថ្មីទេ ហើយវាគឺជាវិស័យដែលពង្រីកយ៉ាងឆាប់រហ័សនៅក្នុងការស្រាវជ្រាវ AI ។ ការរួមបញ្ចូលគ្នានៃ AI ទាំងពីរប្រភេទនេះ បង្កើនភាពខ្លាំងរៀងៗខ្លួនរបស់ពួកគេ។ គំរូភាសាដូចជា GPT-3 ត្រូវបានបណ្តុះបណ្តាលតាមរយៈការរៀនដែលគ្មានការត្រួតពិនិត្យ ដែលអនុញ្ញាតឱ្យពួកគេធ្វើមាត្រដ្ឋានបានយ៉ាងងាយស្រួល។ ផ្ទុយទៅវិញ គំរូរូបភាពដូចជាប្រព័ន្ធសម្គាល់វត្ថុអាចរៀនដោយផ្ទាល់ពីការពិត ហើយមិនពឹងផ្អែកលើអរូបីដែលផ្តល់ដោយអត្ថបទនោះទេ។ ជាឧទាហរណ៍ គំរូរូបភាពអាចទទួលស្គាល់ថាចៀមមានពណ៌សដោយមើលរូបភាព។

    ផលប៉ះពាល់រំខាន

    ដំណើរ​ការ​នៃ​ការ​ហៅ​ឈ្មោះ​គឺ​ជា​ការ​ត្រង់​គួរ​ឱ្យ​កត់​សម្គាល់​។ Vokens ត្រូវ​បាន​បង្កើត​ឡើង​ដោយ​ការ​កំណត់​រូបភាព​ដែល​ត្រូវ​គ្នា​ឬ​ពាក់ព័ន្ធ​ទៅ​នឹង​សញ្ញា​ភាសា។ បន្ទាប់មក algorithms (vokenizer) ត្រូវបានរចនាឡើងដើម្បីបង្កើត vokens តាមរយៈការរៀនដែលគ្មានការត្រួតពិនិត្យ (មិនមានប៉ារ៉ាម៉ែត្រ/ច្បាប់ច្បាស់លាស់)។ សតិអារម្មណ៍ AI ដែលបានទទួលការបណ្តុះបណ្តាលតាមរយៈការបញ្ចេញសំឡេងអាចទំនាក់ទំនង និងដោះស្រាយបញ្ហាបានប្រសើរជាងមុន ដោយសារពួកគេមានការយល់ដឹងកាន់តែស៊ីជម្រៅអំពីបរិបទ។ វិធីសាស្រ្តនេះគឺប្លែកពីគេ ព្រោះវាមិនត្រឹមតែព្យាករណ៍ថូខឹនភាសាប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងព្យាករណ៍ថូខឹនរូបភាព ដែលជាអ្វីដែលគំរូ BERT ប្រពៃណីមិនអាចធ្វើបាន។

    ជាឧទាហរណ៍ ជំនួយការមនុស្សយន្តនឹងអាចសម្គាល់រូបភាព និងរុករកដំណើរការបានប្រសើរជាងមុន ដោយសារពួកគេអាច "មើលឃើញ" នូវអ្វីដែលពួកគេត្រូវការ។ ប្រព័ន្ធបញ្ញាសិប្បនិម្មិតដែលត្រូវបានបណ្តុះបណ្តាលដើម្បីសរសេរខ្លឹមសារនឹងអាចបង្កើតអត្ថបទដែលស្តាប់ទៅមនុស្សកាន់តែច្រើន ជាមួយនឹងគំនិតដែលល្អជាង ជំនួសឱ្យប្រយោគដែលមិនជាប់ពាក់ព័ន្ធ។ ដោយពិចារណាលើវិសាលភាពទូលំទូលាយនៃកម្មវិធី NLP ការហៅឈ្មោះអាចនាំឱ្យដំណើរការ chatbots ដំណើរការប្រសើរជាងមុន ជំនួយការនិម្មិត ការវិនិច្ឆ័យវេជ្ជសាស្ត្រតាមអ៊ីនធឺណិត អ្នកបកប្រែឌីជីថល និងច្រើនទៀត។

    លើសពីនេះទៀត ការរួមបញ្ចូលគ្នានៃចក្ខុវិស័យ និងការរៀនភាសាកំពុងទទួលបានប្រជាប្រិយភាពនៅក្នុងកម្មវិធីរូបភាពវេជ្ជសាស្ត្រ ជាពិសេសសម្រាប់ការវិនិច្ឆ័យរូបភាពវេជ្ជសាស្ត្រដោយស្វ័យប្រវត្តិ។ ជាឧទាហរណ៍ អ្នកស្រាវជ្រាវមួយចំនួនកំពុងពិសោធជាមួយវិធីសាស្រ្តនេះលើរូបភាពវិទ្យុសកម្មជាមួយនឹងការពិពណ៌នាអត្ថបទដែលភ្ជាប់មកជាមួយ ដែលជាកន្លែងដែលការបែងចែក semantic អាចចំណាយពេលច្រើន។ បច្ចេកទេស vokenization អាចបង្កើនការតំណាងទាំងនេះ និងកែលម្អរូបភាពវេជ្ជសាស្រ្តដោយស្វ័យប្រវត្តិដោយប្រើប្រាស់ព័ត៌មានអត្ថបទ។

    កម្មវិធីសម្រាប់ vokenization

    កម្មវិធីមួយចំនួនសម្រាប់ vokenization អាចរួមបញ្ចូល:

    • chatbots វិចារណញាណដែលអាចដំណើរការរូបថតអេក្រង់ រូបភាព និងមាតិកាគេហទំព័រ។ ជាពិសេស chatbots ជំនួយអតិថិជនអាចណែនាំផលិតផល និងសេវាកម្មបានត្រឹមត្រូវ។
    • អ្នកបកប្រែឌីជីថលដែលអាចដំណើរការរូបភាព និងវីដេអូ និងផ្តល់នូវការបកប្រែត្រឹមត្រូវដែលពិចារណាលើបរិបទវប្បធម៌ និងស្ថានភាព។
    • ម៉ាស៊ីនស្កេន bot ប្រព័ន្ធផ្សព្វផ្សាយសង្គមអាចធ្វើការវិភាគមនោសញ្ចេតនាកាន់តែទូលំទូលាយដោយការបញ្ចូលរូបភាព ចំណងជើង និងមតិយោបល់។ កម្មវិធីនេះអាចមានប្រយោជន៍ក្នុងការសម្របសម្រួលមាតិកាដែលទាមទារការវិភាគរូបភាពដែលបង្កគ្រោះថ្នាក់។
    • ការបង្កើនឱកាសការងារសម្រាប់ចក្ខុវិស័យកុំព្យូទ័រ និងវិស្វកររៀនម៉ាស៊ីន NLP និងអ្នកវិទ្យាសាស្ត្រទិន្នន័យ។
    • ការចាប់ផ្តើមបង្កើតប្រព័ន្ធ AI ទាំងនេះដើម្បីធ្វើពាណិជ្ជកម្មពួកវា ឬផ្តល់ដំណោះស្រាយតាមតម្រូវការសម្រាប់អាជីវកម្ម។

    សំណួរដើម្បីផ្តល់យោបល់

    • តើ​អ្នក​គិត​ថា​ការ​ប្រើ​សំឡេង​នឹង​ផ្លាស់ប្ដូរ​របៀប​ដែល​យើង​ធ្វើ​អន្តរកម្ម​ជាមួយ​មនុស្ស​យន្ត​ដោយ​របៀប​ណា​ទៀត?
    • តើការហៅឈ្មោះអាចផ្លាស់ប្តូររបៀបដែលយើងធ្វើអាជីវកម្ម និងធ្វើអន្តរកម្មជាមួយឧបករណ៍របស់យើង (ស្មាតហ្វូន និងឧបករណ៍ឆ្លាតវៃ) យ៉ាងដូចម្តេច?

    ឯកសារយោងការយល់ដឹង

    តំណភ្ជាប់ដ៏ពេញនិយម និងស្ថាប័នខាងក្រោមត្រូវបានយោងសម្រាប់ការយល់ដឹងនេះ៖