Vokenization language ai can see

ឥណទានរូបភាព៖

iStock

Vokenization៖ ភាសាដែល AI អាចមើលឃើញ

ជាមួយនឹងរូបភាពឥឡូវនេះត្រូវបានដាក់បញ្ចូលទៅក្នុងប្រព័ន្ធឆ្លាតវៃសិប្បនិម្មិត (AI) ការបណ្តុះបណ្តាល មនុស្សយន្តអាចនឹងអាច "មើលឃើញ" ពាក្យបញ្ជាក្នុងពេលឆាប់ៗនេះ។

អ្នកនិពន្ធ:
ឈ្មោះអ្នកនិពន្ធ
ការទស្សន៍ទាយ Quantumrun
ថ្ងៃទី 9 ខែ ឧសភា ឆ្នាំ 2023

ដំណើរការភាសាធម្មជាតិ (NLP) បានបើកដំណើរការប្រព័ន្ធបញ្ញាសិប្បនិម្មិត (AI) ដើម្បីរៀនការនិយាយរបស់មនុស្សដោយការយល់ដឹងពាក្យ និងបរិបទដែលត្រូវគ្នាជាមួយនឹងមនោសញ្ចេតនា។ គុណវិបត្តិតែមួយគត់គឺថាប្រព័ន្ធ NLP ទាំងនេះគឺផ្អែកលើអត្ថបទសុទ្ធសាធ។ Vokenization ហៀបនឹងផ្លាស់ប្តូរអ្វីៗទាំងអស់។

បរិបទ Vokenization

កម្មវិធីសិក្សាម៉ាស៊ីនអត្ថបទ (ML) ចំនួនពីរត្រូវបានគេប្រើជាញឹកញាប់ដើម្បីបណ្តុះបណ្តាល AI ដើម្បីដំណើរការ និងយល់ភាសាមនុស្ស៖ OpenAI's Generative Pre-trained Transformer 3 (GPT-3) និង BERT របស់ Google (តំណាងអ៊ិនកូដទ្វេទិសពី Transformers) ។ នៅក្នុងវាក្យស័ព្ទ AI ពាក្យដែលប្រើក្នុងការបណ្តុះបណ្តាល NLP ត្រូវបានគេហៅថាសញ្ញាសម្ងាត់។ អ្នកស្រាវជ្រាវមកពីសាកលវិទ្យាល័យ North Carolina (UNC) បានសង្កេតឃើញថា កម្មវិធីបណ្តុះបណ្តាលផ្អែកលើអត្ថបទមានកម្រិត ដោយសារពួកគេមិនអាច "មើលឃើញ" មានន័យថា ពួកគេមិនអាចចាប់យកព័ត៌មានដែលមើលឃើញ និងការទំនាក់ទំនងបានទេ។

ជាឧទាហរណ៍ ប្រសិនបើនរណាម្នាក់សួរ GPT-3 ថាតើពណ៌របស់ចៀមជាអ្វី ប្រព័ន្ធនឹងឆ្លើយជាញឹកញាប់ថា "ខ្មៅ" ទោះបីជាវាមានពណ៌សយ៉ាងច្បាស់ក៏ដោយ។ ការឆ្លើយតបនេះគឺដោយសារតែប្រព័ន្ធផ្អែកលើអត្ថបទនឹងភ្ជាប់វាជាមួយពាក្យ "ចៀមខ្មៅ" ជំនួសឱ្យការកំណត់អត្តសញ្ញាណពណ៌ត្រឹមត្រូវ។ តាមរយៈការបញ្ចូលរូបភាពជាមួយសញ្ញាសម្ងាត់ (ហៅកាត់) ប្រព័ន្ធ AI អាចមានការយល់ដឹងរួមអំពីពាក្យ។ Vokenization រួមបញ្ចូល vokens ទៅក្នុងប្រព័ន្ធ NLP ដែលគ្រប់គ្រងដោយខ្លួនឯង ដែលអនុញ្ញាតឱ្យពួកគេបង្កើត "សុភវិនិច្ឆ័យ" ។

ការរួមបញ្ចូលគំរូភាសា និងចក្ខុវិស័យកុំព្យូទ័រមិនមែនជាគំនិតថ្មីទេ ហើយវាគឺជាវិស័យដែលពង្រីកយ៉ាងឆាប់រហ័សនៅក្នុងការស្រាវជ្រាវ AI ។ ការរួមបញ្ចូលគ្នានៃ AI ទាំងពីរប្រភេទនេះ បង្កើនភាពខ្លាំងរៀងៗខ្លួនរបស់ពួកគេ។ គំរូភាសាដូចជា GPT-3 ត្រូវបានបណ្តុះបណ្តាលតាមរយៈការរៀនដែលគ្មានការត្រួតពិនិត្យ ដែលអនុញ្ញាតឱ្យពួកគេធ្វើមាត្រដ្ឋានបានយ៉ាងងាយស្រួល។ ផ្ទុយទៅវិញ គំរូរូបភាពដូចជាប្រព័ន្ធសម្គាល់វត្ថុអាចរៀនដោយផ្ទាល់ពីការពិត ហើយមិនពឹងផ្អែកលើអរូបីដែលផ្តល់ដោយអត្ថបទនោះទេ។ ជាឧទាហរណ៍ គំរូរូបភាពអាចទទួលស្គាល់ថាចៀមមានពណ៌សដោយមើលរូបភាព។

ផលប៉ះពាល់រំខាន

ដំណើរការនៃការហៅឈ្មោះគឺជាការត្រង់គួរឱ្យកត់សម្គាល់។ Vokens ត្រូវបានបង្កើតឡើងដោយការកំណត់រូបភាពដែលត្រូវគ្នាឬពាក់ព័ន្ធទៅនឹងសញ្ញាភាសា។ បន្ទាប់មក algorithms (vokenizer) ត្រូវបានរចនាឡើងដើម្បីបង្កើត vokens តាមរយៈការរៀនដែលគ្មានការត្រួតពិនិត្យ (មិនមានប៉ារ៉ាម៉ែត្រ/ច្បាប់ច្បាស់លាស់)។ សតិអារម្មណ៍ AI ដែលបានទទួលការបណ្តុះបណ្តាលតាមរយៈការបញ្ចេញសំឡេងអាចទំនាក់ទំនង និងដោះស្រាយបញ្ហាបានប្រសើរជាងមុន ដោយសារពួកគេមានការយល់ដឹងកាន់តែស៊ីជម្រៅអំពីបរិបទ។ វិធីសាស្រ្តនេះគឺប្លែកពីគេ ព្រោះវាមិនត្រឹមតែព្យាករណ៍ថូខឹនភាសាប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងព្យាករណ៍ថូខឹនរូបភាព ដែលជាអ្វីដែលគំរូ BERT ប្រពៃណីមិនអាចធ្វើបាន។

ជាឧទាហរណ៍ ជំនួយការមនុស្សយន្តនឹងអាចសម្គាល់រូបភាព និងរុករកដំណើរការបានប្រសើរជាងមុន ដោយសារពួកគេអាច "មើលឃើញ" នូវអ្វីដែលពួកគេត្រូវការ។ ប្រព័ន្ធបញ្ញាសិប្បនិម្មិតដែលត្រូវបានបណ្តុះបណ្តាលដើម្បីសរសេរខ្លឹមសារនឹងអាចបង្កើតអត្ថបទដែលស្តាប់ទៅមនុស្សកាន់តែច្រើន ជាមួយនឹងគំនិតដែលល្អជាង ជំនួសឱ្យប្រយោគដែលមិនជាប់ពាក់ព័ន្ធ។ ដោយពិចារណាលើវិសាលភាពទូលំទូលាយនៃកម្មវិធី NLP ការហៅឈ្មោះអាចនាំឱ្យដំណើរការ chatbots ដំណើរការប្រសើរជាងមុន ជំនួយការនិម្មិត ការវិនិច្ឆ័យវេជ្ជសាស្ត្រតាមអ៊ីនធឺណិត អ្នកបកប្រែឌីជីថល និងច្រើនទៀត។

លើសពីនេះទៀត ការរួមបញ្ចូលគ្នានៃចក្ខុវិស័យ និងការរៀនភាសាកំពុងទទួលបានប្រជាប្រិយភាពនៅក្នុងកម្មវិធីរូបភាពវេជ្ជសាស្ត្រ ជាពិសេសសម្រាប់ការវិនិច្ឆ័យរូបភាពវេជ្ជសាស្ត្រដោយស្វ័យប្រវត្តិ។ ជាឧទាហរណ៍ អ្នកស្រាវជ្រាវមួយចំនួនកំពុងពិសោធជាមួយវិធីសាស្រ្តនេះលើរូបភាពវិទ្យុសកម្មជាមួយនឹងការពិពណ៌នាអត្ថបទដែលភ្ជាប់មកជាមួយ ដែលជាកន្លែងដែលការបែងចែក semantic អាចចំណាយពេលច្រើន។ បច្ចេកទេស vokenization អាចបង្កើនការតំណាងទាំងនេះ និងកែលម្អរូបភាពវេជ្ជសាស្រ្តដោយស្វ័យប្រវត្តិដោយប្រើប្រាស់ព័ត៌មានអត្ថបទ។

កម្មវិធីសម្រាប់ vokenization

កម្មវិធីមួយចំនួនសម្រាប់ vokenization អាចរួមបញ្ចូល:

chatbots វិចារណញាណដែលអាចដំណើរការរូបថតអេក្រង់ រូបភាព និងមាតិកាគេហទំព័រ។ ជាពិសេស chatbots ជំនួយអតិថិជនអាចណែនាំផលិតផល និងសេវាកម្មបានត្រឹមត្រូវ។
អ្នកបកប្រែឌីជីថលដែលអាចដំណើរការរូបភាព និងវីដេអូ និងផ្តល់នូវការបកប្រែត្រឹមត្រូវដែលពិចារណាលើបរិបទវប្បធម៌ និងស្ថានភាព។
ម៉ាស៊ីនស្កេន bot ប្រព័ន្ធផ្សព្វផ្សាយសង្គមអាចធ្វើការវិភាគមនោសញ្ចេតនាកាន់តែទូលំទូលាយដោយការបញ្ចូលរូបភាព ចំណងជើង និងមតិយោបល់។ កម្មវិធីនេះអាចមានប្រយោជន៍ក្នុងការសម្របសម្រួលមាតិកាដែលទាមទារការវិភាគរូបភាពដែលបង្កគ្រោះថ្នាក់។
ការបង្កើនឱកាសការងារសម្រាប់ចក្ខុវិស័យកុំព្យូទ័រ និងវិស្វកររៀនម៉ាស៊ីន NLP និងអ្នកវិទ្យាសាស្ត្រទិន្នន័យ។
ការចាប់ផ្តើមបង្កើតប្រព័ន្ធ AI ទាំងនេះដើម្បីធ្វើពាណិជ្ជកម្មពួកវា ឬផ្តល់ដំណោះស្រាយតាមតម្រូវការសម្រាប់អាជីវកម្ម។

សំណួរដើម្បីផ្តល់យោបល់

តើអ្នកគិតថាការប្រើសំឡេងនឹងផ្លាស់ប្ដូររបៀបដែលយើងធ្វើអន្តរកម្មជាមួយមនុស្សយន្តដោយរបៀបណាទៀត?
តើការហៅឈ្មោះអាចផ្លាស់ប្តូររបៀបដែលយើងធ្វើអាជីវកម្ម និងធ្វើអន្តរកម្មជាមួយឧបករណ៍របស់យើង (ស្មាតហ្វូន និងឧបករណ៍ឆ្លាតវៃ) យ៉ាងដូចម្តេច?

បន្ថែមទៅបញ្ជី