וואָקעניזאַטיאָן: שפּראַך וואָס אַי קענען זען

בילד קרעדיט:
בילד קרעדיט
iStock

וואָקעניזאַטיאָן: שפּראַך וואָס אַי קענען זען

וואָקעניזאַטיאָן: שפּראַך וואָס אַי קענען זען

סובהעדינג טעקסט
מיט בילדער איצט ינקאָרפּערייטיד אין קינסטלעך סייכל (AI) סיסטעמען טריינינג, ראָובאַץ קען באַלד זיין ביכולת צו "זען" קאַמאַנדז.
    • וועגן דעם מחבר
    • מחבר נאָמען
      קוואַנטומרון פאָרסייט
    • מייַ קסנומקס, קסנומקס

    נאַטירלעך שפּראַך פּראַסעסינג (NLP) האט ענייבאַלד קינסטלעך סייכל (AI) סיסטעמען צו לערנען מענטש רעדע דורך פארשטאנד ווערטער און וואָס ריכטן קאָנטעקסט מיט די סענטימענט. דער בלויז דאַונסייד איז אַז די NLP סיסטעמען זענען ריין טעקסט-באזירט. וואָקעניזאַטיאָן איז וועגן צו טוישן אַלע דעם.

    וואָקעניזאַטיאָן קאָנטעקסט

    צוויי טעקסט-באזירט מאַשין לערנען (ML) מגילה זענען אָפט געניצט צו באַן אַי צו פּראָצעס און פֿאַרשטיין מענטש שפּראַך: OpenAI ס גענעראַטיווע פאַר-טריינד טראַנספאָרמער 3 (GPT-3) און Google ס BERT (בידירעקטיאָנאַל ענקאָדער רעפּרעסענטאַטיאָנס פון טראַנספאָרמערס). אין אַי טערמינאָלאָגיע, די ווערטער געניצט אין NLP טריינינג זענען גערופֿן טאָקענס. רעסעאַרטשערס פון די אוניווערסיטעט פון צפון קאראליינע (UNC) באמערקט אַז טעקסט-באזירט טריינינג מגילה זענען לימיטעד ווייַל זיי קענען נישט "זען," טייַטש זיי קענען נישט כאַפּן וויזשאַוואַל אינפֿאָרמאַציע און קאָמוניקאַציע. 

    פֿאַר בייַשפּיל, אויב עמעצער פרעגט GPT-3 וואָס די קאָליר פון די שעפּס איז, די סיסטעם וועט אָפט ענטפֿערן "שוואַרץ" אפילו אויב עס איז קלאר ווייַס. דער ענטפער איז ווייַל די טעקסט-באזירט סיסטעם וועט פאַרבינדן עס מיט די טערמין "שוואַרץ שעפּס" אַנשטאָט פון די ריכטיק קאָליר. דורך ינקאָרפּערייטינג וויזשוואַלז מיט טאָקענס (וואָקען), אַי סיסטעמען קענען האָבן אַ האָליסטיק פארשטאנד פון טערמינען. וואָקעניזאַטיאָן ינטאַגרייץ וואָקענס אין זיך-סופּערווייזד נלפּ סיסטעמען, אַלאַוינג זיי צו אַנטוויקלען "סאַונד זינען."

    ינטאַגרייטינג שפּראַך מאָדעלס און קאָמפּיוטער זעאונג איז נישט אַ נייַע באַגריף, און עס איז אַ ראַפּאַדלי יקספּאַנדינג פעלד אין אַי פאָרשונג. די קאָמבינאַציע פון ​​​​די צוויי טייפּס פון אַי לעוועראַדזשאַז זייער יחיד סטרענגקטס. שפּראַך מאָדעלס ווי GPT-3 זענען טריינד דורך אַנסופּערווייזד לערנען, וואָס אַלאַוז זיי צו וואָג לייכט. אין קאַנטראַסט, בילד מאָדעלס ווי אַבדזשעקץ דערקענונג סיסטעמען קענען גלייך לערנען פון פאַקט און טאָן ניט פאַרלאָזנ זיך די אַבסטראַקציע צוגעשטעלט דורך די טעקסט. פֿאַר בייַשפּיל, בילד מאָדעלס קענען דערקענען אַז אַ שעפּס איז ווייַס דורך קוקן אין אַ בילד.

    דיסראַפּטיוו פּראַל

    דער פּראָצעס פון וואָקעניזיישאַן איז גאַנץ פּשוט. וואָקענס זענען באשאפן דורך אַסיינינג קאָראַספּאַנדינג אָדער באַטייַטיק בילדער צו שפּראַך טאָקענס. דערנאָך, אַלגערידאַמז (וואָקעניזער) זענען דיזיינד צו דזשענערייט וואָקענס דורך אַנסופּערווייזד לערנען (קיין יקספּליסאַט פּאַראַמעטערס / כּללים). סייכל אַי טריינד דורך וואָקעניזאַטיאָן קענען יבערגעבן און סאָלווע פּראָבלעמס בעסער ווייַל זיי האָבן אַ מער אין-טיפקייַט פארשטאנד פון קאָנטעקסט. דער צוגאַנג איז יינציק ווייַל עס פּרידיקס ניט בלויז שפּראַך טאָקענס אָבער אויך פּרידיקס בילד טאָקענס, וואָס איז עפּעס וואָס טראדיציאנעלן BERT מאָדעלס קענען נישט טאָן.

    פֿאַר בייַשפּיל, ראָובאַטיק אַסיסטאַנץ קענען דערקענען בילדער און נאַוויגירן פּראַסעסאַז בעסער ווייַל זיי קענען "זען" וואָס איז פארלאנגט פון זיי. קינסטלעך סייכל סיסטעמען טריינד צו שרייַבן אינהאַלט וועט קענען צו מאַכן אַרטיקלען וואָס געזונט מער מענטשלעך, מיט געדאנקען וואָס לויפן בעסער, אַנשטאָט פון דיסדזשאָינטעד זאצן. קאָנסידערינג די ברייט דערגרייכן פון NLP אַפּלאַקיישאַנז, וואָקעניזאַטיאָן קענען פירן צו בעסער-פּערפאָרמינג טשאַטבאָץ, ווירטואַל אַסיסטאַנץ, אָנליין מעדיציניש דיאַגנאָסיז, דיגיטאַל טראַנסלייטערז, און מער.

    דערצו, די קאָמבינאַציע פון ​​​​זעאונג און שפּראַך לערנען איז גיינינג פּאָפּולאַריטעט אין מעדיציניש ימאַגינג אַפּלאַקיישאַנז, ספּאַסיפיקלי פֿאַר אָטאַמייטיד מעדיציניש בילד דיאַגנאָסיס. פֿאַר בייַשפּיל, עטלעכע ריסערטשערז עקספּערימענט מיט דעם צוגאַנג אויף ראַדיאָגראַף בילדער מיט אַקאַמפּאַניינג טעקסט דיסקריפּשאַנז, ווו סעמאַנטיק סעגמאַנטיישאַן קענען זיין צייט-קאַנסומינג. די וואָקעניזאַטיאָן טעכניק קען פאַרבעסערן די רעפּראַזאַנטיישאַנז און פֿאַרבעסערן אָטאַמייטיד מעדיציניש ימידזשינג דורך ניצן די טעקסט אינפֿאָרמאַציע.

    אַפּפּליקאַטיאָנס פֿאַר וואָוקאַניזיישאַן

    עטלעכע אַפּלאַקיישאַנז פֿאַר וואָקעניזיישאַן קען אַרייַננעמען:

    • ינטואַטיוו טשאַטבאָץ וואָס קענען פּראָצעס סקרעענשאָץ, בילדער און וועבזייטל אינהאַלט. קונה שטיצן טשאַטבאָץ, אין באַזונדער, קען זיין ביכולת צו אַקיעראַטלי רעקאָמענדירן פּראָדוקטן און באַדינונגס.
    • דיגיטאַל טראַנסלייטערז וואָס קענען פּראָצעס בילדער און ווידיאס און צושטעלן אַ פּינטלעך איבערזעצונג וואָס באַטראַכט קולטור און סיטשושאַנאַל קאָנטעקסט.
    • סאציאל מעדיע באָט סקאַנערז קענען אָנפירן אַ מער האָליסטיק סענטימענט אַנאַליסיס דורך צונויפגיסן בילדער, קאַפּשאַנז און באַמערקונגען. די אַפּלאַקיישאַן קענען זיין נוציק אין מאַדעריישאַן פון אינהאַלט וואָס ריקווייערז אַנאַליסיס פון שעדלעך בילדער.
    • ינקרעאַסינג באַשעפטיקונג אַפּערטונאַטיז פֿאַר קאָמפּיוטער זעאונג און NLP מאַשין לערנען ענדזשאַנירז און דאַטן סייאַנטיס.
    • סטאַרטאַפּס וואָס בויען אויף די אַי סיסטעמען צו קאַמערשאַלייז זיי אָדער צושטעלן קאַסטאַמייזד סאַלושאַנז פֿאַר געשעפטן.

    פראגעס צו באַמערקן אויף

    • ווי אַנדערש טאָן איר טראַכטן וואָקעניזאַטיאָן וועט טוישן ווי מיר ינטעראַקט מיט ראָובאַץ?
    • ווי קען וואָקעניזאַטיאָן טוישן ווי מיר פירן געשעפט און ינטעראַקט מיט אונדזער גאַדגעץ (סמאַרטפאָנעס און סמאַרט אַפּפּליאַנסעס)?

    ינסייט רעפערענצן

    די פאלגענדע פאָלקס און ינסטיטושאַנאַל לינקס זענען רעפעררעד פֿאַר דעם ינסייט: