Pagsusuri ng nilalamang sukat sa web: Pagbibigay kahulugan sa nilalamang online

CREDIT NG LARAWAN:
Image credit
iStock

Pagsusuri ng nilalamang sukat sa web: Pagbibigay kahulugan sa nilalamang online

Pagsusuri ng nilalamang sukat sa web: Pagbibigay kahulugan sa nilalamang online

Teksto ng subheading
Makakatulong ang pagsusuri sa nilalaman ng web-scale sa pag-scan at pagsubaybay sa dami ng impormasyon sa Internet, kabilang ang pagtukoy ng mapoot na salita.
    • May-akda:
    • pangalan Author
      Quantumrun Foresight
    • Nobyembre 7, 2023

    Buod ng pananaw

    Binabago ng machine learning at AI ang paraan ng pagsusuri namin sa napakaraming online na content. Web-scale content analysis, isang mas malawak na anyo ng tradisyonal na content analysis, ay gumagamit ng mga diskarte tulad ng natural language processing (NLP) at social network analysis (SNA) para ikategorya at maunawaan ang data sa internet. Hindi lamang ito nakakatulong sa pag-flag ng mapaminsalang content tulad ng mapoot na salita ngunit nagbibigay din ito ng mahahalagang insight sa mga krimen sa pananalapi, na binabawasan nang malaki ang oras ng pagsusuri. Gayunpaman, ang teknolohiya ay nagtataas din ng mga alalahanin tungkol sa pagkalat ng malalim na pekeng nilalaman at propaganda. Habang nagbabago ito, mayroon itong mas malawak na implikasyon, kabilang ang pinahusay na pagsasalin ng wika, pagtukoy ng bias, at pinahusay na mga hakbang sa cybersecurity.

    Konteksto ng pagsusuri sa nilalaman ng web-scale

    Ang web-scale na pagsusuri sa nilalaman ay isang mas malaking sukat na bersyon ng pagsusuri ng nilalaman. Binubuo ng prosesong ito ang pag-aaral ng mga elemento ng lingguwistika, lalo na ang mga katangiang istruktura (hal., haba ng mensahe, pamamahagi ng partikular na bahagi ng teksto o larawan) at mga semantikong tema o kahulugan sa mga komunikasyon. Ang layunin ay upang ipakita ang mga pattern at trend na makakatulong sa AI na mas mahusay na maikategorya ang impormasyon at magtalaga ng halaga dito. Gumagamit ng AI/ML ang pagsusuri ng content sa web-scale para i-automate ang proseso sa pamamagitan ng natural language processing (NLP) at social network analysis (SNA). 

    Ginagamit ang NLP upang maunawaan ang teksto sa mga website, habang ang SNA ay ginagamit upang matukoy ang mga ugnayan sa pagitan ng mga site na ito pangunahin sa pamamagitan ng mga hyperlink. Makakatulong ang mga pamamaraang ito na matukoy ang mapoot na salita sa social media at pag-aralan ang kalidad ng akademiko at pagbuo ng komunidad sa pamamagitan ng mga online na post, komento, at pakikipag-ugnayan. Sa partikular, maaaring hatiin ng NLP ang teksto sa mga indibidwal na salita at pagkatapos ay pag-aralan ang mga ito nang naaayon. Bilang karagdagan, ang algorithm na ito ay maaaring tumukoy ng mga partikular na keyword o parirala sa loob ng nilalaman ng isang website. Matutukoy din ng AI kung gaano kadalas ginagamit ang ilang partikular na salita at kung ginagamit ang mga ito sa positibo o negatibong konteksto.

    Nakakagambalang epekto

    Ang ilang mga iskolar ay nangangatwiran na dahil ang nilalaman ng web ay tumataas nang husto at nagiging mas hindi organisado at hindi nakokontrol, dapat mayroong isang standardized na paraan kung paano maaaring i-index at bigyang-kahulugan ng mga algorithm ang lahat ng impormasyong ito. Habang ang automated na pag-aaral ng nilalaman sa pamamagitan ng coding ay umiikot sa loob ng mga dekada, karamihan ay sumusunod sila sa isang hindi napapanahong protocol: pagbibilang lamang ng mga frequency ng salita at pagproseso ng mga text file. Higit pa ang magagawa ng malalim na pag-aaral at NLP sa pamamagitan ng pagsasanay sa AI upang maunawaan ang konteksto at motibo sa likod ng mga mensahe. Sa katunayan, ang NLP ay naging napakahusay sa pagsusuri ng salita at pagkakategorya na ito ay nagkaroon ng mga virtual na katulong sa pagsulat na maaaring gayahin kung paano inayos ng mga tao ang mga salita at pangungusap. Sa kasamaang palad, ang parehong tagumpay ay ginagamit na ngayon upang magsulat ng malalim na pekeng nilalaman tulad ng mga artikulo at post na idinisenyo upang magsulong ng propaganda at maling impormasyon.

    Gayunpaman, ang pagsusuri ng nilalaman sa web-scale ay nagiging mahusay sa pag-flag ng poot at marahas na pananalita, at pagtukoy ng mga masasamang aktor sa mga social network. Ang lahat ng mga platform ng social media ay umaasa sa ilang sistema ng pagsusuri ng nilalaman na maaaring matukoy ang mga nagsusulong ng mga ilegal na aktibidad o cyberbullying. Bukod sa pagmo-moderate ng nilalaman, ang pagsusuri sa web-scale ay maaaring lumikha ng data ng pagsasanay upang matulungan ang mga algorithm na matukoy ang mga krimen sa pananalapi, gaya ng money laundering, pag-iwas sa buwis, at pagpopondo ng terorista. Noong 2021, binawasan ng AI ang oras na kinakailangan upang suriin ang mga krimen sa pananalapi mula 20 linggo (katumbas ng isang analyst ng tao) hanggang 2 linggo, ayon sa consultancy firm na FTI. 

    Mga implikasyon ng web-scale content analysis

    Maaaring kabilang sa mas malawak na implikasyon ng pagsusuri ng nilalaman sa web-scale ang: 

    • Mga pagsulong sa mga teknolohiya sa pagsasalin ng wika dahil sa malawak na database ng mga salita ng AI at ang kahulugan ng mga ito na nakabatay sa kultura.
    • Mga tool na maaaring makakita at suriin ang pagkakaiba-iba at bias sa pananalita at iba pang mga uri ng nilalaman. Maaaring maging kapaki-pakinabang ang feature na ito sa pagtatasa ng pagiging tunay ng mga op-ed at artikulo.
    • Pinahusay na pagsusuri ng damdamin na higit pa sa pagtatalaga ng mga negatibo o positibong keyword sa isang teksto at sa buong pag-uugali ng mga user online.
    • Pinahusay na potensyal na pag-detect ng cyberattack dahil matutukoy ng teknolohiya ang mga salita at code na ginagamit ng mga hacker.
    • Mas mahusay na pag-index at pagsasaayos ng malalaking content sa loob ng mahabang panahon, na maaaring maging kapaki-pakinabang para sa mga archive ng pamahalaan at pananaliksik.

    Mga tanong na ikokomento

    • Ano ang iba pang mga potensyal na benepisyo ng pagsusuri ng nilalaman sa scale ng web sa pagmo-moderate ng social media?
    • Ano ang mga posibleng kaso ng paggamit ng teknolohiyang ito sa ibang mga industriya?

    Mga sanggunian ng insight

    Ang mga sumusunod na sikat at institusyonal na link ay isinangguni para sa pananaw na ito:

    Si Taylor at Francis Online Pag-scale ng Pagsusuri ng Nilalaman