Greining efnis á vefnum: Að hafa vit fyrir efni á netinu

MYNDAGREIÐSLA:
Image inneign
iStock

Greining efnis á vefnum: Að hafa vit fyrir efni á netinu

Greining efnis á vefnum: Að hafa vit fyrir efni á netinu

Texti undirfyrirsagna
Greining efnis á vefnum getur hjálpað til við að skanna og fylgjast með magni upplýsinga á netinu, þar á meðal að bera kennsl á hatursorðræðu.
    • Höfundur:
    • Höfundur nafn
      Quantumrun Foresight
    • Nóvember 7, 2023

    Innsýn samantekt

    Vélnám og gervigreind eru að gjörbylta því hvernig við greinum mikið magn af efni á netinu. Innihaldsgreining á vefmælikvarða, víðtækara form hefðbundinnar efnisgreiningar, notar tækni eins og náttúrulega málvinnslu (NLP) og samfélagsnetgreiningu (SNA) til að flokka og skilja internetgögn. Þetta hjálpar ekki aðeins við að flagga skaðlegu efni eins og hatursorðræðu heldur veitir það einnig dýrmæta innsýn í fjármálaglæpi, sem dregur verulega úr greiningartíma. Hins vegar vekur tæknin einnig áhyggjur af útbreiðslu djúpfalsaðs efnis og áróðurs. Eins og það þróast hefur það víðtækari áhrif, þar á meðal bætta tungumálaþýðingu, hlutdrægni og auknar netöryggisráðstafanir.

    Innihaldsgreiningarsamhengi á vefnum

    Innihaldsgreining á vefnum er stærri útgáfa af efnisgreiningu. Þetta ferli felur í sér að rannsaka tungumálaþætti, sérstaklega uppbyggingareiginleika (td lengd skilaboða, dreifingu tiltekinna texta eða myndhluta) og merkingarfræðileg þemu eða merkingu í samskiptum. Markmiðið er að sýna mynstur og stefnur sem geta hjálpað gervigreindum að flokka upplýsingarnar betur og gefa þeim gildi. Innihaldsgreining á vefnum notar gervigreind/ML til að gera ferlið sjálfvirkt með náttúrulegri málvinnslu (NLP) og greiningu á samfélagsnetum (SNA). 

    NLP er notað til að skilja textann á vefsíðum en SNA er notað til að ákvarða tengslin á milli þessara vefsvæða aðallega með tengla. Þessar aðferðir geta hjálpað til við að bera kennsl á hatursorðræðu á samfélagsmiðlum og rannsaka fræðileg gæði og samfélagsmyndun með færslum á netinu, athugasemdum og samskiptum. Sérstaklega getur NLP brotið textann niður í einstök orð og síðan greint þau í samræmi við það. Að auki getur þetta reiknirit auðkennt tiltekin leitarorð eða orðasambönd innan efnis vefsíðunnar. AI getur einnig ákvarðað hversu oft ákveðin orð eru notuð og hvort þau eru notuð í jákvæðu eða neikvæðu samhengi.

    Truflandi áhrif

    Sumir fræðimenn halda því fram að vegna þess að efni á vefnum eykst veldishraða og verður óskipulagðara og stjórnlausara, þá þurfi að vera til staðlaða aðferð um hvernig reiknirit geta skráð allar þessar upplýsingar og skilið þær. Þó að sjálfvirk efnisgreining með kóðun hafi verið til í áratugi, fylgja þær að mestu úreltri siðareglur: einfaldlega að telja orðatíðni og vinna úr textaskrám. Djúpnám og NLP geta gert svo miklu meira með því að þjálfa gervigreind til að skilja samhengið og hvatinn á bak við skilaboð. Reyndar hefur NLP orðið svo gott í orðagreiningu og flokkun að það hefur alið af sér sýndarskrifaðstoðarmenn sem geta líkt eftir því hvernig menn skipuleggja orð og setningar. Því miður er sama byltingin nú notuð til að skrifa djúpfalsað efni eins og greinar og færslur sem ætlað er að efla áróður og rangar upplýsingar.

    Engu að síður er efnisgreining á vefnum að verða góð í að flagga hatri og ofbeldisfullri ræðu og bera kennsl á slæma leikara á samfélagsmiðlum. Allir samfélagsmiðlar treysta á eitthvað efnisendurskoðunarkerfi sem getur bent á þá sem stuðla að ólöglegri starfsemi eða neteinelti. Burtséð frá hófsemi efnis getur greining á vefsviði búið til þjálfunargögn til að hjálpa reikniritum að bera kennsl á fjármálaglæpi, svo sem peningaþvætti, skattsvik og fjármögnun hryðjuverka. Árið 2021 minnkaði gervigreind tímann sem það tekur að greina fjármálaglæpi úr 20 vikum (sem jafngildir einum mannlegum greinanda) í 2 vikur, samkvæmt ráðgjafafyrirtækinu FTI. 

    Áhrif efnisgreiningar á vefnum

    Víðtækari áhrif efnisgreiningar á vefnum geta falið í sér: 

    • Framfarir í tungumálaþýðingatækni vegna víðtæks gagnagrunns gervigreindar með orðum og menningartengdri merkingu þeirra.
    • Verkfæri sem geta greint og metið fjölbreytileika og hlutdrægni í tali og öðrum efnisgerðum. Þessi eiginleiki getur verið gagnlegur við að meta áreiðanleika ritgerða og greina.
    • Bætt tilfinningagreining sem gengur lengra en að úthluta neikvæðum eða jákvæðum leitarorðum í texta og inn í alla hegðun notenda á netinu.
    • Aukin uppgötvun hugsanlegra netárása þar sem tæknin getur auðkennt orð og kóða sem tölvuþrjótar nota.
    • Betri flokkun og skipulag á stóru efni yfir langan tíma, sem getur nýst stjórnvöldum og rannsóknarskjalasafni.

    Spurningar til að tjá sig um

    • Hverjir eru aðrir hugsanlegir kostir efnisgreiningar á vefnum í hófi á samfélagsmiðlum?
    • Hver eru möguleg notkunartilvik þessarar tækni í öðrum atvinnugreinum?

    Innsýn tilvísanir

    Vísað var til eftirfarandi vinsælu og stofnanatengla fyrir þessa innsýn:

    Taylor og Francis á netinu Stærð efnisgreiningu