Inhoudsanalyse op webschaal: betekenis geven aan online inhoud

BEELDKREDIET:
Image credit
iStock

Inhoudsanalyse op webschaal: betekenis geven aan online inhoud

Inhoudsanalyse op webschaal: betekenis geven aan online inhoud

Onderkoptekst
Inhoudsanalyse op webschaal kan helpen bij het scannen en monitoren van de hoeveelheden informatie op internet, inclusief het identificeren van haatzaaiende uitlatingen.
    • Auteur:
    • auteursnaam
      Quantumrun-prognose
    • 7 november 2023

    Samenvatting inzicht

    Machine learning en AI zorgen voor een revolutie in de manier waarop we grote hoeveelheden online-inhoud analyseren. Inhoudsanalyse op webschaal, een uitgebreidere vorm van traditionele inhoudsanalyse, maakt gebruik van technieken zoals natuurlijke taalverwerking (NLP) en sociale netwerkanalyse (SNA) om internetgegevens te categoriseren en te begrijpen. Dit helpt niet alleen bij het signaleren van schadelijke inhoud zoals haatzaaiende uitlatingen, maar biedt ook waardevolle inzichten in financiële misdrijven, waardoor de analysetijd aanzienlijk wordt verkort. De technologie roept echter ook zorgen op over de verspreiding van deepfake-inhoud en propaganda. Naarmate het zich ontwikkelt, heeft het bredere implicaties, waaronder verbeterde taalvertaling, detectie van vooroordelen en verbeterde cyberbeveiligingsmaatregelen.

    Context voor inhoudsanalyse op webschaal

    Inhoudsanalyse op webschaal is een grootschaligere versie van inhoudsanalyse. Dit proces omvat het bestuderen van taalkundige elementen, vooral structurele kenmerken (bijvoorbeeld de lengte van het bericht, de distributie van bepaalde tekst- of beeldcomponenten) en semantische thema's of betekenis in communicatie. Het doel is om patronen en trends bloot te leggen die AI kunnen helpen de informatie beter te categoriseren en er waarde aan toe te kennen. Contentanalyse op webschaal maakt gebruik van AI/ML om het proces te automatiseren via natuurlijke taalverwerking (NLP) en sociale netwerkanalyse (SNA). 

    NLP wordt gebruikt om de tekst op websites te begrijpen, terwijl SNA wordt gebruikt om de relaties tussen deze sites voornamelijk via hyperlinks vast te stellen. Deze methoden kunnen helpen haatzaaiende uitlatingen op sociale media te identificeren en de academische kwaliteit en gemeenschapsvorming te bestuderen via online berichten, opmerkingen en interacties. Met name kan NLP de tekst in afzonderlijke woorden opsplitsen en deze vervolgens dienovereenkomstig analyseren. Bovendien kan dit algoritme specifieke trefwoorden of zinsdelen binnen de inhoud van een website identificeren. AI kan ook bepalen hoe vaak bepaalde woorden worden gebruikt en of ze in een positieve of negatieve context worden gebruikt.

    Disruptieve impact

    Sommige wetenschappers beweren dat, omdat de webinhoud exponentieel toeneemt en steeds ongeorganiseerder en ongecontroleerder wordt, er een gestandaardiseerde methode moet zijn voor de manier waarop algoritmen al deze informatie kunnen indexeren en begrijpen. Hoewel geautomatiseerde inhoudsanalyses door middel van codering al tientallen jaren bestaan, volgen ze meestal een verouderd protocol: simpelweg de woordfrequenties tellen en tekstbestanden verwerken. Deep learning en NLP kunnen zoveel meer doen door AI te trainen om de context en het motief achter berichten te begrijpen. NLP is zelfs zo goed geworden in het analyseren en categoriseren van woorden dat het virtuele schrijfassistenten heeft voortgebracht die kunnen nabootsen hoe mensen woorden en zinnen ordenen. Helaas wordt dezelfde doorbraak nu gebruikt om deepfake-inhoud te schrijven, zoals artikelen en berichten die zijn ontworpen om propaganda en verkeerde informatie te promoten.

    Niettemin wordt de analyse van inhoud op webschaal steeds beter in het signaleren van haat en gewelddadige uitlatingen, en het identificeren van slechte actoren in sociale netwerken. Alle sociale-mediaplatforms vertrouwen op een systeem voor inhoudsbeoordeling dat degenen kan opsporen die illegale activiteiten of cyberpesten promoten. Naast het modereren van inhoud kan analyse op webschaal trainingsgegevens opleveren om algoritmen te helpen bij het identificeren van financiële misdaden, zoals het witwassen van geld, belastingontduiking en de financiering van terrorisme. Volgens adviesbureau FTI heeft AI in 2021 de tijd die nodig is om financiële misdrijven te analyseren teruggebracht van twintig weken (gelijk aan één menselijke analist) naar twee weken. 

    Implicaties van inhoudsanalyse op webschaal

    Bredere implicaties van inhoudsanalyse op webschaal kunnen zijn: 

    • Vooruitgang in taalvertaaltechnologieën dankzij de uitgebreide database met woorden van AI en hun op cultuur gebaseerde betekenis.
    • Tools die diversiteit en vooroordelen in spraak en andere inhoudstypen kunnen detecteren en evalueren. Deze functie kan nuttig zijn bij het beoordelen van de authenticiteit van opiniestukken en artikelen.
    • Verbeterde sentimentanalyse die verder gaat dan het toewijzen van negatieve of positieve trefwoorden aan een tekst en het volledige gedrag van gebruikers online.
    • Verbeterde potentiële detectie van cyberaanvallen, omdat de technologie woorden en codes kan identificeren die door hackers worden gebruikt.
    • Betere indexering en organisatie van grote inhoud over een lange periode, wat nuttig kan zijn voor overheids- en onderzoeksarchieven.

    Vragen om op te reageren

    • Wat zijn de andere potentiële voordelen van inhoudsanalyse op webschaal bij het modereren van sociale media?
    • Wat zijn de mogelijke gebruiksscenario's van deze technologie in andere industrieën?

    Insight-referenties

    Voor dit inzicht werd verwezen naar de volgende populaire en institutionele links:

    Taylor & Francis Online Inhoudsanalyse opschalen