Syntetyske gegevens meitsje krekte ai systemen mei help fan produsearre modellen

Ofbyldingskredyt:

iStock

Syntetyske gegevens: Meitsje krekte AI-systemen mei produsearre modellen

Om krekte modellen fan keunstmjittige yntelliginsje (AI) te meitsjen, sjogge simulearre gegevens makke troch in algoritme tanommen nut.

Skriuwer:
Namme fan auteur
Quantumrun Foresight
Mei 4, 2022

Ynsjoch gearfetting

Syntetyske gegevens, in krêftich ark dat applikaasjes hat fariearjend fan sûnenssoarch oant detailhannel, feroaret de manier wêrop AI-systemen wurde ûntwikkele en ymplementearre. Troch it meitsjen fan ferskate en komplekse datasets mooglik te meitsjen sûnder gefoelige ynformaasje yn gefaar te bringen, ferbetterje syntetyske gegevens de effisjinsje yn 'e yndustry, behâld fan privacy en ferminderjen fan kosten. It presintearret lykwols ek útdagings, lykas potinsjele misbrûk by it meitsjen fan misleidende media, miljeuproblemen yn ferbân mei enerzjyferbrûk, en ferskowingen yn 'e dynamyk fan' e arbeidsmerk dy't soarchfâldich moatte wurde beheard.

Syntetyske gegevens kontekst

Foar tsientallen jierren bestean syntetyske gegevens yn ferskate foarmen. It kin fûn wurde yn kompjûterspultsjes lykas flechtsimulators en yn fysika-simulaasjes dy't alles útbyldzje fan atomen oant galaxies. No wurde syntetyske gegevens tapast binnen yndustry lykas sûnenssoarch om echte AI-útdagings op te lossen.

De foarútgong fan AI giet troch mei ferskate ymplemintaasjeobstakels. Grutte datasets binne bygelyks ferplichte om betroubere befinings te leverjen, frij te wêzen fan bias, en har te hâlden oan hieltyd strangere regeljouwing foar gegevensprivacy. Te midden fan dizze útdagings binne annotearre gegevens makke troch komputerisearre simulaasjes of programma's ûntstien as in alternatyf foar echte gegevens. Dizze AI-oanmakke gegevens, bekend as syntetyske gegevens, is kritysk foar it oplossen fan privacyproblemen en it útroegjen fan foaroardielen, om't it gegevensferskaat kin garandearje dy't de werklike wrâld wjerspegelje.

Sûnenssoarchbeoefeners brûke syntetyske gegevens, as foarbyld, binnen de sektor foar medyske bylden om AI-systemen op te trenen, wylst de fertroulikens fan pasjinten behâlde. It firtuele soarchbedriuw, Curai, brûkte bygelyks 400,000 syntetyske medyske gefallen om in diagnoaze-algoritme op te trenen. Fierder brûke retailers lykas Caper 3D-simulaasjes om in syntetyske dataset fan tûzen foto's te meitsjen fan mar fiif produktfoto's. Neffens in Gartner-stúdzje útbrocht yn juny 2021 rjochte op syntetyske gegevens, sille de measte gegevens brûkt yn AI-ûntwikkeling yn 2030 keunstmjittich wurde produsearre troch wetjouwing, statistyske noarmen, simulaasjes, of oare middels.

Disruptive ynfloed

Syntetyske gegevens helpe by it behâld fan privacy en it foarkommen fan gegevensbrekken. Bygelyks, in sikehûs as korporaasje kin in ûntwikkelder syntetyske medyske gegevens fan hege kwaliteit oanbiede om in AI-basearre kankerdiagnostyksysteem te trenen - gegevens dy't like kompleks binne as de echte wrâldgegevens dat dit systeem bedoeld is om te ynterpretearjen. Op dizze manier hawwe de ûntwikkelders kwaliteitsdatasets om te brûken by it ûntwerpen en kompilearjen fan it systeem, en it sikehûsnetwurk rint net it risiko om gefoelige, geduldige medyske gegevens yn gefaar te bringen.

Syntetyske gegevens kinne fierdere keapers fan testgegevens tagong krije ta ynformaasje tsjin in legere priis dan tradisjonele tsjinsten. Neffens Paul Walborsky, dy't mei-oprjochter AI Reverie, ien fan 'e earste tawijd syntetyske gegevens bedriuwen, in inkele ôfbylding dy't kostet $ 6 út in etikettering tsjinst kin keunstmjittich oanmakke wurde foar seis sinten. Oarsom sille syntetyske gegevens it paad baan foar fergrutte gegevens, wat omfettet it tafoegjen fan nije gegevens oan in besteande dataset yn 'e echte wrâld. Untwikkelders koene in âlde ôfbylding draaie of opheldere om in nije te meitsjen.

As lêste, jûn privacysoarch en regearingsbeheiningen, wurdt persoanlike ynformaasje besteande yn in databank hieltyd mear wetjouwing en komplekser, wat it dreger makket foar echte wrâldynformaasje om te brûken om nije programma's en platfoarms te meitsjen. Syntetyske gegevens kinne ûntwikkelders in oplossing biede om heul gefoelige gegevens te ferfangen.

Gefolgen fan syntetyske gegevens

Widere gefolgen fan syntetyske gegevens kinne omfetsje:

De fersnelde ûntwikkeling fan nije AI-systemen, sawol yn skaal as yn ferskaat, dy't prosessen ferbetterje yn ferskate yndustry en fjilden fan dissipline, dy't liede ta ferbettere effisjinsje yn sektoaren lykas sûnenssoarch, ferfier en finânsjes.
It ynskeakeljen fan organisaasjes om ynformaasje iepener te dielen en teams om effisjinter gear te wurkjen en operearje, wat liedt ta in mear gearhingjende wurkomjouwing en de mooglikheid om komplekse projekten mei gemak oan te pakken.
Untwikkelders en gegevensprofessionals dy't grutte syntetyske gegevenssets op har laptops kinne e-postearje of drage, feilich yn 't witten dat krityske gegevens net yn gefaar wurde, wat liedt ta fleksibeler en feiliger wurkomstannichheden.
De fermindere frekwinsje fan databank-cybersecurity-ynbreuken, om't autentike gegevens net langer sa faak tagong of dield wurde hoege te wurden, wat liedt ta in feiliger digitale omjouwing foar sawol bedriuwen as partikulieren.
Oerheden krije mear frijheid om strangere wetjouwing foar gegevensbehear út te fieren sûnder har soargen te meitsjen oer it belemmerjen fan yndustryûntwikkeling fan AI-systemen, wat liedt ta in mear regulearre en transparant gegevensgebrûkslandskip.
It potinsjeel foar syntetyske gegevens om unethysk te brûken by it meitsjen fan djippe faken of oare manipulative media, dy't liedt ta ferkearde ynformaasje en eroazje fan fertrouwen yn digitale ynhâld.
In ferskowing yn 'e dynamyk fan' e arbeidsmerk, mei tanommen ôfhinklikens fan syntetyske gegevens dy't mooglik de needsaak foar rollen foar gegevenssammeling ferminderje, wat liedt ta ferpleatsing fan banen yn bepaalde sektoaren.
De potinsjele miljeu-ynfloed fan ferhege komputaasjeboarnen dy't nedich binne om syntetyske gegevens te generearjen en te behearjen, wat liedt ta heger enerzjyferbrûk en byhearrende miljeusoarch.

Fragen om te beskôgje

Hokker oare yndustry kinne profitearje fan syntetyske gegevens?
Hokker regeljouwing moat de regearing ymplementearje oangeande hoe't syntetyske gegevens wurde makke, brûkt en ynset?

Add to list