OpenAI sin U-sving: Ikke trener GPT-4 med API-kundedata

openai-privacy-changes-6457d3fd3d25f-sej-760x400.png

I en betydelig avvik fra tidligere praksiser, har OpenAI kunngjort at de ikke lenger vil bruke kundedata som blir sendt via deres API-er for å trene sine omfattende språkmodeller, som for eksempel GPT-4.

Endringen ble bekreftet av Sam Altman, administrerende direktør i OpenAI, i et nylig intervju med CNBC.

OpenAIs nye tilnærming til brukerdata

OpenAIs endring i politikk ble implementert 1. mars 2023, da selskapet stille oppdaterte sine tjenestevilkår for å gjenspeile denne nye satsingen på brukerpersonvern.

Altman presiserte, "Kundene vil tydeligvis ikke at vi skal trene på deres data, så vi har endret planene våre: Vi vil ikke gjøre det."

APIer, eller applikasjonsprogramgrensesnitt, er teknologiske rammeverk som lar kunder koble direkte til OpenAI sin programvare.

Altman uttalte at OpenAI har «en stund» ikke brukt API-data til modelltreningsformål og antyder at denne offisielle kunngjøringen formaliserer en eksisterende praksis.

Konsekvenser for bedriftskunder

OpenAIs beslutning har vidtrekkende konsekvenser, spesielt for sine bedriftskunder, som inkluderer gigantene som Microsoft, Salesforce og Snapchat.

Disse selskapene er mer sannsynlig å benytte seg av OpenAI sin API-teknologi for deres operasjoner, så personvern og databeskyttelseendringen er spesielt relevant for dem.<

Imidlertid gjelder de nye personverntiltakene kun for kunder som bruker selskapets API-tjenester. OpenAIs oppdaterte vilkår for tjenesten merker, "Vi kan bruke innhold fra tjenester andre enn vår API."

Som sådan kan OpenAI fortsatt bruke andre former for datainndata, som tekst som er skrevet inn i den populære chatboten ChatGPT, med mindre dataene deles gjennom API-et.

Bredere industriell innvirkning

OpenAI sin politikkendring kommer på et tidspunkt hvor bransjer sliter med de potensielle konsekvensene av store språkmodeller, som OpenAI's ChatGPT, som kan erstatte materiale som tradisjonelt er skapt av mennesker.

For eksempel har Writers Guild of America nylig begynt å streike etter at forhandlingene mellom Guilden og filmselskapene brøt sammen. Guilden hadde argumentert for begrensninger på bruk av OpenAI's ChatGPT for manusgenerering eller omskriving.

OpenAI's beslutning om å ikke bruke kundedata til opplæring markerer et avgjørende øyeblikk i den pågående samtalen om personvern og kunstig intelligens. Mens selskaper fortsetter å utforske og utfordre grensene for AI-teknologi, vil det være sentralt å sikre brukernes personvern og opprettholde tilliten i disse diskusjonene.

Utviklingen av ChatGPT: GPT-3 Til GPT-4

Det er viktig å merke seg at OpenAI's forpliktelse om å ikke bruke kundedata til trening gjelder for deres nyeste språkmodell, GPT-4, som ble lansert 14. mars 2023.

GPT-4 introduserte flere forbedringer i forhold til sin forgjenger, GPT-3, inkludert en betydelig økning i ordgrense (25 000 sammenlignet med ChatGPTs 3 000-ords grense), større kontekstvindusstørrelse og forbedret resonnering og forståelsesevne.

En annen bemerkelsesverdig funksjon ved GPT-4 er dens flermodalitet, eller evnen til å forstå og inferere informasjon fra bilder i tillegg til tekst. Denne nyeste modellen genererer mer menneskelignende tekster og bruker funksjoner som emojis for en mer personlig følelse.

Likevel er den nøyaktige størrelsen og arkitekturen til GPT-4 fortsatt ukjent, noe som fører til spekulasjoner om detaljene i modellen.

Tross disse ryktene, har OpenAI sin administrerende direktør benektet spesifikke påstander om modellens størrelse.

Når det gjelder ytelse, har GPT-4 vist seg å ha sterke sider når det kommer til tekstgenerering, men har også noen begrensninger. For eksempel fikk den en poengsum i 54. prosentil på Graduate Record Examination (GRE) Writing og presterte i 43. - 59. prosentil på AP Calculus BC-eksamen.

I tillegg gjorde den det bra på enkle Leetcode-kodingoppgaver, men ytelsen avtok med økende vanskelighetsgrad på oppgavene.

Mens de spesifikke detaljene i GPT-4s treningsprosess ikke er offisielt dokumentert, er det kjent at GPT-modeller generelt innebærer storskala maskinlæring med et mangfoldig utvalg av internettekster.

Fremoverlent

Som et resultat av endringer i OpenAI's retningslinjer for bruk av data, inkluderer ikke dataene som brukes til trening av språkmodellene deres informasjon som deles via API-en med mindre brukerne uttrykkelig samtykker til å bidra med det til dette formålet.

Mens denne teknologien forbedrer seg og spiller en mer betydelig rolle i våre liv, er det interessant hvordan selskaper tilpasser seg og responderer på bekymringer om å bevare data privat og vinne tillit hos mennesker.

Relaterte Artikler

Se mer >>

Lås opp kraften til AI med HIX.AI!