Toppen av OpenAI's ChatGPT Feiler Når Det Besvares

Nå har det gått nesten 6 måneder siden OpenAI's ChatGPT ble lansert. Faktisk har selskapet nylig lansert ChatGPT 4. Denne teknologien har nå tatt verden til et nytt nivå.

ChatGPT er en språkmodell som drives av kunstig intelligens og er trent opp til å utføre en rekke aktiviteter, inkludert oversettelse av språk, oppsummering av informasjon og besvarelse av spørsmål. Modellens enestående evner har vakt betydelig oppmerksomhet, og som et resultat begynner mange mennesker å stille spørsmål ved sine ansettelsesmuligheter.

GPT-4 språkbehandlingsmodellen kan brukes til å analysere enorme mengder data, etterfulgt av at den kan generere innhold basert på funnene fra analysen. Videre er den nye teknologien i stand til å analysere store mengder tekst for å presentere brukere med informasjon om et spesifikt datapunkt.

Det er ingen tvil om at teknologien kommer til å bli her i lang tid. Selvfølgelig hjelper den brukerne på utallige måter. På en rekke anledninger har den demonstrert evnen sin til å utføre alt fra å skrive skript til å løse de vanskeligste spørsmålsoppgavene. Det er ingenting som ChatGPT ikke kan klare. Imidlertid er det noen ting som også er vanskeligere for ChatGPT.

1. Den kunstig intelligens-drevne ChatGPT opplevde et tilbakeslag da den ikke klarte å bestå den ettertraktede Joint Entrance Examination (JEE) i India. Joint Entrance Examination er kjent for sin vanskelighetsgrad og tiltrekker seg tusenvis av studenter hvert år som er interessert i å komme inn på de mest prestisjefylte ingeniørskolene i India. Det er en av de tøffeste kvantitative eksamenene som inkluderer kompliserte diagrammer og tall.

Studenter som er interessert i å søke prestisjefylte utdanningsinstitusjoner som IITs og NITs, må først bestå Joint Entrance Test. Ifølge rapportene, klarte ikke ChatGPT seg godt på JEE Advanced-eksamenen.

Resultatene av ChatGPTs prestasjon i testen var mindre tilfredsstillende, da den kun var i stand til å løse 11 av det totale antallet spørsmål i oppgaven.

2. ChatGPT har tidligere vært vellykket i flere andre tester som både er prominente og vanskelige. Imponerende nok forsøkte ChatGPT å svare på alle 200 spørsmål på nasjonal opptaksprøve for medisinstudier (NEET), hvor kandidatene må svare på 180 spørsmål av totalt 200.

Tross dette, forsøkte ChatGPT å svare på alle 200 spørsmål, og resultatene av ytelsen var 359 av 800. Spesielt klarte ChatGPT seg eksepsjonelt godt i biologi-komponenten av NEET-testen, og viste bedre nøyaktighet i svarene sine på spørsmålene som ble stilt i den delen. Ytelsen til ChatGPT i NEET-testen antyder at den har kapasitet til å kunne utmerke seg innen andre fagområder, selv om den ikke bestod JEE Advanced-eksamenen.

Nederlaget som ChatGPT opplevde i JEE Advanced-testen viser begrensningene som er tilstede selv i de mest avanserte AI-modellene. Selv om kunstig intelligens har potensialet til å forstyrre mange ulike bransjer, har den fortsatt langt igjen før den kan konkurrere med menneskelig intelligens i vanskelige oppgaver.

OpenAI's chatbot ChatGPT har vært mislykket i enda en konkurranseprøve.

3. ChatGPT tok Union Public Service Commission (UPSC)-eksamenen på oppfordring fra Analytics India Magazine (AIM). UPSC-eksamenen regnes som en av de tøffeste konkurranseeksamenene i verden. Hvert år deltar over 10 lakh aspiranter på UPSC-eksamenen, men bare 5% av dem klarer det.

AIM har gitt ChatGPT 100 spørsmål fra UPSC Prelims 2022.

Chatboten gjorde det dårlig på UPSC Prelims 2022-eksamenen og fikk bare 54 av 100 poeng på Spørsmålspapir 1 (Sett A), mens den nødvendige poengsummen var 87,54. Dette betyr at ChatGPT ikke bestod UPSC-testen.

Spørsmålene var basert på emner innen indisk naturvitenskap, historie, geografi, økonomi, økologi og aktuelle hendelser. Chatboten gjorde det bra med spørsmål om steder og økonomi, men den mislyktes elendig når den ble spurt om historiske hendelser som skjedde før år 2021.

Det faktum at ChatGPT sin datasett kun går til 2021 er nok den avgjørende faktoren for AI-botens manglende evne til å svare korrekt på alle eksamensspørsmålene.

4. I tillegg til dette var CLAT-eksamensresultatene for ChatGPT også over gjennomsnittet. Under CLAT UG-eksamen lyktes AI-verktøyet bare i å løse 50,83 prosent av spørsmålene nøyaktig. ChatGPT klarte ikke å løse logiske og kvantitative spørsmål. Imidlertid gjorde det svært godt i engelsk og nåværende affærer. Når det gjaldt spørsmål basert på konsepter, slet dette verktøyet enormt.

Utgitt i november 2022, har ChatGPT gjort det ganske bra i USA. Denne kunstig intelligens teknologien har hatt suksess med å bestå United States Medical Licensing Test (USMLE) og ulike MBA eksamener i USA. I tillegg til dette, har den også hatt suksess med å bestå Google Coding Interviews for Level 3 Engineers.

Dyrehelsepersonell ble tatt på senga nylig da ChatGPT var i stand til å korrekt diagnostisere en hunds tilstand og redde dyrets liv.

Mange land, derimot, har nå motstridende synspunkter på ChatGPT og er villige til å ta kraftige tiltak mot den nye innovasjonen. Nylig har teknologien blitt forbudt i to store land, inkludert Tyskland og Italia. Disse nasjonene hevder at OpenAI's ChatGPT mangler sikkerhetstiltak for å hindre mindreårige i å bli eksponert for støtende materiale, som for eksempel et aldersverifiseringssystem.

Ulrich Kelber, den tyske personvernkommissæren, har sendt ut en advarsel om at Chat-GPT kan bli gjenstand for et potensielt forbud i Tyskland på grunn av bekymringer rundt sikkerheten til brukernes data, noe som ligner det som skjedde i Italia.

Nå skal vi se hvordan teknologi drevet av kunstig intelligens vil oppføre seg i fremtiden.

Takk for at du leser! Følg med for flere informative artikler!

Topp OpenAI's ChatGPT Mislykkes Mens Den Svarer

Relaterte Artikler