ChatGPT utmanade medicinstudenter – se vem som segrade

Användandet av ChatGPT inom medicinska fältet är redan en verklighet. Men står OpenAIs chatbot sig bättre än blivande läkare? Detta försökte forskare vid Stanford University i USA utröna genom en studie.

ChatGPT utmanade medicinstudenter – se vem som segrade

ChatGPT x läkarstudenter

  • I testet framkom det att ChatGPT kunde utklassa läkarstudenter under deras första och andra år med avseende på frågor kring undersökning och klinisk vård.
  • AI:n användes för att svara på multiple choice-frågor från United States Medical Licensing Examination (USMLE), ett nödvändigt test för yrkesverksamma inom medicinområdet.
  • Syftet var att utvärdera AI:ns förmåga att hantera mer komplexa, öppna frågor som används för att bedöma kliniskt resonemang hos första- och andraårselever vid Stanford.
  • Dessa frågor presenterar detaljer i en patients fall för att identifiera möjliga diagnoser.
  • Studien, publicerad i The Journal of the American Medical Association (JAMA), visade att artificiell intelligens generellt sett presterade fyra poäng bättre än medicinstudenterna.
  • “Vi var förvånade över hur väl ChatGPT klarade av dessa typer av öppna medicinska resonemangsfrågor, och överträffade antalet mänskliga deltagare”, uttalade Eric Strong, klinisk docent vid Stanford School of Medicine och en av studiens författare.
  • “Denna typ av resultat indikerar en förändring i hur vi undervisar och utvärderar medicinskt resonemang genom skrift”, tillade medförfattaren Alicia DiGiammarino, utbildningsansvarig för årskurs 2 vid medicinska fakulteten.

AI krävdes att resonera

  • Forskarna använde den senaste versionen av ChatGPT, kallad GPT-4, som släpptes i mars 2023.
  • 14 kliniska resonemangscase skapades, varje fall fyllt med detaljer som orelaterade kroniska sjukdomstillstånd och medicineringar, samt patientjournaler från verkliga fall.
  • Under testet krävdes det att deltagarna skrev styckesvar på en rad frågor som följde varje fallrapport.
  • “Det är inte förvånande att ChatGPT och liknande program presterar väl på multiple choice-frågor. Informationen som ges till deltagarna är en central del av frågeställningen, så det handlar mest om att återkalla information. En mycket större utmaning är öppna frågor som kräver fritt svar.”

Framtiden inom medicin

  • Genomförandet av testet stärker en redan praktiserad uppfattning vid Stanford University: Tekniker som ChatGPT används för att komplettera studenternas utbildning.
  • “Vi är bara några år från att behöva integrera AI i den dagliga medicinska praktiken”, underströk professor Eric Strong.