Teadlased hindavad ChatGPT jõudlust meditsiiniliste kokkuvõtete tegemisel

Hiljutises ajakirjas The Annals of Family Medicine avaldatud uuringus hindasid teadlased Chat Generative Pretrained Transformeri (ChatGPT) tõhusust arstide abistamiseks mõeldud meditsiiniliste kokkuvõtete tegemisel. Uuringu eesmärk oli määrata ChatGPT loodud kokkuvõtete kvaliteet, täpsus ja kallutatus, andes ülevaate selle potentsiaalist suure hulga meditsiinilise kirjanduse seedimiseks tervishoiutöötajate ajapiirangute ajal.

Kõrged kvaliteedi- ja täpsushinnangud

Uuringus kasutati ChatGPT-d, et koondada 140 meditsiinilist kokkuvõtet 14 erinevast ajakirjast, vähendades sisu keskmiselt 70%. Vaatamata mõningatele ebatäpsustele ja hallutsinatsioonidele, mis tuvastati väikeses osas kokkuvõtetes, hindasid arstid kokkuvõtteid kõrgelt kvaliteedi ja täpsuse osas. Tulemused viitavad sellele, et ChatGPT-l on potentsiaal aidata arstidel meditsiinilist kirjandust tõhusalt läbi vaadata, pakkudes suure teabe hulgast sisutihedaid ja täpseid kokkuvõtteid.

Teadlased valisid igast 10 ajakirjast 14 artiklit, mis hõlmasid erinevaid meditsiinilisi teemasid ja struktuure. Nad tegid ChatGPT-le ülesandeks need artiklid kokku võtta ja hindasid loodud kokkuvõtete kvaliteeti, täpsust, eelarvamusi ja asjakohasust kümnes meditsiinivaldkonnas. Uuring näitas, et ChatGPT koondas edukalt meditsiinilisi kokkuvõtteid keskmiselt 70% võrra, pälvides arstide arvustajatelt kõrgeid hinnanguid kvaliteedi ja täpsuse osas.

Mõju tervishoiule

Vaatamata kõrgetele hinnangutele tuvastas uuring väikeses arvus kokkuvõtetes tõsiseid ebatäpsusi ja hallutsinatsioone. Need vead ulatusid väljajäetud kriitilistest andmetest kuni uuringukavandite väärtõlgendusteni, mis võivad potentsiaalselt muuta uurimistulemuste tõlgendamist. Siiski peeti ChatGPT toimivust meditsiiniliste kokkuvõtete tegemisel usaldusväärseks, kusjuures täheldati minimaalset eelarvamust.

Kuigi ChatGPT näitas ajakirjade tasemel tugevat kooskõla inimeste hinnangutega, oli selle tulemus üksikute artiklite asjakohasuse kindlaksmääramisel konkreetsete meditsiiniliste erialade jaoks vähem muljetavaldav. See lahknevus tõi esile piirangu ChatGPT võimes täpselt tuvastada üksikute artiklite asjakohasust meditsiiniliste erialade laiemas kontekstis.

Uuring annab väärtuslikku teavet tehisintellekti, eriti ChatGPT potentsiaali kohta, mis aitab arstidel tõhusalt läbi vaadata meditsiinilist kirjandust. Kuigi ChatGPT näitab meditsiiniliste kokkuvõtete kõrge kvaliteedi ja täpsusega kokkuvõtete tegemisel lubadust, on vaja täiendavaid uuringuid, et käsitleda piiranguid ja parandada selle toimivust konkreetsetes meditsiinilistes kontekstides.

Tulevased uuringud võiksid keskenduda ChatGPT võime täiustamisele, et tuvastada üksikute artiklite asjakohasus konkreetsete meditsiiniliste erialade jaoks. Lisaks võivad tehtud kokkuvõtete ebatäpsuste ja hallutsinatsioonide leevendamiseks tehtavad jõupingutused veelgi suurendada tehisintellekti tööriistade kasulikkust tervishoiuasutustes.

Allikas: https://www.cryptopolitan.com/chatgpt-in-summarizing-medical-abstracts/