ผู้ป่วยเป็นผู้หญิงอายุ 39 ปีที่มาที่แผนกฉุกเฉินที่ศูนย์การแพทย์ Beth Israel Deaconess ในบอสตัน เข่าซ้ายของเธอเจ็บมาหลายวันแล้ว วันก่อนเธอมีไข้ 102 องศา ตอนนี้หายแล้ว แต่เธอยังมีอาการหนาวสั่นอยู่ และเข่าของเธอก็แดงและบวม
การวินิจฉัยคืออะไร?
เมื่อวันศุกร์อันร้อนระอุที่ผ่านมา ดร.เมแกน แลนดอน แพทย์ประจำบ้าน ได้นำกรณีจริงนี้ไปเปิดเผยในห้องที่เต็มไปด้วยนักศึกษาแพทย์และผู้อยู่อาศัย พวกเขารวมตัวกันเพื่อเรียนรู้ทักษะที่ยากจะสอนได้ นั่นคือวิธีคิดแบบหมอ
ดร. อดัม ร็อดแมน อายุรแพทย์ นักประวัติศาสตร์การแพทย์ และผู้จัดงานที่เบธ อิสราเอล ดีคอนเนส กล่าวว่า “แพทย์แย่มากที่สอนแพทย์คนอื่นว่าเราคิดอย่างไร”
แต่คราวนี้พวกเขาสามารถโทรหาผู้เชี่ยวชาญเพื่อขอความช่วยเหลือในการวินิจฉัย – GPT-4 ซึ่งเป็นแชทบอทเวอร์ชันล่าสุดที่ออกโดยบริษัท OpenAI
ปัญญาประดิษฐ์กำลังเปลี่ยนแง่มุมต่างๆ ของการปฏิบัติทางการแพทย์ และผู้เชี่ยวชาญทางการแพทย์บางคนกำลังใช้เครื่องมือเหล่านี้เพื่อช่วยในการวินิจฉัยโรค แพทย์ที่ Beth Israel Deaconess ซึ่งเป็นโรงพยาบาลการสอนในเครือ Harvard Medical School ตัดสินใจสำรวจว่าแชทบอทสามารถนำมาใช้และใช้ในทางที่ผิดได้อย่างไรในการฝึกอบรมแพทย์ในอนาคต
อาจารย์อย่างดร.ร็อดแมนหวังว่านักศึกษาแพทย์จะหันมาใช้ GPT-4 และแชทบอทอื่นๆ กับสิ่งที่แพทย์เรียกว่าการปรึกษาริมทาง เมื่อพวกเขาดึงเพื่อนร่วมงานออกจากกันและขอความเห็นเกี่ยวกับกรณีที่ยากลำบาก แนวคิดคือการใช้แชทบอทในลักษณะเดียวกับที่แพทย์ปรึกษากันเพื่อขอคำแนะนำและข้อมูลเชิงลึก
เป็นเวลากว่าศตวรรษที่แพทย์ได้รับการสวมบทบาทเป็นนักสืบที่รวบรวมเบาะแสและใช้มันเพื่อค้นหาผู้กระทำความผิด แต่แพทย์ที่มีประสบการณ์ใช้วิธีการอื่น – การจดจำรูปแบบ – เพื่อค้นหาว่ามีอะไรผิดปกติ ในทางการแพทย์เรียกว่าสคริปต์การเจ็บป่วย: สัญญาณ อาการ และผลการทดสอบที่แพทย์รวบรวมเพื่อบอกเล่าเรื่องราวที่สอดคล้องกันโดยอิงจากกรณีที่คล้ายกันซึ่งพวกเขารู้จักหรือเคยพบเห็นด้วยตัวเอง
หากสคริปต์การเจ็บป่วยไม่ได้ผล ดร. ร็อดแมนกล่าวว่า แพทย์จะหันไปใช้กลยุทธ์อื่น เช่น การกำหนดความน่าจะเป็นให้กับการวินิจฉัยต่างๆ ที่อาจเหมาะสม
นักวิจัยได้พยายามมานานกว่าครึ่งศตวรรษในการออกแบบโปรแกรมคอมพิวเตอร์เพื่อทำการวินิจฉัยทางการแพทย์ แต่ไม่มีอะไรที่ประสบความสำเร็จอย่างแท้จริง
แพทย์บอกว่า GPT-4 นั้นแตกต่างออกไป ดร. ร็อดแมนกล่าวว่า “มันจะสร้างบางสิ่งที่คล้ายกับสคริปต์การเจ็บป่วยอย่างน่าทึ่ง” ด้วยวิธีนี้ เขากล่าวเสริมว่า “โดยพื้นฐานแล้วมันแตกต่างจากเครื่องมือค้นหา”
ดร. ร็อดแมนและแพทย์คนอื่นๆ ที่เบธ อิสราเอล ดีคอนเนสได้สอบถาม GPT-4 สำหรับการวินิจฉัยที่เป็นไปได้ในกรณีที่ยากลำบาก ใน ศึกษา เผยแพร่เมื่อเดือนที่แล้วในวารสารทางการแพทย์ JAMA พวกเขาพบว่าทำได้ดีกว่าแพทย์ส่วนใหญ่ในการวินิจฉัยความท้าทายรายสัปดาห์ที่ตีพิมพ์ในวารสารการแพทย์นิวอิงแลนด์
แต่พวกเขาได้เรียนรู้ว่า มีศิลปะในการใช้โปรแกรม และมีข้อผิดพลาด
ดร. คริสโตเฟอร์ สมิธ ผู้อำนวยการโครงการอายุรเวชศาสตร์ประจำศูนย์การแพทย์ กล่าวว่า นักศึกษาแพทย์และผู้อยู่อาศัย “กำลังใช้มันอย่างแน่นอน” แต่เขาเสริมว่า “ไม่ว่าพวกเขาจะเรียนรู้อะไรหรือไม่ก็ตามเป็นคำถามเปิด”
ข้อกังวลคือพวกเขาอาจพึ่งพา AI ในการวินิจฉัยด้วยวิธีเดียวกับที่พวกเขาใช้เครื่องคิดเลขบนโทรศัพท์เพื่อทำโจทย์ปัญหาทางคณิตศาสตร์ ดร. สมิ ธ กล่าวว่าเป็นสิ่งที่อันตราย
เขากล่าวว่าการเรียนรู้เกี่ยวข้องกับการพยายามคิดออก: “นั่นคือวิธีที่เรารักษาสิ่งต่างๆ ส่วนหนึ่งของการเรียนรู้คือการต่อสู้ หากคุณจ้าง GPT จากภายนอก อุปสรรคนั้นจะหมดไป”
ในที่ประชุม นักเรียนและประชาชนได้แบ่งกลุ่มและพยายามค้นหาว่าเกิดอะไรขึ้นกับผู้ป่วยที่เข่าบวม จากนั้นพวกเขาก็หันไปหา GPT-4
กลุ่มพยายามใช้วิธีต่างๆ
คนหนึ่งใช้ GPT-4 เพื่อทำการค้นหาทางอินเทอร์เน็ต คล้ายกับวิธีที่คนๆ หนึ่งใช้ Google แชทบอทแสดงรายการการวินิจฉัยที่เป็นไปได้รวมถึงการบาดเจ็บ แต่เมื่อสมาชิกในกลุ่มขอให้อธิบายเหตุผล บอทกลับรู้สึกผิดหวัง โดยอธิบายทางเลือกของมันโดยระบุว่า “การบาดเจ็บเป็นสาเหตุที่พบบ่อยของการบาดเจ็บที่เข่า”
อีกกลุ่มหนึ่งนึกถึงสมมติฐานที่เป็นไปได้และขอให้ GPT-4 ตรวจสอบสมมติฐานเหล่านั้น รายชื่อของแชทบอทเรียงตามกลุ่ม: การติดเชื้อ รวมถึงโรคลายม์; โรคข้ออักเสบรวมถึงโรคเกาต์ซึ่งเป็นโรคข้ออักเสบชนิดหนึ่งที่เกี่ยวข้องกับผลึกในข้อต่อ และการบาดเจ็บ
GPT-4 เพิ่มโรคข้ออักเสบรูมาตอยด์ในความเป็นไปได้อันดับต้น ๆ แม้ว่าจะไม่สูงในรายการของกลุ่ม โรคเกาต์ ผู้สอนบอกกับกลุ่มในภายหลังว่าไม่น่าจะเป็นไปได้สำหรับผู้ป่วยรายนี้เนื่องจากเธอยังเด็กและเป็นผู้หญิง และโรคข้ออักเสบรูมาตอยด์อาจถูกตัดออกเพราะข้อต่ออักเสบเพียงข้อเดียวและอยู่เพียงสองสามวัน
ในฐานะที่ปรึกษาริมถนน GPT-4 ดูเหมือนจะผ่านการทดสอบหรืออย่างน้อยก็เห็นด้วยกับนักเรียนและผู้อยู่อาศัย แต่ในแบบฝึกหัดนี้ไม่ได้ให้ข้อมูลเชิงลึก และไม่มีสคริปต์การเจ็บป่วย
เหตุผลหนึ่งอาจเป็นเพราะนักเรียนและผู้อยู่อาศัยใช้บอทเหมือนเครื่องมือค้นหามากกว่าที่ปรึกษา
ในการใช้บอทอย่างถูกต้อง ผู้สอนกล่าวว่าพวกเขาต้องเริ่มต้นด้วยการบอก GPT-4 ว่า “คุณเป็นหมอกำลังพบผู้หญิงอายุ 39 ปีที่มีอาการปวดเข่า” จากนั้น พวกเขาจะต้องแสดงรายการอาการของเธอก่อนที่จะขอการวินิจฉัยและตามด้วยคำถามเกี่ยวกับเหตุผลของบอต เช่นเดียวกับที่พวกเขาทำกับเพื่อนร่วมงานทางการแพทย์
ผู้สอนกล่าวว่าเป็นวิธีการใช้ประโยชน์จากพลังของ GPT-4 แต่ก็จำเป็นอย่างยิ่งที่จะต้องตระหนักว่าแชทบอทสามารถทำผิดพลาดและ “ประสาทหลอน” ได้ — ให้คำตอบโดยไม่มีพื้นฐานความเป็นจริง การใช้มันจำเป็นต้องรู้เมื่อมันไม่ถูกต้อง
“ไม่ใช่เรื่องผิดที่จะใช้เครื่องมือเหล่านี้” ดร. ไบรอน โครว์ แพทย์อายุรกรรมที่โรงพยาบาลกล่าว “คุณแค่ต้องใช้มันในทางที่ถูกต้อง”
เขาให้การเปรียบเทียบกลุ่ม
“นักบินใช้ GPS” ดร. โครว์กล่าว แต่เขากล่าวเสริมว่า สายการบิน “มีมาตรฐานที่สูงมากสำหรับความน่าเชื่อถือ” ในทางการแพทย์ เขากล่าวว่าการใช้แชทบอทนั้น “น่าดึงดูดใจมาก” แต่ควรใช้มาตรฐานระดับสูงเช่นเดียวกัน
“มันเป็นพันธมิตรทางความคิดที่ยอดเยี่ยม แต่มันไม่ได้แทนที่ความเชี่ยวชาญทางจิตอย่างลึกซึ้ง” เขากล่าว
เมื่อจบการอบรม อาจารย์ ได้เผยสาเหตุที่แท้จริงที่ทำให้ผู้ป่วยเข่าบวม
มันกลายเป็นความเป็นไปได้ที่ทุกกลุ่มได้พิจารณาและ GPT-4 ได้เสนอ
เธอเป็นโรคลายม์
Olivia Allison สนับสนุนการรายงาน