Welcome to Thai nursing time

คุณจิราภรณ์ พราหมณ์คล้ำ 062 619 7893 , คุณอมรรัตน์ ทัดดอกไม้ : 084 635 5414 6:00 AM - 10:00 PM (Mon-Fri)

Mendel และ UMass Amherst บทสรุปผลจากการศึกษาภาพหลอนทางการแพทย์ที่สร้างโดย AI ยังคง เป็นข้อกังวลร้ายแรง

จำนวนผู้เข้าชม : 44 ครั้ง

การศึกษาของ Mendel และ UMass Amherst แสดงให้เห็นภาพหลอนประเภทต่างๆ ในบันทึกทางการแพทย์ที่สรุปโดย AI และความจำเป็นในการตรวจจับที่แข็งแกร่ง


  7 สิงหาคม 2024


 

Mendel สตาร์ทอัพด้านปัญญาประดิษฐ์ (AI) และมหาวิทยาลัยแมสซาชูเซตส์ แอมเฮิร์สต์ (UMass Amherst) ได้ร่วมกันตีพิมพ์ผลการศึกษาเกี่ยวกับการตรวจจับอาการประสาทหลอนในบทสรุปทางการแพทย์ที่สร้างโดย AI


การศึกษานี้ประเมินบทสรุปทางการแพทย์ที่สร้างโดยแบบจำลองภาษาขนาดใหญ่ (LLM) สองแบบ ได้แก่ GPT-4o และ Llama-3 โดยแบ่งประเภทภาพหลอนออกเป็น 5 ประเภทตามตำแหน่งที่เกิดขึ้นในโครงสร้างของบันทึกทางการแพทย์ ได้แก่ ข้อมูลผู้ป่วย ประวัติผู้ป่วย อาการ/การวินิจฉัย/ขั้นตอนการผ่าตัด คำแนะนำที่เกี่ยวข้องกับยา และการติดตามผล


การศึกษาพบว่าบทสรุปที่สร้างโดยโมเดล AI สามารถ “สร้างเนื้อหาที่ไม่ถูกต้องหรือกว้างเกินไปตามข้อมูลในบันทึกทางคลินิกต้นทาง” ซึ่งเรียกว่าภาพหลอนสัตย์ซื่อ ภาพหลอนของ AI เป็นปรากฏการณ์ที่ได้รับการบันทึกไว้อย่างดีการใช้ AI ของGoogle ในเสิร์ชเอ็นจิ้นทำให้เกิด การตอบสนองที่ไร้สาระเช่น "การกินหินก้อนเล็ก ๆ วันละก้อน" และ "การเติมกาวปลอดสารพิษลงในพิซซ่าเพื่อป้องกันไม่ให้มันติด" อย่างไรก็ตาม ในกรณีของบทสรุปทางการแพทย์ ภาพหลอนในบทสรุปทางการแพทย์เหล่านี้อาจบ่อนทำลายความน่าเชื่อถือและความถูกต้องของเวชระเบียนได้

การศึกษานำร่องกระตุ้นให้ GPT-4o และ Llama-3 สร้างบทสรุปความยาว 500 คำจากบันทึกทางการแพทย์โดยละเอียด 50 รายการ การวิจัยพบว่า GPT-4o มีสรุป 21 รายการที่มีข้อมูลที่ไม่ถูกต้อง และสรุป 50 รายการที่มีข้อมูลทั่วไป ในขณะที่ Llama-3 มี 19 และ 47 รายการตามลำดับ นักวิจัยตั้งข้อสังเกตว่า Llama-3 มีแนวโน้มที่จะรายงานรายละเอียด "ตามสภาพ" ในบทสรุป ในขณะที่ GPT-40 สร้าง "ข้อความการให้เหตุผลสองขั้นตอนที่ชัดเจน" ซึ่งอาจนำไปสู่อาการประสาทหลอนได้


การใช้ AI เพิ่มขึ้นในช่วงไม่กี่ปีที่ผ่านมา GlobalData คาดว่ารายได้ทั่วโลกสำหรับแพลตฟอร์ม AI ในด้านการดูแลสุขภาพจะสูงถึงประมาณ 18.8 พันล้านดอลลาร์ภายในปี 2570 นอกจากนี้ยังมีการเรียกร้องให้รวม AI เข้ากับบันทึกสุขภาพอิเล็กทรอนิกส์เพื่อสนับสนุนการตัดสินใจทางคลินิก

การศึกษาของ UMass Amherst และ Mendel กำหนดความต้องการระบบตรวจจับภาพหลอนเพื่อเพิ่มความน่าเชื่อถือและความแม่นยำของข้อมูลสรุปที่สร้างโดย AI การวิจัยพบว่าใช้เวลาโดยเฉลี่ย 92 นาทีสำหรับแพทย์ที่ได้รับการฝึกอบรมมาเป็นอย่างดีในการติดป้ายกำกับข้อมูลสรุปที่สร้างโดย AI ซึ่งอาจมีราคาแพง เพื่อเอาชนะสิ่งนี้ ทีมวิจัยได้ใช้ระบบไฮเปอร์คิวบ์ของเมนเดลเพื่อตรวจจับภาพหลอน


นอกจากนี้ยังพบว่าแม้ว่า Hypercube มีแนวโน้มที่จะประเมินจำนวนภาพหลอนมากเกินไป แต่ก็ตรวจจับภาพหลอนที่ผู้เชี่ยวชาญของมนุษย์มองข้ามไป ทีมวิจัยเสนอการใช้ระบบไฮเปอร์คิวบ์เป็น “ขั้นตอนการตรวจจับอาการประสาทหลอนเบื้องต้น ซึ่งสามารถบูรณาการเข้ากับการตรวจสอบโดยผู้เชี่ยวชาญของมนุษย์เพื่อเพิ่มความแม่นยำในการตรวจจับโดยรวม”

ข้อมูลเมื่อวันที่ 7 สิงหาคม 2567 จาก  https://www-clinicaltrialsarena-com


 

Recent Posts