Póster P-482 — Precisión de ChatGPT para la estadificación TNM de los cánceres urológicos
Resumen
Objetivo:
Evaluar la exactitud de ChatGPT al especificar la estadificación TNM de los cánceres urológicos a partir de historias clínicas electrónicas.
Métodos:
Se incluyeron pacientes adultos diagnosticados de cáncer de vejiga, de próstata o de riñón en nuestro centro entre 2022 y 2023. Los datos procedentes de informes de anatomía patológica y de radiología se introdujeron en ChatGPT para obtener la estadificación TNM, y las respuestas se compararon con las determinadas por un urólogo. Se calculó el porcentaje de acuerdos positivos (PPA) entre ChatGPT y el urólogo para evaluar la exactitud de las respuestas generadas. El PPA se comparó entre los distintos tumores mediante la prueba de chi-cuadrado, y la correlación entre el PPA y el número de palabras y de caracteres de los informes se analizó mediante el coeficiente de correlación punto-biserial.
Resultados:
Se incluyeron 141 pacientes: 56 (40%) con cáncer vesical, 55 (39%) con cáncer de próstata y 30 (21%) con cáncer renal. Los PPA para los estadios pT, pN, cT, cN y cM fueron del 82% (IC 95%: 0.74–0.88), 66% (IC 95%: 0.58–0.74), 52% (IC 95%: 0.42–0.74), 84% (IC 95%: 0.76–0.90) y 81% (IC 95%: 0.73–0.88), respectivamente. No se observaron diferencias en el PPA entre los tipos tumorales, excepto en los estadios pN y cT (p < 0.001 y p = 0.049, respectivamente). Se identificaron correlaciones positivas débiles entre el número de palabras y el PPA en los estadios pT y pN (rho: 0.25; p = 0.003 y 0.30; p < 0.001, respectivamente).
Conclusión:
ChatGPT mostró una exactitud limitada al especificar la clasificación TNM de los cánceres urológicos. Estos resultados subrayan la importancia de revisar cuidadosamente las salidas generadas antes de utilizarlas en el ámbito sanitario.