El problema real: integridad epistémica en la era de los modelos de lenguaje
La irrupción de los modelos de lenguaje de gran escala (LLM, por sus siglas en inglés: Large Language Models) en el ecosistema académico plantea una tensión que va más allá del plagio convencional. El problema central no es si "la máquina escribió el texto", sino si el proceso de producción del conocimiento preserva la integridad epistémica, es decir, la correspondencia verificable entre lo que el investigador afirma saber y lo que realmente puede sustentar con evidencia propia. Usar IA sin hacer trampa significa, en términos operativos, mantener esa correspondencia intacta en cada etapa del ciclo investigativo.
Dónde está la línea: autoría, agencia y responsabilidad intelectual
Las instituciones académicas y los comités editoriales distinguen hoy entre dos formas de uso de IA. La primera es el uso instrumental, donde la herramienta actúa como amplificador de capacidades del investigador, similar a una calculadora estadística o un gestor bibliográfico. La segunda es la suplantación de agencia epistémica, que ocurre cuando el sistema genera el argumento central, las inferencias o las conclusiones que el investigador firma como propias sin haberlas elaborado, evaluado críticamente ni verificado de forma independiente.
La distinción no es trivial. Un investigador que usa un LLM para reformular un párrafo que ya argumentó sigue siendo el autor intelectual de ese argumento. Uno que le pide al modelo "escribe la discusión de mis resultados" y transcribe la salida sin revisión crítica profunda ha cedido su agencia, aunque el texto pase cualquier detector automático de plagio.
Usos legítimos a lo largo del proceso investigativo
El uso ético de IA en investigación se concentra en tareas donde el modelo opera como asistente técnico, no como productor de conocimiento original. Los siguientes usos son generalmente aceptados por la comunidad académica y los lineamientos de revistas indexadas:
- Corrección de estilo y gramática: mejorar la claridad sintáctica de un texto cuyo contenido y argumentación ya elaboró el autor.
- Exploración bibliográfica inicial: identificar áreas temáticas, términos clave o autores relevantes como punto de partida, siempre verificando cada referencia en bases de datos primarias como Web of Science, Scopus o PubMed.
- Síntesis auxiliar de literatura: solicitar resúmenes de artículos que el investigador ya leyó, para contrastar su propia comprensión, no para sustituirla.
- Generación de código para análisis de datos: producir scripts en R, Python u otros lenguajes para tareas estadísticas o visualización, siempre que el investigador comprenda y valide el código resultante.
- Brainstorming metodológico: explorar posibles diseños de investigación o instrumentos de medición como insumo para el juicio experto del investigador, no como decisión final.
- Traducción asistida: como apoyo en comunicación multilingüe, con revisión posterior por hablante nativo o traductor especializado.
Usos que comprometen la integridad académica
El alucinamiento (en inglés, hallucination) es la tendencia documentada de los LLM a generar afirmaciones factuales falsas con apariencia de certeza, incluyendo referencias bibliográficas inexistentes, datos estadísticos inventados y citas textuales fabricadas. Este fenómeno hace que ciertos usos sean intrínsecamente problemáticos desde el punto de vista de la integridad investigativa:
- Delegar la redacción de la revisión de literatura sin verificar cada fuente citada por el modelo.
- Usar las conclusiones generadas por el LLM como si fueran producto del análisis del investigador.
- Presentar el marco teórico elaborado por el modelo sin haber leído los autores que supuestamente lo sustentan.
- Emplear IA para responder preguntas de examen, elaborar tesis o producir entregables evaluados sin declaración explícita y sin autorización institucional.
El principio de verificación independiente
Toda afirmación factual, referencia bibliográfica o dato que provenga de un LLM debe someterse a verificación independiente antes de incorporarse a cualquier trabajo académico. Esto implica rastrear la fuente primaria, leerla directamente y confirmar que el contenido corresponde a lo que el modelo afirmó. Este principio no es discrecional: es el estándar mínimo que diferencia el uso instrumental del uso fraudulento.
Una práctica recomendada es aplicar el principio de trazabilidad epistémica, es decir, ser capaz de responder, para cada afirmación del trabajo, de dónde proviene el conocimiento: qué se leyó, qué se analizó, qué se observó. Si la única respuesta posible es "lo generó el modelo", la afirmación no tiene lugar en un texto con pretensión científica.
Declaración de uso y transparencia metodológica
Las revistas de mayor impacto y las principales universidades del mundo están convergiendo en exigir una sección de declaración de uso de IA dentro del apartado de metodología o en una nota al pie específica. Esta declaración debe especificar qué herramientas se utilizaron, con qué propósito y en qué secciones del trabajo. La transparencia no es una concesión: es el mecanismo que permite a la comunidad académica evaluar el proceso, no solo el producto.
En México, la Ley Federal del Derecho de Autor no reconoce a sistemas automáticos como autores, lo que implica que la responsabilidad legal y ética del contenido recae íntegramente en el investigador que lo firma. La transparencia metodológica es, en ese sentido, también una protección jurídica.
Criterio operativo para decidir en el momento
Ante cualquier uso específico, aplica esta prueba de tres preguntas: ¿puedo explicar con mis propias palabras el argumento, dato o conclusión que estoy incorporando? ¿Puedo señalar la fuente primaria que lo respalda? ¿Declararé el uso de IA en el método si la institución o la revista lo requiere? Si la respuesta a cualquiera de las tres es negativa, el uso en cuestión cruza la línea de la integridad académica.
Glosario
- Modelo de lenguaje de gran escala (LLM): sistema de inteligencia artificial entrenado sobre corpus masivos de texto para generar lenguaje natural estadísticamente coherente.
- Integridad epistémica: correspondencia verificable entre las afirmaciones de conocimiento de un agente y la evidencia que las sustenta.
- Suplantación de agencia epistémica: delegación al sistema automatizado del proceso de argumentación, inferencia o síntesis que debería realizar el investigador.
- Alucinamiento (hallucination): generación de contenido factualmente incorrecto por parte de un LLM con apariencia de veracidad.
- Verificación independiente: proceso de corroborar una afirmación a través de fuentes primarias, sin depender del sistema que la generó.
- Trazabilidad epistémica: capacidad de identificar el origen verificable de cada afirmación de conocimiento dentro de un trabajo académico.
- Declaración de uso de IA: sección metodológica o nota explícita en un trabajo académico donde se especifica el rol de herramientas de inteligencia artificial en su producción.