
La carrera de la inteligencia artificial llevaba meses centrada en quién era más rápido, más creativo o más popular. Pero un nuevo estudio acaba de mover la conversación hacia otro lugar mucho más incómodo para la industria tecnológica: qué asistente falla menos cuando realmente importa.
Y los resultados no favorecen necesariamente a las plataformas más usadas.
De acuerdo con un reporte retomado por Security Storage und Channel Germany, el asistente de IA mejor evaluado en confiabilidad y menor tasa de alucinaciones fue Perplexity AI, superando a competidores como OpenAI, Google y Anthropic.
La IA más popular no fue la más confiable
Según el ranking citado en el análisis, Perplexity registró una tasa de alucinaciones cercana al 13%, convirtiéndose en la herramienta con menor nivel de respuestas incorrectas dentro de la comparación.
En segundo lugar apareció xAI con Grok, mientras que ChatGPT quedó bastante más abajo con una tasa de errores cercana al 30%, más del doble de algunos competidores enfocados en búsqueda factual y verificación.
Incluso asistentes como Gemini y Claude quedaron por debajo de lo que muchos usuarios probablemente esperarían dentro de este tipo de evaluaciones.
¿Qué significa realmente una “alucinación” en IA?
Dentro del mundo de inteligencia artificial, una alucinación ocurre cuando un sistema genera información falsa, inventada o incorrecta presentada como si fuera verdadera.
Puede tratarse de:
- datos inexistentes;
- citas falsas;
- referencias inventadas;
- fechas incorrectas;
- conclusiones erróneas;
- respuestas completamente fabricadas.
El problema no es únicamente que se equivoquen.
Es que muchas veces responden con enorme seguridad aunque la información sea falsa.
Perplexity juega otro juego
Parte de la ventaja de Perplexity parece estar relacionada con cómo funciona su modelo.
Mientras asistentes como ChatGPT están diseñados principalmente como herramientas conversacionales y generativas, Perplexity opera más como un motor de búsqueda potenciado por IA que prioriza respuestas respaldadas con fuentes visibles y navegación web en tiempo real.
Eso cambia completamente la lógica del producto.
En lugar de enfocarse primero en creatividad o conversación prolongada, la plataforma prioriza:
- búsqueda factual;
- referencias verificables;
- síntesis de información web;
- transparencia de fuentes.
La industria empieza a dividirse por funciones
El estudio también refleja algo más amplio: la industria de IA ya no parece moverse hacia una sola herramienta universal.
Ahora cada plataforma empieza a especializarse.
- ChatGPT domina en escritura, brainstorming y conversación;
- Claude destaca en documentos largos y ciertos flujos empresariales;
- Gemini apuesta por integración multimodal;
- Grok se enfoca en información social y web;
- Perplexity se posiciona como motor de investigación y verificación.
La competencia ya no parece centrarse únicamente en quién tiene la IA “más inteligente”, sino en quién resuelve mejor tareas específicas.
El verdadero problema: confiar demasiado
Aunque los rankings generan conversación, especialistas insisten en algo importante: ninguna IA actual debería utilizarse sin supervisión humana en tareas críticas.
Investigaciones académicas recientes muestran que los niveles de error siguen siendo relevantes en prácticamente todos los modelos actuales, especialmente en áreas como:
- derecho;
- salud;
- ciencia;
- programación;
- finanzas.
Eso explica por qué cada vez más empresas y usuarios empiezan a valorar no solo creatividad o velocidad, sino confiabilidad.
Porque cuando una IA ayuda a escribir un tweet, el margen de error puede parecer menor.
Pero cuando participa en decisiones médicas, legales o empresariales, una respuesta incorrecta deja de ser un detalle técnico y se convierte en un riesgo real.
La nueva batalla de la inteligencia artificial
Durante años, Silicon Valley vendió la idea de asistentes cada vez más poderosos.
Ahora empieza otra etapa.
La batalla por convertirse en la IA que la gente realmente pueda creerle.
Y eso cambia completamente la conversación alrededor de estas herramientas.
Porque quizá el futuro de la inteligencia artificial ya no dependa únicamente de quién responde más rápido.
Sino de quién inventa menos.












