Stata + ChatGPT, Claude, Gemini y Grok para análisis
Stata da un paso firme hacia la integración práctica de la inteligencia artificial generativa dentro del análisis estadístico. En una reciente publicación técnica, Chuck Huber, Director of Statistical Outreach en StataCorp, mostró cómo ejecutar ChatGPT, Claude, Gemini y Grok directamente desde Stata, utilizando PyStata y las APIs oficiales de cada modelo.
Esta integración no busca reemplazar el análisis estadístico, sino potenciar el flujo de trabajo del analista, permitiendo generar texto, documentar resultados, automatizar tareas y explorar ideas sin salir del entorno de Stata.
IA generativa como extensión natural de Stata
La propuesta es clara: convertir a los modelos de lenguaje en comandos nativos de Stata, ejecutables como cualquier otro .ado.
Ejemplo directo desde la consola:
.chatgpt "Write a haiku about Stata."
.claude "Write a haiku about Stata."
.gemini "Write a haiku about Stata."
.grok "Write a haiku about Stata."
Cada comando envía el texto a un modelo distinto y devuelve la respuesta directamente en la ventana de resultados, sin necesidad de cambiar de herramienta o entorno.
El habilitador clave: PyStata
Toda esta integración se apoya en las capacidades de Stata/Python integration (PyStata), que permite:
Ejecutar código Python desde Stata
Instalar paquetes vía pip
Consumir APIs modernas
Transferir datos y texto entre Stata y Python usando SFI (Stata Function Interface)
Este enfoque posiciona a Stata como una plataforma abierta y extensible, capaz de incorporar tecnologías emergentes sin perder rigor ni reproducibilidad.
ChatGPT en Stata: adaptación a la nueva API de OpenAI
Debido a los cambios recientes en la API de OpenAI, los comandos creados en años anteriores dejaron de funcionar. La solución consiste en actualizar el código Python y utilizar el cliente moderno de OpenAI.
El nuevo comando:
Usa el modelo gpt-4.1-mini
Muestra la respuesta en Stata
Guarda la salida en un archivo .txt
Devuelve el texto a un macro local (r(OutputText))
Esto convierte a ChatGPT en un componente reutilizable dentro de scripts estadísticos.
Claude en Stata: IA conversacional con Anthropic
El modelo Claude, desarrollado por Anthropic, se integra siguiendo exactamente el mismo patrón:
Instalación del paquete anthropic
Uso del modelo claude-3-haiku
Manejo explícito de errores de red o timeout
La similitud entre los comandos demuestra que una vez dominado el patrón PyStata + API, es posible integrar prácticamente cualquier modelo de lenguaje.
Gemini en Stata: la propuesta de Google
Gemini, el modelo de Google, también puede ejecutarse directamente desde Stata mediante su API oficial.
Características destacadas:
Modelo gemini-2.5-flash
Respuestas rápidas
Ideal para generación de texto breve, resúmenes y explicaciones
Gemini se perfila como una opción eficiente para tareas donde la velocidad y claridad son prioritarias.
Grok en Stata: experimentación con xAI
Como ejercicio adicional, el artículo muestra cómo integrar Grok, el modelo de xAI.
Aunque su uso es más experimental, refuerza una idea clave:
cualquier modelo con API puede convertirse en un comando de Stata.
Esto abre la puerta a comparaciones entre modelos y a flujos de trabajo híbridos dentro de un mismo proyecto estadístico.
Un patrón común, múltiples aplicaciones
Todos los comandos comparten la misma arquitectura:
Stata envía el prompt a Python
Python consulta la API del modelo
La respuesta se:
Imprime en Results
Guarda en un archivo de texto
Regresa a Stata como macro
Este patrón puede adaptarse fácilmente para:
Documentar análisis automáticamente
Generar reportes preliminares
Crear asistentes internos para analistas
Apoyar procesos de enseñanza y capacitación
Consideraciones prácticas
Las APIs cambian con frecuencia
Las respuestas largas pueden causar errores al regresar texto a Stata
Para salidas complejas, es preferible trabajar con archivos
Los errores de timeout suelen ser temporales
Estas limitaciones son inherentes al uso de APIs modernas y no representan fallas del enfoque.
La integración de ChatGPT, Claude, Gemini y Grok en Stata confirma que la estadística tradicional y la IA generativa pueden coexistir y complementarse. Gracias a PyStata, los analistas pueden incorporar modelos de lenguaje directamente en sus flujos de trabajo, manteniendo control, reproducibilidad y precisión.
En Multion, vemos esta tendencia como una señal clara del futuro del análisis de datos: herramientas estadísticas robustas potenciadas por inteligencia artificial, trabajando juntas dentro de un mismo entorno.