Glosario
¿Qué es Agente LLM?
También conocido como: agente de modelo de lenguaje grande, agente de IA
Un agente LLM es un software que utiliza un modelo de lenguaje grande como su capa de toma de decisiones para realizar tareas de múltiples pasos de forma autónoma. A diferencia de una única llamada a un LLM (que produce una respuesta), un agente se ejecuta en un bucle: observa el estado actual, elige una acción (a menudo llamando a herramientas o APIs externas), observa el resultado y repite —hasta que la tarea se completa. Este patrón es la base de los agentes de voz con IA modernos, los asistentes de codificación autónomos y muchos productos de "flujo de trabajo de IA".
El ciclo del agente
Un ciclo de agente típico tiene cuatro pasos: observar (leer el estado actual —la conversación hasta ahora, la entrada del usuario, el resultado de la última acción), pensar (el LLM razona sobre qué hacer a continuación, a menudo produciendo una cadena de pensamiento), actuar (llamar a una herramienta, enviar una respuesta, actualizar el estado) y repetir. El ciclo termina cuando el LLM decide que la tarea ha finalizado o cuando se alcanza una condición externa (máximo de iteraciones, presupuesto de tiempo).
En los agentes de voz, el paso de "actuar" suele ser uno de: responder con voz, transferir la llamada, capturar datos o llamar a una herramienta como book_consultation(). El ciclo se ejecuta una vez por turno conversacional.
Herramientas y llamada de funciones
La característica definitoria de un agente LLM (frente a un LLM simple) es su capacidad para llamar a herramientas externas. Al agente se le proporciona una lista de funciones disponibles (por ejemplo, create_clio_matter, send_text_message, check_calendar_availability) junto con sus esquemas de entrada. El LLM decide cuándo llamar a qué función basándose en la conversación. Los LLM modernos de OpenAI, Anthropic y Google exponen APIs de llamada de funciones estructuradas que hacen esto fiable.
Por qué los agentes son importantes para el trabajo de producción
La mayoría de las tareas del mundo real no son de una sola vez. Reservar una consulta requiere verificar la disponibilidad, preguntar a la persona que llama, confirmar el horario, enviar una confirmación y crear un evento en el calendario. Calificar una admisión legal requiere hacer preguntas en el orden correcto basándose en respuestas anteriores. Resolver un problema de soporte al cliente requiere buscar el registro del cliente, verificar la política relevante y, a veces, escalar. Todos estos son ciclos de agente, no llamadas únicas a un LLM.
Límites de los agentes LLM
Los agentes LLM tienen modos de fallo significativos. Pueden entrar en bucle indefinidamente en tareas ambiguas. Pueden llamar a herramientas incorrectamente cuando se les indica de forma débil. A veces alucinan datos cuando deberían solicitarlos. Los agentes de producción incluyen salvaguardias: recuentos máximos de iteraciones, validación de esquemas en las llamadas a herramientas, retroceso a la escalada humana y condiciones de terminación explícitas.
Los agentes de voz en particular necesitan manejo de turnos e interrupciones además del ciclo básico del agente —el LLM tiene que saber cuándo dejar de hablar y escuchar.