Glosario
¿Qué es Llamada de funciones?
También conocido como: llamada de herramientas, uso de herramientas, salida estructurada
La llamada de funciones (a veces "llamada de herramientas" o "uso de herramientas") es la característica de los modelos de lenguaje que permite a un LLM decidir cuándo invocar una función externa con argumentos estructurados en lugar de producir texto libre. El desarrollador registra una lista de funciones disponibles (book_appointment, create_clio_matter, search_documents), cada una con un esquema de entrada. El modelo decide durante una conversación qué función llamar y produce un objeto JSON estructurado que coincide con el esquema. La función se ejecuta; su resultado se retroalimenta a la conversación; el modelo continúa. La llamada de funciones es lo que convierte un chatbot simple en un agente útil.
Cómo funciona la llamada de funciones
En una llamada a la API de un LLM habilitado para la llamada de funciones, el desarrollador pasa las funciones disponibles como parte de la solicitud, junto con los mensajes de la conversación. Cada función tiene un nombre, una descripción y un esquema JSON para las entradas. El modelo lee la conversación, decide si responder con texto o llamar a una función, y si llama a una función, produce un objeto JSON que coincide con el esquema. La aplicación ejecuta la función, obtiene un resultado, añade un mensaje de resultado de herramienta a la conversación y vuelve a llamar a la API. El modelo utiliza el resultado para continuar (y puede llamar a más funciones en secuencia).
OpenAI, Anthropic y Google exponen APIs de llamada de funciones en sus modelos insignia. Los esquemas y formatos de mensajes difieren ligeramente por proveedor, pero el patrón es el mismo.
Por qué la llamada de funciones es importante para los agentes de producción
Sin la llamada de funciones, un LLM solo puede producir texto. Con la llamada de funciones, puede realizar acciones: reservar citas, buscar registros de clientes, crear contactos en el CRM, enviar correos electrónicos, consultar bases de datos. Esta es la línea divisoria entre "chatbot de IA que habla" y "agente de IA que trabaja".
Para un agente de voz de admisión legal con IA específicamente, las llamadas de funciones manejan: la creación del asunto en Clio, la reserva de la consulta en el calendario del abogado correcto, la ejecución de una verificación de conflictos con los clientes existentes, el envío del SMS de confirmación de la consulta y la transferencia de la llamada a un humano cuando la persona que llama lo solicita.
Modos de fallo de la llamada de funciones
Las llamadas de funciones no son perfectas. Los modelos ocasionalmente llaman a la función incorrecta, pasan argumentos mal formados que no coinciden del todo con el esquema, o llaman a una función cuando la respuesta correcta era una respuesta de texto. Los agentes de producción envuelven las llamadas de funciones en validación de esquemas, lógica de reintento y rutas de respaldo explícitas. También escribimos las descripciones de las funciones como instrucciones ("Use book_appointment SÓLO cuando la persona que llama haya confirmado un horario específico"), porque esas descripciones se convierten en parte de la toma de decisiones del modelo.