Especificación del Proyecto: Asistente de Voz en Tiempo Real usando OpenAI Realtime API Objetivo del Proyecto Desarrollar un prototipo funcional de un asistente de voz en tiempo real que responda de manera inmediata utilizando la API Realtime de OpenAI (o una API equivalente). La intención es contar con un asistente de voz fluido y eficiente que responda a consultas en tiempo real mediante streaming de audio, garantizando una interacción continua sin latencias significativas. Requerimientos de Desarrollo Lenguajes de Programación Preferidos: Primarias: Node.js o Go Alternativa: Python (solo si se justifica por la compatibilidad o facilidad con librerías de audio) Características Principales del Prototipo: Implementar una integración básica con la API Realtime de OpenAI o una alternativa adecuada. Captura de Audio: Escucha en tiempo real y procesamiento de voz de entrada del usuario. Transcripción de Audio a Texto (STT): Uso de una API de reconocimiento de voz para convertir el audio en texto. Generación de Respuestas en Tiempo Real (TTS): La respuesta generada debe convertirse nuevamente a audio para ser enviada al usuario por streaming. Streaming de Respuesta en Tiempo Real: Al enviar las respuestas por streaming, es crucial que no haya cortes perceptibles en la voz. Requisitos de Ejemplo Funcional: Se espera un prototipo operativo donde: El usuario pueda hablar con el asistente y recibir respuestas de inmediato. El código esté documentado para facilitar el entendimiento de la configuración y uso de la API Realtime. Incluya un ejemplo mínimo y funcional que capture la interacción completa (entrada de voz → procesamiento → respuesta de voz). Ideal que sepa de Asterisk, nosotros somos expertos en Asterisk para apoyar.Categoría: Programación y TecnologíaSubcategoría: Inteligencia ArtificialTamaño del proyecto: Pequeño¿Es un proyecto o una posición?: Un proyectoDisponibilidad requerida: Según se necesite
Keyword: openai
Price: $100.0
Secondary Price: $250.0
The purpose of this project will be to identify the source of latency and speed up a Voice AI agent that is responding to phone calls. The technology stack is Deepgram for speech to text, Cartesia ai for text to speech, openai for the LLM, and livekit for the platform. ...
View JobI help clients with AI solutions, but sometimes they ask for very technical work and I'm not a developer. I am in need of someone I can sub-contract AI-related development work to, which is usually chatbot creation and integration to websites or apps. My clients can be ...
View Job**Documento de Trabajo: Implementación de Tidio para Farmacia Americana** **Objetivo:** Optimizar la atención al cliente y automatizar respuestas frecuentes a través de Tidio en los canales de comunicación digital de Farmacia Americana: Instagram, Facebook Messenger y W...
View Job