Estamos em busca de um desenvolvedor Python com experiência em Inteligência Artificial e ferramentas modernas de NLP para construir uma aplicação de comparação (benchmark) entre diferentes modelos de linguagem (LLMs), como por exemplo, GPT-3.5, Mistral 7B, LLaMA, DeepSeek, entre outros. O projeto deve conter uma base funcional utilizando tecnologias como LangChain, incluindo integração com a API de LLMs (ex: Hugging Face) e organização modular em Python: - Implementação de métodos objetivos de avaliação de LLMs (ex: Evidently ai, bleu, rouge, perplexidade ou outros sugeridos pelo desenvolvedor); - geração de relatórios comparativos entre as respostas dos modelos; - refatoração e padronização do código para facilitar reuso e manutenção. Inicialmente a ideia era para o projeto ser executado locamente, mas o desenvolvedor poderá sugerir outras formas e estrutura. Também pode ser sugerido outras métricas de evaluation que façam sentido para comparação objetiva entre as respostas dos modelos.Category: IT & ProgrammingSubcategory: Artificial IntelligenceProject size: SmallIs this a project or a position?: ProjectRequired availability: As needed
Keyword: Python
Price: $100.0
Secondary Price: $250.0
Python Artificial intelligence
What We’re Building A Pacific Northwest real-estate platform that predicts off-market sellers. We ingest CoreLogic parcels, direct-mail responses, and call transcripts, then serve a real-time lead-scoring API. Your Mission • Architect a Snowflake Iceberg lake + hourly-r...
View JobI'm seeking a bilingual (Spanish and English) support agent to handle client inquiries and escalate issues as needed. Key Responsibilities: - Respond to support requests via WhatsApp, internal chat, and email - Guide users through system modules and navigation - ...
View JobWe’re developing an AI-powered music platform that generates royalty-free production samples using mood, genre, and style inputs. We’re hiring an experienced AI/ML developer to help build the core audio generation engine for our MVP. About the Project: The platform will...
View Job