Desenvolvimento de Ferramenta de Benchmarking para Modelos de Lingu...


$100.00

Estamos em busca de um desenvolvedor Python com experiência em Inteligência Artificial e ferramentas modernas de NLP para construir uma aplicação de comparação (benchmark) entre diferentes modelos de linguagem (LLMs), como por exemplo, GPT-3.5, Mistral 7B, LLaMA, DeepSeek, entre outros. O projeto deve conter uma base funcional utilizando tecnologias como LangChain, incluindo integração com a API de LLMs (ex: Hugging Face) e organização modular em Python: - Implementação de métodos objetivos de avaliação de LLMs (ex: Evidently ai, bleu, rouge, perplexidade ou outros sugeridos pelo desenvolvedor); - geração de relatórios comparativos entre as respostas dos modelos; - refatoração e padronização do código para facilitar reuso e manutenção. Inicialmente a ideia era para o projeto ser executado locamente, mas o desenvolvedor poderá sugerir outras formas e estrutura. Também pode ser sugerido outras métricas de evaluation que façam sentido para comparação objetiva entre as respostas dos modelos.Category: IT & ProgrammingSubcategory: Artificial IntelligenceProject size: SmallIs this a project or a position?: ProjectRequired availability: As needed

Keyword: Python

Price: $100.0

Secondary Price: $250.0

Python Artificial intelligence

 

Web & Mobile Regression Testing

I'm seeking an experienced tester to handle both manual and automated testing for our web and mobile applications. Key Responsibilities: - Design and execute manual and automated test cases based on software requirements and functional specifications - Perform reg...

View Job
Odoo Setup for Travel Business -- 2

I'm seeking an experienced Odoo developer to help set up a basic Odoo system for my small travel business. The goal is efficient accounting management. Requirements: - Odoo installation (community version is fine) - Accounting module setup - GST-compliant invoicin...

View Job
Nvidia Deepstream 7.1

N/D

View Job