Implementação da Ia de Coleta de Dados de Leilões Online com N8n


$100.00

O objetivo principal é extrair informações específicas (descrição, link, preços e datas) de itens leiloados e salvar esses dados de forma organizada em arquivos JSON separados por site. Objetivos do Projeto: O projeto visa desenvolver um fluxo de trabalho robusto e eficiente no n8n capaz de:     Crawler - Navegar e identificar: Acessar dinamicamente diferentes sites de leilão e identificar as seções relevantes onde os leilões são listados.     Extrair dados seletivamente: Coletar com precisão os seguintes dados de cada item de leilão:         Descrição do item.         URL da página de detalhes do leilão.         Preços (atual, inicial, arremate, etc.).         Datas (início e término).     Adaptabilidade: Ser projetado para se adaptar a variações na estrutura HTML e layout dos sites, minimizando a necessidade de reconfiguração extensiva para novos sites.     Estruturar dados: Organizar os dados extraídos em arquivos JSON separados por site, com uma estrutura consistente para cada item de leilão (campos: "descricao", "link", "precos" com subcampos, "datas" com subcampos).     Escalabilidade e eficiência: Ser projetado para permitir a adição de novos sites e o processamento de um grande volume de dados de forma eficiente dentro das capacidades do n8n. Entregáveis: O profissional/equipe contratada deverá entregar os seguintes itens: Fluxo de trabalho do n8n: Um fluxo de trabalho completo e funcional no n8n que implemente todas as funcionalidades descritas nos objetivos do projeto. O fluxo deve ser bem documentado com comentários e explicações claras de cada nó. Configuração inicial: Instruções detalhadas sobre como configurar o n8n (se necessário) e o fluxo de trabalho para adicionar novos sites de leilão (via variáveis de ambiente, nó de configuração ou outro método definido). Mecanismo de identificação de elementos: A lógica implementada no n8n (utilizando seletores CSS/XPath, funções JavaScript, etc.) Para identificar os elementos HTML relevantes nos diferentes sites.     Mecanismo de extração de dados: A lógica implementada no n8n para extrair os dados específicos (descrição, link, preços, datas) dos elementos identificados, incluindo o tratamento de diferentes formatos de preço e data.   Estrutura de dados JSON: A estrutura JSON final utilizada para armazenar os dados de cada item de leilão, demonstrando a organização dos campos "descricao", "categoria", "link", "precos" e "datas".   Mecanismo de salvamento de arquivos: A implementação no n8n para salvar os dados estruturados em arquivos JSON separados, nomeados de acordo com o site de origem. Documentação técnica: Um documento detalhado descrevendo a arquitetura do fluxo de trabalho, a lógica de cada etapa, as configurações necessárias, como adicionar novos sites e quaisquer considerações ou limitações conhecidas. Testes e validação: Evidência de testes realizados em um conjunto de sites de leilão fornecidos (a serem definidos), demonstrando a correta extração e estruturação dos dados. Requisitos e Habilidades Necessárias: O profissional/equipe contratada deverá possuir as seguintes habilidades e experiência: Profundo conhecimento e experiência prática com a plataforma n8n: Criação, configuração e gerenciamento de fluxos de trabalho complexos no n8n, incluindo o uso de nós core e customizados (se necessário).     Sólida experiência em web scraping: Compreensão dos princípios de web scraping e experiência com ferramentas e técnicas para extrair dados de diferentes estruturas de sites (incluindo manipulação de HTML e tratamento de conteúdo dinâmico).     Proficiência em seletores CSS e XPath: Habilidade para identificar e utilizar seletores precisos para localizar elementos HTML específicos.     Experiência com JavaScript: Necessário para implementar lógica de extração, manipulação e estruturação de dados dentro dos nós de "Function" do n8n.     Conhecimento de estruturas de dados JSON: Compreensão de como estruturar dados em formato JSON para facilitar o processamento posterior.     Capacidade de adaptação e resolução de problemas: Habilidade para lidar com as variações nas estruturas dos sites e solucionar problemas de extração de dados de forma eficiente.     Boa comunicação e organização: Capacidade de comunicar de forma clara o progresso, desafios e soluções, além de entregar uma documentação técnica completa e organizada.     Experiência com Puppeteer ou outras ferramentas de automação de navegador (desejável): Para lidar com sites que utilizam carregamento dinâmico de conteúdo.     Conhecimento básico de versionamento de código (Git desejável): Para gerenciar e compartilhar o fluxo de trabalho do n8n de forma eficiente.Category: IT & ProgrammingSubcategory: Web developmentWhat is the scope of the project?: Medium-sized changeIs this a project or a position?: ProjectI currently have: I have an ideaRequired availability: As neededRoles needed: Developer

Keyword: Python

Price: $100.0

Secondary Price: $250.0

JavaScript MySQL PHP

 

Sales Data Processing and Analysis

N/D

View Job
Embedded Software Conversion Expert Needed

N/D

View Job
Web Scraper Script

Extract all available member information including name, address, email and phone #. The website is listed below: Name and email are most important. https://www.avma.org/ I will provide sign in credentials for the AVMA site once job is awarded.

View Job