AP - Adrien Poua
Aperçu du projet Amazon scraping

Amazon scraping

Application de monitoring des produits sur Amazon avec scraping automatisé et alertes en temps réel.

Privé
Le Défi

Problématique

Le client, vendeur sur Amazon France, avait besoin d'un outil interne pour surveiller son catalogue de plusieurs centaines de produits. L'enjeu principal : suivre en temps réel l'évolution des prix, la disponibilité des stocks et le positionnement par rapport aux concurrents sur la Buy Box. Sans outil dédié, cette veille manuelle était impossible à maintenir. La solution devait également contourner les protections anti-bot d'Amazon pour collecter les données de manière fiable, tout en générant des rapports Excel exploitables par l'équipe commerciale.

L'Approche

Solution technique

L'application adopte une architecture microservices Docker orchestrant 4 services distincts :

  • Frontend Next.js 16 avec TanStack Query pour le cache client et Tailwind CSS
  • API REST NestJS 11 gérant l'authentification (Passport JWT) et la logique métier (TypeORM)
  • Service Browserless (Chromium headless + Playwright) pour le scraping
  • Service Cron dédié déclenchant les rafraîchissements automatiques

Le scraping Amazon nécessite une stratégie anti-détection robuste :

  • Rotation de User-Agents et headers réalistes
  • Délais aléatoires entre les requêtes
  • Mode stealth Playwright pour contourner les fingerprints

La couche données s'appuie sur PostgreSQL pour la persistance des produits et Redis pour le cache des données scrapées. L'ensemble est déployé sur OVH via Coolify, permettant un contrôle total de l'infrastructure.

Technologies

Stack technique

Next.jsNestJSDockerRedisOVHPlaywrightPostgreSQL