ESEntrepriseScan
Cas d'usage

Jeu de données QA : des entreprises françaises prêtes à l'emploi

Plutôt que d'écrire à la main « Société Test 1 », « Société Test 2 »… utilisez des données d'entreprise réalistes. Vos QA et vos démos gagnent en crédibilité, votre déduplication est testée pour de vrai.

Pourquoi des données réalistes ?

Les jeux de test générés à la main ressemblent rarement à la production. Des noms trop simples, des SIRET inventés, des codes NAF cohérents nulle part. Résultat :

  • les bugs liés à la longueur ou à l'encodage des noms passent inaperçus ;
  • les validations SIRET (Luhn, API) ne sont jamais réellement testées ;
  • les démos commerciales semblent peu professionnelles.

EntrepriseScan remplace ces seeds bricolés par des entreprises réelles, filtrables par secteur, ville et département.

Workflow recommandé

  1. Ouvrir le générateur, choisir un secteur et une limite.
  2. Cocher « Uniquement établissements actifs » pour un dataset propre.
  3. Cocher « Exclure les SIRET déjà copiés » pour éviter les doublons entre vos runs.
  4. Cliquer sur « Télécharger CSV » ou « Copier dataset » et coller dans votre script de seed.

Format dataset

Le mode dataset produit un JSON minimal, idéal pour vos seeds :

[
  {
    "companyName": "SOFTWARE LYON",
    "siren": "421987123",
    "siret": "42198712300045",
    "nafCode": "6201Z",
    "city": "Lyon",
    "postalCode": "69003"
  }
]

À combiner avec

Questions fréquentes

Comment générer un jeu de données QA de 100 entreprises ?

Ouvrez le générateur, sélectionnez la limite à 100, choisissez un secteur ou une ville, puis cliquez sur Générer. Vous pouvez exporter le résultat au format CSV ou JSON en un clic.

Mes jeux de données doivent rester distincts entre runs. Comment faire ?

Activez l'option « Exclure les SIRET déjà copiés ». EntrepriseScan garde un historique local des numéros déjà extraits, ce qui garantit que vos prochains runs ne renvoient pas les mêmes entreprises.

Quel format pour mes seeds Postgres / MySQL ?

Le format CSV est le plus pratique pour un COPY ou un LOAD DATA INFILE. Pour des scripts de seed Node.js, Prisma ou Drizzle, préférez le mode JSON ou « dataset » qui produit un tableau d'objets prêt à l'emploi.

Combien d'entreprises puis-je générer par run ?

Jusqu'à 100 entreprises par requête. Vous pouvez enchaîner plusieurs runs avec l'option anti-doublon active pour constituer rapidement un jeu de plusieurs centaines de lignes.