Qualifier des leads en prédisant le type de produit vendu sur un site internet
Ankorstore propose une marketplace mettant en relation des vendeurs avec des fournisseurs. Avec de gros enjeux de croissance, ils cherchent à intégrer des milliers de nouvelles marques et c’est dans ce cadre que nous les avons aidé.
Chaque semaine, ils reçoivent des milliers de sites internet de commerces indépendants potentiellement intéressés pour passer via leur plateforme. Chaque site doit-être étudié à la main pour vérifier la qualité des produits vendus et la catégorie de ces produits. Si la qualité est suffisante et le type de produit vendu compatible avec leurs plateforme, alors le site est contacté individuellement.
Nous avons mis en place un outil permettant d’optimiser ce process en analysant l’ensemble des champs lexicaux disponibles que chaque site internet et noter un score de probabilité d’appartenance à une catégorie de produit.
Grâce à un modèle de machine learning (naive bayes model), notre algorithme comprend que certains mots rattachent un site internet à une catégorie : par exemple, les mots “Visages”, “Peaux”, “Cosmétique”, “Soins” vont augmenter la probabilité d’appartenir à la catégorie “Produits de beauté” et réduire la probabilité d’appartenir à la catégorie "Épicerie".
Ce projet combine :
- le scraping avec la récolte du vocabulaire sur chaque site internet des commerces indépendants ;
- la connexion avec des outils tiers pour traduire les sites internets étranger ;
- l’intelligence artificielle qui va permettre à un algorithme de prédire dans quelle catégorie le site se situe.
La catégorisation de sites internet peut encore être poussée plus loin : ajouter un filtre sur les sites internet avec trop ou trop peu de trafic, isoler les sites mal construits, différencier les sites proposant des produits de ceux proposant des services …