Data Science Engineer - Equipe Performance Dashboard F/H

  • 85 Rue du Faubourg Saint-Martin, 75010 Paris, France
  • Temps complet
  • Département: Technology
  • Contract Type: Long term/Permanent contract

Description de l'entreprise

Le bonheur des uns fait le bonheur des autres.

Depuis 2006, nous sommes connectés aux Français et à leurs habitudes. Nous accompagnons nos 28 millions de visiteurs uniques mensuels dans chaque étape de leur vie, pour (presque) tous leurs besoins. Nous sommes présents sur pratiquement toutes les catégories de biens et services et nous sommes toujours leader sur les catégories immobilier, automobile et emploi. 

Chez leboncoin Groupe, nous avons depuis toujours le souci de l’humain, du bien-être des collaborateurs, de la préservation d’un équilibre sain entre les journées de travail et la vie privée. 

Pour continuer de grandir sans changer d’état d’esprit, nous privilégions une organisation horizontale et des méthodes de management modernes et agiles. 

Depuis plusieurs années leboncoin Groupe participe à la promotion de la diversité en recrutant des personnes avant tout engagées et passionnées. La Mission Handicap s’engage dans cette dynamique en intégrant et accompagnant toutes les personnes en situation de handicap.

C’est également une entreprise où il fait bon travailler, puisqu’elle a été primée au Palmarès Best Workplaces France et Europe, selon le classement établi par l’institut Great Place To Work, et ce, depuis 8 ans désormais !

Description du poste

L’équipe

Vous intégrerez la feature team Panda (Performance Analysis Dashboard) dont la mission est de continuellement améliorer la performance des annonces.

La team Panda est hébergée dans les locaux du Boncoin dans le 10ème arrondissement de Paris, mais développe ses produits pour l’ensemble des places de marché du groupe Adevinta. Dans ce cadre, notre offre est constituée à la fois de produits full-stack et d’algorithmes.

Vous rejoindrez une équipe pluridisciplinaire composée de développeurs backend, de développeurs frontend, de data-scientist, d’un ingénieur QA, un DevOps, un designer UX/UI et sans oublier le Product Owner, tous réunis autour de la méthode agile Scrum.

Dans une démarche d’amélioration continue, l’équipe se réunit toutes les deux semaines pour améliorer ses méthodes de travail et avoir un moment de convivialité !

Dans le contexte d’Adevinta, vous serez amené à interagir avec vos homologues à l’international, ainsi que les différentes marketplaces du groupe

Le contexte technique

  • Un environnement à la pointe et sans legacy constitué principalement de composants back écrits en Go, les composants Data sont en Python/Spark et des composants front en React

  • Un pipe de données utilisant Kafka pour faire communiquer les différents services

  • Les statistiques collectées sont stockées dans DynamoDB, les relations de consultations sont dans une base graphe Neptune et un cluster Redis complète cette architecture pour nos statistiques de la journée

  • Une plateforme d’intégration continue basée sur Github et Travis-Ci

  • Configuration et provisioning avec Spinnaker

  • Notre infrastructure et nos produits sont monitorés sur DataDog

  • Enfin, toute notre infrastructure est hébergée sur Amazon Web Services (AWS)

  • Nous utilisons Athena pour exposer des datasets dans QuickSight pour des besoins de reporting

  • Les données sont explorées et traitées en utilisant Spark sur du EMR et du Kubernetes à venir

  • La donnée chez nous représente :

    • plus de 500 Millions d'événements traités par jour avec 500 000 incréments par seconde lors des piques

    • Plus d’un million de nouvelles annonces par jour et un datalake ayant l’historique de plus d’un milliard d’annonces

Ce que vous ferez

  • Interagir avec les marketplaces et différents stakeholders pour définir les prérequis et faciliter l’intégration de notre produit

  • Mettre en place outils et systèmes de reporting

  • Proposer une architecture d’ingestion, traitement et stockage des données, pour le nouveaux cas d'usage qui se présentent.

  • Concevoir et améliorer les algorithmes de recommandation utilisés

  • Capable de construire et concevoir des solutions techniques à partir de zéro

  • Maintenir le pipe de données :

    • Participer à la définition des formats et contenus attendus de données

    • Contrôler la qualité des données ingérées

    • Participer aux effort de qualité dans le traitement des données

  • Proposer des solutions techniques performantes et à la pointe, d’un point de vue développement et cloud

  • Surveiller la performance et qualité de nos solutions, et intervenir en cas de besoin

En fonction des souhaits du candidat, il est possible de prévoir une montée en compétence sur Golang et de participer au développement du backend.

Qualifications

Aujourd’hui, nous avons besoin de renforcer la team Panda et nous recherchons un passionné de la data expérimenté. Idéalement, le profil recherché doit avoir :

  • Une bonne connaissance d’algorithmique et des structures de données

  • Une connaissance avancée de Python et Spark,

  • Connaissance des algorithmes de Machine Learning

  • Expérience sur des projets utilisant du Scikit-learn ou Tensorflow

  • Bonne connaissance de librairies de manipulation de données comme Pandas et Numpy

  • Une bonne capacité d’analyse

  • Bon niveau écrit et oral en Anglais

Autres qualités recherchées :

  • Aider à améliorer nos méthodes de travail et nos best practices

  • Expérience avec AWS, Google Cloud Platform, ou toute autre système de cloud

Si vous voulez contribuer à un projet à fort impact dans un cadre international, n’attendez plus pour candidater en nous envoyant votre CV !

Vidéos à regarder

Politique de confidentialité