Data Scientist — NLP & Legal/Economic Data — Automation & Applied AI

Turning complex legal and economic data into clear, reliable decisions.

I design NLP pipelines, econometric models, and automation systems that transform legal evidence into auditable, decision-ready intelligence.

Transformer des données juridiques et économiques en décisions claires et fiables.

Je conçois des pipelines NLP, des modèles économétriques et des systèmes d’automatisation qui transforment la preuve juridique en intelligence décisionnelle auditable.

Complexe juridische en economische data omzetten in heldere, betrouwbare beslissingen.

Ik ontwerp NLP-pijplijnen, econometrische modellen en automatiseringssystemen die juridisch bewijs omzetten in controleerbare besluitvorming.

Workflow overview for legal data automation
Trusted delivery pipeline Pipeline de livraison fiable Betrouwbare delivery-pijplijn

From intake → NLP triage → explainable outputs → governance-ready reports. De l’ingestion → tri NLP → résultats explicables → rapports prêts pour la gouvernance. Van intake → NLP-triage → verklaarbare outputs → governance-klare rapporten.

Explainability Auditability Human-in-the-loop Data governance Model monitoring Security by design

Proof Preuves Bewijs

Key metrics Indicateurs clés Kerncijfers
6+ years

Applied analytics across legal + economic contexts. Analytics appliqués aux contextes juridiques + économiques. Toegepaste analytics in juridische + economische contexten.

NLP + AI

From text pipelines to deployment-ready models. Des pipelines texte aux modèles prêts au déploiement. Van tekstoplossingen tot inzetbare modellen.

Legal & Economic

Data governance, auditability, and defensible outputs. Gouvernance des données, auditabilité et résultats défendables. Datagovernance, auditbaarheid en verdedigbare outputs.

Automation

End-to-end delivery from intake to decision support. Livraison de bout en bout, de l’ingestion à l’aide à la décision. End-to-end levering van intake tot besluitondersteuning.

Projects Projets Projecten

Case studies Études de cas Casestudy’s
Project preview placeholder
2024
NLPautomationlegal-tech

Document submission automation Automatisation des dépôts de documents Automatisering van documentindiening

Automated multilingual document intake and validation workflows for court-ready data pipelines with Artificial Intelligence. Automatisation de l’ingestion multilingue et des validations pour des pipelines prêts pour les tribunaux, avec l’Artificial Intelligence. Geautomatiseerde meertalige documentinname en validatie voor rechtbankklare datapijplijnen met Artificial Intelligence.

Problem Problème Probleem

Automated multilingual document intake and validation workflows for court-ready data pipelines with Artificial Intelligence. Automatisation de l’ingestion multilingue et des validations pour des pipelines prêts pour les tribunaux, avec l’Artificial Intelligence. Geautomatiseerde meertalige documentinname en validatie voor rechtbankklare datapijplijnen met Artificial Intelligence.

Approach Approche Aanpak

Designed an applied AI pipeline using Python, NLP, SQL, Airflow. Conception d’un pipeline IA appliquée avec Python, NLP, SQL, Airflow. Ontworpen toegepaste AI-pijplijn met Python, NLP, SQL, Airflow.

Results / Impact Résultats / Impact Resultaten / Impact

  • Reduced manual triage and data entry for legal teams. Réduction du tri manuel et de la saisie de données pour les équipes juridiques. Verminderde handmatige triage en data-invoer voor juridische teams.
  • Improved traceability and governance across submissions. Traçabilité et gouvernance renforcées sur l’ensemble des dépôts. Betere traceerbaarheid en governance over alle inzendingen.

Stack Stack Stack

Python, spaCy, SQL, Airflow, Git

Links Liens Links

Project preview placeholder
2023
NLPlegal-tech

Case-law text classification Classification de textes jurisprudentiels Classificatie van jurisprudentieteksten

Built classification models to route and prioritize case-law documents for faster review. Conception de modèles de classification pour orienter et prioriser les documents de jurisprudence plus rapidement. Ontwikkelde classificatiemodellen om jurisprudentiedocumenten te routeren en te prioriteren voor snellere beoordeling.

Problem Problème Probleem

Built classification models to route and prioritize case-law documents for faster review. Conception de modèles de classification pour orienter et prioriser les documents de jurisprudence plus rapidement. Ontwikkelde classificatiemodellen om jurisprudentiedocumenten te routeren en te prioriteren voor snellere beoordeling.

Approach Approche Aanpak

Designed an applied AI pipeline using Python, NLP, ML. Conception d’un pipeline IA appliquée avec Python, NLP, ML. Ontworpen toegepaste AI-pijplijn met Python, NLP, ML.

Results / Impact Résultats / Impact Resultaten / Impact

  • Increased consistency in document routing decisions. Décisions d’orientation plus cohérentes pour les documents. Consistentere routeringsbeslissingen voor documenten.
  • Enabled reusable NLP pipelines for new domains. Pipelines NLP réutilisables pour de nouveaux domaines. Herbruikbare NLP-pijplijnen voor nieuwe domeinen mogelijk gemaakt.

Stack Stack Stack

Python, scikit-learn, spaCy, MLflow

Links Liens Links

Project preview placeholder
2022
econometricslegal-tech

Damages quantification modelling Modélisation de quantification des dommages Modellering van schadebegroting

Designed econometric models for cartel damages estimation in competition cases. Conception de modèles économétriques pour estimer les dommages dans des affaires de concurrence. Ontworpen econometrische modellen voor het schatten van kartelschade in mededingingszaken.

Problem Problème Probleem

Designed econometric models for cartel damages estimation in competition cases. Conception de modèles économétriques pour estimer les dommages dans des affaires de concurrence. Ontworpen econometrische modellen voor het schatten van kartelschade in mededingingszaken.

Approach Approche Aanpak

Designed an applied AI pipeline using R, Python, STATA. Conception d’un pipeline IA appliquée avec R, Python, STATA. Ontworpen toegepaste AI-pijplijn met R, Python, STATA.

Results / Impact Résultats / Impact Resultaten / Impact

  • Provided defensible estimates for litigation support. Estimations défendables pour le soutien aux litiges. Verdedigbare schattingen voor procesondersteuning geleverd.
  • Streamlined model validation across multiple datasets. Validation des modèles rationalisée sur plusieurs jeux de données. Modelvalidatie gestroomlijnd over meerdere datasets.

Stack Stack Stack

R, Python, STATA

Links Liens Links

Project preview placeholder
2021
automationdashboards

End-to-end data automation Automatisation des données de bout en bout End-to-end data-automatisering

Automated ingestion, transformation, and reporting across multi-source datasets. Automatisation de l’ingestion, de la transformation et du reporting sur des jeux de données multi-sources. Automatisering van ingestie, transformatie en rapportage over multi-source datasets.

Problem Problème Probleem

Automated ingestion, transformation, and reporting across multi-source datasets. Automatisation de l’ingestion, de la transformation et du reporting sur des jeux de données multi-sources. Automatisering van ingestie, transformatie en rapportage over multi-source datasets.

Approach Approche Aanpak

Designed an applied AI pipeline using Python, Airflow, SQL. Conception d’un pipeline IA appliquée avec Python, Airflow, SQL. Ontworpen toegepaste AI-pijplijn met Python, Airflow, SQL.

Results / Impact Résultats / Impact Resultaten / Impact

  • Significantly improved delivery speed for recurring analyses. Accélération significative de la livraison des analyses récurrentes. De levertijd van terugkerende analyses aanzienlijk versneld.
  • Cut manual QA time with automated checks. Réduction du temps de QA manuel grâce à des contrôles automatisés. Handmatige QA-tijd verkort met geautomatiseerde controles.

Stack Stack Stack

Python, Airflow, SQL, Git

Links Liens Links

Project preview placeholder
2021
automationeconometrics

Public data processing Traitement des données publiques Verwerking van publieke data

Built reusable pipelines for Eurostat, ECB, and IMF datasets. Création de pipelines réutilisables pour les jeux de données Eurostat, BCE et FMI. Bouwde herbruikbare pijplijnen voor Eurostat-, ECB- en IMF-datasets.

Problem Problème Probleem

Built reusable pipelines for Eurostat, ECB, and IMF datasets. Création de pipelines réutilisables pour les jeux de données Eurostat, BCE et FMI. Bouwde herbruikbare pijplijnen voor Eurostat-, ECB- en IMF-datasets.

Approach Approche Aanpak

Designed an applied AI pipeline using Python, R, SQL. Conception d’un pipeline IA appliquée avec Python, R, SQL. Ontworpen toegepaste AI-pijplijn met Python, R, SQL.

Results / Impact Résultats / Impact Resultaten / Impact

  • Enabled faster scenario analysis for economists. Analyse de scénarios plus rapide pour les économistes. Snellere scenarioanalyse mogelijk gemaakt voor economen.
  • Improved data consistency across client reports. Meilleure cohérence des données dans les rapports clients. Betere dataconsistentie in klantrapporten.

Stack Stack Stack

Python, R, SQL

Links Liens Links

Project preview placeholder
2020
dashboardsautomation

Interactive dashboards Tableaux de bord interactifs Interactieve dashboards

Delivered Shiny and Streamlit dashboards for analytics stakeholders. Livraison de tableaux de bord Shiny et Streamlit pour les parties prenantes analytics. Levering van Shiny- en Streamlit-dashboards voor analytics-stakeholders.

Problem Problème Probleem

Delivered Shiny and Streamlit dashboards for analytics stakeholders. Livraison de tableaux de bord Shiny et Streamlit pour les parties prenantes analytics. Levering van Shiny- en Streamlit-dashboards voor analytics-stakeholders.

Approach Approche Aanpak

Designed an applied AI pipeline using R, Python, PowerBI. Conception d’un pipeline IA appliquée avec R, Python, PowerBI. Ontworpen toegepaste AI-pijplijn met R, Python, PowerBI.

Results / Impact Résultats / Impact Resultaten / Impact

  • Made complex outputs accessible to non-technical users. Rendu les résultats complexes accessibles aux non-techniciens. Complexe outputs toegankelijk gemaakt voor niet-technische gebruikers.
  • Standardized KPI reporting across engagements. Standardisation du reporting KPI sur les missions. KPI-rapportering gestandaardiseerd over opdrachten heen.

Stack Stack Stack

R Shiny, Streamlit, PowerBI

Links Liens Links

Project preview placeholder
2020
legal-techNLP

Litigation risk analysis Analyse du risque de contentieux Analyse van procesrisico

Quantified litigation exposure using structured + text data signals. Quantification de l’exposition au contentieux via des signaux de données structurées et textuelles. Kwantificeerde procesrisico met gestructureerde en tekstuele datasignalen.

Problem Problème Probleem

Quantified litigation exposure using structured + text data signals. Quantification de l’exposition au contentieux via des signaux de données structurées et textuelles. Kwantificeerde procesrisico met gestructureerde en tekstuele datasignalen.

Approach Approche Aanpak

Designed an applied AI pipeline using Python, SQL, NLP. Conception d’un pipeline IA appliquée avec Python, SQL, NLP. Ontworpen toegepaste AI-pijplijn met Python, SQL, NLP.

Results / Impact Résultats / Impact Resultaten / Impact

  • Supported legal teams with risk scoring insights. Aide aux équipes juridiques via des scores de risque. Juridische teams ondersteund met risico-inzichten.
  • Enhanced narrative reporting with NLP evidence. Renforcement des rapports narratifs avec des preuves NLP. Narratieve rapportage versterkt met NLP-bewijs.

Stack Stack Stack

Python, SQL, NLP

Links Liens Links

Publications / Writing Publications / Écrits Publicaties / Schrijven

View all Voir tout Bekijk alles
Publication Publication Publicatie

Decoding Transaction Data in Private Competition Law Damage Litigations: Efficient data management in legal proceedings Décoder les données transactionnelles dans les litiges en dommages de concurrence : gestion efficace des données Transactiegegevens in mededingingsschadezaken: efficiënte databeheer in juridische procedures

CDC Cartel Damage Claims Consulting · 2023

Read Lire Lees
Publication Publication Publicatie

General Court entirely dismisses Scania’s appeal and confirms Scania’s participation in the Truck Cartel Le Tribunal rejette intégralement l’appel de Scania et confirme sa participation au cartel des camions Gerecht verwerpt het beroep van Scania en bevestigt deelname aan het truckkartel

CDC Cartel Damage Claims Consulting · 2022

Read Lire Lees
Thesis Mémoire Scriptie

The Economic Approach and the Need for Legal Certainty in Competition Damage Claims L’approche économique et la nécessité de sécurité juridique dans les actions en dommages de concurrence De economische aanpak en de nood aan rechtszekerheid bij mededingingsschade

LL.M Dissertation · 2021

Read Lire Lees
Conference Conférence Conferentie

What can the variability and volatility of opinions (from the Belgian business survey) reveal? Que révèlent la variabilité et la volatilité des opinions (enquête des entreprises belges) ? Wat onthullen variabiliteit en volatiliteit van meningen (Belgische bedrijfsenquête)?

Central Bank Business Surveys (CBBS) Conference · 2019

Read Lire Lees

About À propos Over

Impact narrative Narratif d’impact Impactverhaal

I sit at the intersection of data science, economics, and legal context, delivering trusted AI systems that translate dense evidence into structured, defensible insight.

My focus is on traceability, model governance, and outcomes that align with policy and audit expectations.

  • Bias-aware, transparent modeling for legal and policy stakeholders.
  • Automation-first delivery with human oversight.
  • Clear documentation and reproducible results.

J’opère à l’interface entre data science, économie et contexte juridique, avec des systèmes IA fiables qui transforment la preuve en insights structurés et défendables.

Je privilégie la traçabilité, la gouvernance des modèles et des résultats alignés avec les attentes d’audit.

  • Modèles transparents et maîtrisés pour les parties prenantes juridiques.
  • Automatisation pragmatique avec supervision humaine.
  • Documentation claire et résultats reproductibles.

Ik werk op het kruispunt van data science, economie en juridische context, met betrouwbare AI-systemen die bewijs omzetten in gestructureerde, verdedigbare inzichten.

Ik focus op traceerbaarheid, modelgovernance en resultaten die voldoen aan auditverwachtingen.

  • Transparante modellering voor juridische en beleidsstakeholders.
  • Automatisering met menselijke kwaliteitscontrole.
  • Duidelijke documentatie en reproduceerbare resultaten.

Toolbox Boîte à outils Toolbox

Core stack for applied AI and legal data workflows. Stack principal pour l’IA appliquée et les workflows juridiques. Kernstack voor toegepaste AI en juridische workflows.

PythonRSQLPostgreSQLGitDockerKubernetesFastAPIPandasNumPyscikit-learnspaCyHugging FaceLLMsPrompt EngineeringVector SearchKnowledge GraphsSASStataLaTeXAirflowdbtTerraformStreamlitShinyPower BITableauGrafanaNLPMLEconometricsData GovernanceModel Risk ManagementProject ManagementStakeholder Enablement

Talks & Workshops Interventions & ateliers Lezingen & workshops

Selected appearances Interventions sélectionnées Geselecteerde sessies

Applied AI for legal decision support IA appliquée pour la décision juridique Toegepaste AI voor juridische besluitvorming

Guest lecture · Public sector analytics program. Intervention invitée · Programme analytics secteur public. Gastcollege · analytics programma publieke sector.

NLP governance and model auditability Gouvernance NLP et auditabilité des modèles NLP-governance en modelevaluatie

Workshop · LegalTech roundtable. Atelier · Table ronde LegalTech. Workshop · LegalTech rondetafel.

Text summarization explainer Explication du résumé de texte Uitleg van tekstsamenvatting

1. Gather and clean legal documents 1. Collecter et nettoyer les documents juridiques 1. Juridische documenten verzamelen en opschonen

Normalize the corpus, remove boilerplate, and align multilingual signals. Normaliser le corpus, supprimer le boilerplate et aligner les signaux multilingues. Het corpus normaliseren, boilerplate verwijderen en meertalige signalen aligneren.

2. Extract key entities + topics 2. Extraire les entités et thèmes clés 2. Kernentiteiten en topics extraheren

Named-entity recognition helps isolate facts, parties, and legal references. La reconnaissance d’entités nommées isole les faits, les parties et les références juridiques. Named-entity recognition isoleert feiten, partijen en juridische verwijzingen.

3. Generate concise summaries 3. Générer des résumés concis 3. Beknopte samenvattingen genereren

Combine extractive and abstractive techniques with human-in-the-loop review. Combiner des techniques extractives et abstractive avec une relecture humaine. Combineer extractieve en abstractive technieken met human-in-the-loop review.

Pipeline narrative Narratif de pipeline Pijplijnnarratief

Ingestion → governance-ready metadata Ingestion → métadonnées prêtes pour la gouvernance Inname → governance-ready metadata
Quality rules → automated triage + routing Règles qualité → tri automatisé + routage Kwaliteitsregels → automatische triage + routing
Model scoring → explainable prioritization Scoring des modèles → priorisation explicable Modelscores → verklaarbare prioritering
Delivery → dashboards + traceable audit logs Livraison → dashboards + journaux d’audit traçables Levering → dashboards + traceerbare auditlogs

Visual cues & next steps Repères visuels & prochaines étapes Visuele cues & volgende stappen

Ideas to enrich the page Idées pour enrichir la page Ideeën om de pagina te verrijken
Court workflow map Carte des flux judiciaires Kaart van gerechtelijke workflows

A clean diagram showing intake, AI triage, and defensible decision support. Un schéma clair illustrant l’ingestion, le tri IA et l’aide à la décision défendable. Een helder diagram met intake, AI-triage en verdedigbare beslissingsondersteuning.

Artificial Intelligence stack Stack d’Artificial Intelligence Artificial Intelligence-stack

A modular AI + NLP architecture with governance checkpoints and model cards. Une architecture IA + NLP modulaire avec points de contrôle et model cards. Een modulaire AI + NLP-architectuur met governance-checkpoints en model cards.

Judgment corpus blueprint Plan du corpus de jugements Blauwdruk voor het vonnissencorpus

A roadmap for collecting, indexing, and governing case-law data at scale. Une feuille de route pour collecter, indexer et gouverner les données de jurisprudence. Een roadmap om rechtspraakdata te verzamelen, indexeren en te beheren op schaal.

Photography preview Aperçu photo Fotografiepreview

Add two or three photos to humanize the portfolio blocks. Ajouter deux ou trois photos pour humaniser les blocs du portfolio. Voeg twee of drie foto’s toe om de portfolio-blokken menselijker te maken.

Contact Contact Contact

Let’s collaborate Collaborons Laten we samenwerken

Looking for a partner to modernize legal data workflows or deploy applied AI? Vous cherchez un partenaire pour moderniser les workflows juridiques ou déployer l’IA appliquée ? Op zoek naar een partner voor juridische dataworkflows of toegepaste AI?