Hi, I'm Mathis Derenne

I'm a Data Science Student
Passionné par l'informatique depuis tout jeune, je m'intéresse désormais à la Data Science.
Je réalise actuellement un Master MIASHS à l'Université de Lyon (calendrier d'alternance). Au cours de ce Master j'effectue une alternance au sein de CoSpirit avec des responsabilités variées en Data Science, principalement en Machine Learning et Data Engineering. Avant ce master, j'ai obtenu une Licence MIASHS à l'Université de Rennes. J'ai eu l'opportunité d'effectuer un stage au sein de en tant que Data Analyst et au sein de en tant qu'Ingénieur Logiciel.

Compétences

Liste des compétences acquises au cours de mes années de licence et de projets personnels.

Python

J'ai utilisé Python au travers de nombreux projets

  • Classes : héritage, polymorphisme, injection de dépendances
  • Décorateur, générateur, Regex, tests unitaires
  • Web Scraping : Scrapy, Selenium
  • Data Processing : Numpy, Pandas, Polars
  • Data Visualisation : Matplotlib, Vega-Altair
  • Reporting : papermill, nbconvert
  • Web Data App : Streamlit, ipywidgets
R

Apprentissage de R dans le cadre de ma Licence

  • Data Visualisation : ggplot2, plotly
  • Production de documents: paramétrables et automatisés au format Rmarkdown
  • Data Processing : dplyr, purr, stringr , forcats
Golang

Apprentissage et utilisation de Golang dans un environnement de production au cours de mon stage au sein de CGI

  • Connaissances générales du langage et de son écosystème
  • Interface, gestion des erreurs, injection de dépendances
PowerBI

  • Data Modeling - Star & Snowflake schema
  • DAX et fonctions de Time Intelligence
  • Manipulation de tables : jointures, pivots, aggrégations avec PowerQuery
  • Construction de KPI's
SQL

  • Manipulation de tables : aggrégations, jointures, pivots, tests conditionnels
  • Window Functions
  • Common Table Expressions (CTE) & Subqueries
  • Création de vues & procédures stockées
Machine Learning

  • Création d'une pipeline de traitement de données Scikit-Learn : données manquantes, outliers, encodage, normalisation, feature selection, feature engineering
  • Problème de régression, classification, clustering : Scikit-Learn et TensorFlow
  • Prédiction temporelle : VARMAX, SARIMAX, LSTM
  • Gestion d'une pipeline complète de données : Sauvegarde, Reporting, Monitoring
Git

Connaissance de Git et des bonnes pratiques de développement logiciel

  • Utilisation de Git : commit, merge, stash, worktree, etc.
  • Bonne Pratique : environnement (docker, poetry), linter
  • Intégration continue : suites de tests, GitHub Action
Documents

Outils de production de documents professionnels ou académiques

  • Markdown : mon format de prise de notes au quotidien
  • MyST : outil de communication scientifique à partir de fichier Markdown et de notebooks Jupyter
  • Latex : rédaction de papier de recherche
Développement Web

Mes premiers pas dans l'informatique se sont fait au travers du développement web

  • Front-End : HTML, CSS, JS (Polymer), Jekyll
  • Back-End : PHP
  • Déploiement : serveur NGINX et Apache, Google Analytics
Excel

Formation Coursera suivie sur les fonction avancés d'Excel

  • Tableau croisé dynamique
  • Formules avancés
  • Quelque connaissance en Macros VBA
Statistiques

Cours de statistiques suivis en Licence

  • Statistiques inférentielle : tests statistiques, intervalle de confiance, p-value
  • Implémentation du Propensity Score Matching (PSM)
Anglais

J'ai eu la chance de vivre une année scolaire en Inde. Cette année m'a permis de pratiquer l'anglais au quotidien avec ma famille d'accueil et mes camarades Indiens et internationaux. De plus, j'ai une bonne connaissances des termes techniques liés à l'informatique.


Projets personnels et académiques

Principaux projets réalisés au cours de mes années de licence.

Projet de recherche : Analyse des relations entre l'entraîneur chef et la performance d'une équipe
2024
Projet né de ma participation au Rennes Data Challenge 2024. J'ai continué par la suite à ajouter et améliorer les modèles existants (auto-encoder, LSTM, VARMAX, SARIMAX).
2024
Tableau de bord interactif et outils de prédiction des émissions et consommation de voitures selon leurs caractéristiques
2022
Base de données collaborative recensant des vidéos YouTube sur des thématiques (économie, politique, philosophie).
2019