Sami GUEMBOUR

73 avenue de Paris · 94165 Saint-Mandé CEDEX · (+33)1 00 00 00 00 · sami.guembour@ign.fr

PhD Student.

Member of the MEIG research team

Doctorant.

Membre de l'équipe MEIG


Experience

Expérience

PhD Student

Doctorant

LASTIG, IGN, Saint-Mandé

Thesis subject : “Computational semantic analysis of the Cahiers Citoyens corpus - Characterization of “small corpora” using semantic profiles”.

Fields : Computer Science, Artificial Intelligence, Data Science, NLP, Data Analysis.

Description : Use of NLP (Natural Language Processing) and data science techniques to carry out a semantic and spatial analysis of the Cahiers Citoyens corpus, and build small corpora based on similar and semantic profiles.

Sujet de thèse : “Analyse sémantique computationnelle et spatialisée du corpus des Cahiers citoyens - Caractérisation de "corpus de petite taille" à l'aide de profils sémantiques”.

Domaines : Informatique, Intelligence Artificielle, Science des données, TAL, Analyse des données

Description : Utilisation du TAL (Traitement Automatique des Langues) et des techniques de la science des données pour réaliser une analyse sémantique et spatiale du corpus des Cahiers Citoyens, et construire des corpus de petite taille fondés sur des profils sémantiques.

October 2023 - Present Octobre 2023 - Aujourd'hui

Researcher

Chercheur

ETIS, CY Cergy paris University, Cergy-Pontoise

Description : Application of NLP (Natural Language Processing) and data science techniques to analyze textual data in order to understand the social construction of risk in the case of development projects and transport infrastructure.

ETIS, CY Cergy paris Université, Cergy-Pontoise

Description : Application des techniques du TAL et de la science des données pour analyser des données textuelles afin de comprendre la construction sociale du risque dans le cas de projets d'aménagement et d'infrastructures de transport.

November 2022 - June 2023 Novembre 2022 - Juin 2023

Data Science - NLP Intern

Stage en Science des données - TAL

LASTIG, IGN, Saint-Mandé

- Subject : Characterization of the city of the future in corpora of science fiction and climate fiction novels.

- Sujet : Caractérisation de la ville du futur dans des corpus de romans de science-fiction et de fiction climatique.

Description : A research internship in Data Science and Natural Language Processing (NLP) at the Laboratory of Geographic Information Sciences and Technologies for Smart Cities and Sustainable Territories (LASTIG) at the National Institute of Geographic Information and forestry (IGN).

Description : Un stage de recherche en Science des Données et Traitement Automatique des Langues au Laboratoire des Sciences et Technologies de l'Information Géographique pour les Villes Intelligentes et les Territoires Durables (LASTIG) de l'Institut National de l'Information Géographique et forestière (IGN).

Analyze a corpus of science fiction and climate fiction novels, as part of the PARVIS project, to characterize the city of the future using NLP. - Methods: Word embedding, language models, extraction of named entities, clustering, fine-tuning, dimension reduction, etc.

Analyser un corpus de romans de science-fiction et de fiction climatique, dans le cadre du projet PARVIS, pour caractériser la ville du futur en utilisant le TAL - Méthodes : Plongement de mots, vecteurs de contexte, modèles de langue, extraction d'entités nommées, clustering, affinement, réduction de dimension, etc.

March 2022 - September 2022 Mars 2022 - Septembre 2022

Data Scientist (R&D Engineer)

Scientifique de données (Ingénieur R&D)

Brandt, Setif, Algeria
Brandt, Sétif, Algérie

Project : Development of a food recognition model based on deep learning from photos taken by a camera installed inside a refrigerator.

Projet : Développement d'un modèle de reconnaissance alimentaire fondé sur l'apprentissage profond à partir de photos prises par une caméra installée à l'intérieur d'un réfrigérateur.

Description : - ETL Data. - Data analysis. - Data vizualisation. - Development of ML and DL models.

Description : - ETL des Données. - Analyse des données. - Visualisation de données. - Développement de modèles ML et DL.

February 2021 - August 2021 Février 2021 - Août 2021

Education

Formations

University of Gustave-Eiffel

PhD
Data Science / NLP

Université Gustave-Eiffel

Doctorat
Science des données - TAL
October 2023 - Present Octobre 2023 - Aujourd'hui

University of Paris Cité

Master
Machine Learning for Data Science

Université de Paris Cité

Master
Apprentissage Machine pour la Science des Données
September 2021 - September 2022 Septembre 2021 - Septembre 2022

University Ferhat Abbas - Setif-

Master
Artificial Intelligence

Université Ferhat Abbas - Sétif-

Master
Intelligence Artificielle
September 2018 - September 2020 Septembre 2018 - Septembre 2020

University Ferhat Abbas - Setif-

License
Computer Science

Université Ferhat Abbas - Sétif-

Licence
Informatique
September 2015 - September 2018 Septembre 2015 - Septembre 2018

Publications

Journals
Conferences
Books and Chapters
Workshops and Posters
Other Publications (Technical Reports, Dissertations, Dissemination)

Invited Talks


Teaching
Enseignements