Advanced search in Research products
Research products
arrow_drop_down
Searching FieldsTerms
Any field
arrow_drop_down
includes
arrow_drop_down
The following results are related to Digital Humanities and Cultural Heritage. Are you interested to view more results? Visit OpenAIRE - Explore.
26 Research products

  • Digital Humanities and Cultural Heritage
  • Open Access
  • Publications
  • Doctoral thesis
  • FR
  • English
  • Hyper Article en Ligne
  • Hyper Article en Ligne - Sciences de l'Homme et de la Société
  • Digital Humanities and Cultural Heritage

10
arrow_drop_down
Relevance
arrow_drop_down
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Ferrari, Erika;

    Le patrimoine métallique est un témoin culturel de notre passé et, pour cette raison, sa préservation et sa transmission aux générations futures sont importantes. Plusieurs stratégies sont utilisées pour la protection du patrimoine cuivreux exposée en extérieur, dont l’utilisation des inhibiteurs de corrosion organiques. Les inhibiteurs utilisés pour le patrimoine sont généralement empruntés au domaine de l’industrie. Cependant, l’état de surface du métal, couvert par des couches de produits de corrosion complexes, et le protocole d’application des inhibiteurs diffèrent considérablement de l’application industrielle.La présente étude porte spécifiquement sur les inhibiteurs de corrosion pour la conservation des artefacts exposés à base de cuivre par une approche physico-chimique innovante. L'approche prend en compte la complexité de la couche de corrosion étudiée : une plaque de cuivre naturellement corrodée, représentative de la corrosion extérieure à long terme a été choisie. Pour l'étude, trois molécules organiques, caractérisées par des fonctions chimiques différentes ont été sélectionnées comme inhibiteurs de test : le benzotriazole (BTAH), un composé azolé, employé en conservation, dont l'efficacité est débattue et l’utilisation déconseillée en raison de sa toxicité ; l'acide décanoïque (HC10) un acide gras à longue chaîne qui a été proposé comme traitement pour les objets patrimoniaux ; l'acide benzotriazole-5-carboxylique (5CBT), un composé à fonctions mixtes azole-carboxyliques. La réactivité des inhibiteurs avec des phases minérales synthétiques représentatives des produits de corrosion ainsi que des échantillons corrodés anciens (100 ans) avant et après 6 mois d'exposition extérieure ont été étudiées en combinant des observations à l'échelle nanométrique (MET, FIB-tomographie) à celles obtenues à l'échelle microscopique (Raman, MEB-EDS) et des observations globales/globales (couleur, tension de surface, XRD). Des expériences complémentaires en milieux marqués ont permis d'étudier les évolutions de perméabilité (immersion en D₂O) et de comportement passif (immersion KBr). Deux mécanismes réactionnels ont été observés et une relation avec l'efficacité et la durabilité de l'inhibition est proposée. Les molécules caractérisées par la fonction azole (BTAH et 5CBT) réagissent selon un mécanisme d'adsorption-précipitation formant un complexe amorphe adsorbé (film nanométrique) sur la phase minérale substrat (cuprite et brochantite). Les deux traitements sur les couches anciennes de corrosion diffèrent par leur profondeur de pénétration, la formation du complexe BTAH étant détectée jusqu'à la couche interne de cuprite, tandis que la complexation 5CBT n'est observée que dans la partie externe de la brochantite. Ceci a un impact sur la perméabilité de l'eau et la passivité pour les traitements au BTAH qui montrent les meilleurs résultats, et suggère une formation de complexe Cu-BTA sur la partie externe de la couche de cuprite dans ce dernier traitement. La fonction carboxylique dans HC10 conduit à la précipitation du décanoate de cuivre par un mécanisme de dissolution-précipitation. Des cristaux de décanoate se forment sur la surface externe de brochantite : cela confère une quasi-superhydrophobie à l'échantillon après traitement. Cependant, le manque de liaison chimique forte entre le précipité et la surface induit la perte de la couche hydrophobe déposée en surface après 6 mois d'exposition à l'extérieur.En plus de ces résultats phénoménologiques, une nouvelle méthodologie basée sur l'expérience KBr pour tester les inhibiteurs des artefacts corrodés par le cuivre est également proposée. Metallic heritage artefacts represent cultural traces of our past, and for this reason, their preservation and transmission to future generations is important. To protect copper-based artworks exposed outdoors, several conservation strategies are followed, including the use of organic corrosion inhibitors. Inhibitors are usually borrowed from the industrial field. However, the surface state of the metal with the presence of complex corrosion layers, and the protocol of inhibitors' application differ considerably from the industrial ones.The present study specifically addresses corrosion inhibitors for conservation of copper-based exposed artifacts by an innovative physico-chemical approach. The approach takes into account the complexity of the corrosion layer under investigation: a naturally corroded copper plate, representative for outdoor long-term corrosion have been chosen. For the study, three organic molecules, characterized by different chemical functions have been selected as test inhibitors: benzotriazole (BTAH), an azole compound, employed in conservation, which efficiency is debated and its use discouraged due to toxicity; decanoic acid (HC10) a long-chain fatty acid that has been proposed as treatment for heritage objects; benzotriazole-5-carboxylic acid (5CBT), a compound with mixed azole-carboxylic functions.The reactivity of the inhibitors with synthetic mineral phases representative of corrosion products as well as ancient corroded samples (100 years) before and after 6-months outdoor exposure have been investigated by combining observations at the nanoscale (TEM, FIB-tomography) to those obtained at the microscale (Raman, SEM-EDS) and global/bulk observations (colour, surface tension, XRD). Additional experiments in marked environment allowed to investigate changes in permeability (D₂O immersion) and the evolution of passive behavior (KBr immersion).Two reaction mechanisms have been observed and a relationship with the efficiency and durability of the inhibition is proposed. The molecules BTAH and 5CBT interaction with copper atoms occurs via the azole function and both molecules react according to an adsorption-precipitation mechanism forming an adsorbed amorphous complex (nanometric film) on the substrate mineral phase (cuprite and brochantite). The two treatments on the ancient corrosion layers differ for their depth of penetration, with Cu-BTAH complex formation being detected until the cuprite inner layer, while 5CBT complexation is observed only in the outer part of the brochantite. This has an impact on the water permeability and passivity, with the BTAH treatments showing the best results, and suggests a complex formation with the outer cuprite layer in this last treatment. The carboxylic function in HC10 leads to the precipitation of copper decanoate by a dissolution-precipitation mechanism. Crystals of decanoate are formed on the outer surface of brochantite: this confers near super-hydrophobicity to the sample after treatment. However, the lack of bond between the precipitate and the surface determines the loss of the surface-deposited hydrophobic layer after 6 months of outdoor exposure.In addition to these phenomenological results, a new methodology based on the KBr experiment for testing inhibitors for copper corroded artefacts is also proposed.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Shang, Guokan;

    Grâce aux progrès impressionnants qui ont été réalisés dans la transcription du langage parlé, il est de plus en plus possible d'exploiter les données transcrites pour des tâches qui requièrent la compréhension de ce que l'on dit dans une conversation. Le travail présenté dans cette thèse, réalisé dans le cadre d'un projet consacré au développement d'un assistant de réunion, contribue aux efforts en cours pour apprendre aux machines à comprendre les dialogues des réunions multipartites. Nous nous sommes concentrés sur le défi de générer automatiquement les résumés abstractifs de réunion.Nous présentons tout d'abord nos résultats sur le Résumé Abstractif de Réunion (RAR), qui consiste à prendre une transcription de réunion comme entrée et à produire un résumé abstractif comme sortie. Nous introduisons une approche entièrement non-supervisée pour cette tâche, basée sur la compression multi-phrases et la maximisation sous-modulaire budgétisée. Nous tirons également parti des progrès récents en vecteurs de mots et dégénérescence de graphes appliqués au TAL, afin de prendre en compte les connaissances sémantiques extérieures et de concevoir de nouvelles mesures de diversité et d'informativité.Ensuite, nous discutons de notre travail sur la Classification en Actes de Dialogue (CAD), dont le but est d'attribuer à chaque énoncé d'un discours une étiquette qui représente son intention communicative. La CAD produit des annotations qui sont utiles pour une grande variété de tâches, y compris le RAR. Nous proposons une couche neuronale modifiée de Champ Aléatoire Conditionnel (CAC) qui prend en compte non seulement la séquence des énoncés dans un discours, mais aussi les informations sur les locuteurs et en particulier, s'il y a eu un changement de locuteur d'un énoncé à l'autre.La troisième partie de la thèse porte sur la Détection de Communauté Abstractive (DCA), une sous-tâche du RAR, dans laquelle les énoncés d'une conversation sont regroupés selon qu'ils peuvent être résumés conjointement par une phrase abstractive commune. Nous proposons une nouvelle approche de la DCA dans laquelle nous introduisons d'abord un encodeur neuronal contextuel d'énoncé qui comporte trois types de mécanismes d'auto-attention, puis nous l'entraînons en utilisant les méta-architectures siamoise et triplette basées sur l'énergie. Nous proposons en outre une méthode d'échantillonnage générale qui permet à l'architecture triplette de capturer des motifs subtils (p. ex., des groupes qui se chevauchent et s'emboîtent). With the impressive progress that has been made in transcribing spoken language, it is becoming increasingly possible to exploit transcribed data for tasks that require comprehension of what is said in a conversation. The work in this dissertation, carried out in the context of a project devoted to the development of a meeting assistant, contributes to ongoing efforts to teach machines to understand multi-party meeting speech. We have focused on the challenge of automatically generating abstractive meeting summaries.We first present our results on Abstractive Meeting Summarization (AMS), which aims to take a meeting transcription as input and produce an abstractive summary as output. We introduce a fully unsupervised framework for this task based on multi-sentence compression and budgeted submodular maximization. We also leverage recent advances in word embeddings and graph degeneracy applied to NLP, to take exterior semantic knowledge into account and to design custom diversity and informativeness measures.Next, we discuss our work on Dialogue Act Classification (DAC), whose goal is to assign each utterance in a discourse a label that represents its communicative intention. DAC yields annotations that are useful for a wide variety of tasks, including AMS. We propose a modified neural Conditional Random Field (CRF) layer that takes into account not only the sequence of utterances in a discourse, but also speaker information and in particular, whether there has been a change of speaker from one utterance to the next.The third part of the dissertation focuses on Abstractive Community Detection (ACD), a sub-task of AMS, in which utterances in a conversation are grouped according to whether they can be jointly summarized by a common abstractive sentence. We provide a novel approach to ACD in which we first introduce a neural contextual utterance encoder featuring three types of self-attention mechanisms and then train it using the siamese and triplet energy-based meta-architectures. We further propose a general sampling scheme that enables the triplet architecture to capture subtle patterns (e.g., overlapping and nested clusters).

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2021
    Hal-Diderot
    Doctoral thesis . 2021
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2021
      Hal-Diderot
      Doctoral thesis . 2021
      Data sources: Hal-Diderot
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Ben Nasr, Sana;

    L'analyse du domaine vise à identifier et organiser les caractéristiques communes et variables dans un domaine. Dans la pratique, le coût initial et le niveau d'effort manuel associés à cette analyse constituent un obstacle important pour son adoption par de nombreuses organisations qui ne peuvent en bénéficier. La contribution générale de cette thèse consiste à adopter et exploiter des techniques de traitement automatique du langage naturel et d'exploration de données pour automatiquement extraire et modéliser les connaissances relatives à la variabilité à partir de documents informels. L'enjeu est de réduire le coût opérationnel de l’analyse du domaine. Nous étudions l'applicabilité de notre idée à travers deux études de cas pris dans deux contextes différents: (1) la rétro-ingénierie des Modèles de Features (FMs) à partir des exigences réglementaires de sûreté dans le domaine de l’industrie nucléaire civil et (2) l’extraction de Matrices de Comparaison de Produits (PCMs) à partir de descriptions informelles de produits. Dans la première étude de cas, nous adoptons des techniques basées sur l’analyse sémantique, le regroupement des exigences et les règles d'association. Dans la deuxième étude de cas, notre approche repose sur la technologie d'analyse contrastive pour identifier les termes spécifiques au domaine à partir du texte, l'extraction des informations pour chaque produit, le regroupement des termes et le regroupement des informations. La principale leçon à tirer de ces deux études de cas, est que l’extraction et l’exploitation de la connaissance relative à la variabilité dépendent du contexte, de la nature de la variabilité et de la nature du texte. Domain analysis is the process of analyzing a family of products to identify their common and variable features. This process is generally carried out by experts on the basis of existing informal documentation. When performed manually, this activity is both time-consuming and error-prone. In this thesis, our general contribution is to address mining and modeling variability from informal documentation. We adopt Natural Language Processing (NLP) and data mining techniques to identify features, commonalities, differences and features dependencies among related products. We investigate the applicability of this idea by instantiating it in two different contexts: (1) reverse engineering Feature Models (FMs) from regulatory requirements in nuclear domain and (2) synthesizing Product Comparison Matrices (PCMs) from informal product descriptions. In the first case study, we adopt NLP and data mining techniques based on semantic analysis, requirements clustering and association rules to assist experts when constructing feature models from these regulations. In the second case study, our proposed approach relies on contrastive analysis technology to mine domain specific terms from text, information extraction, terms clustering and information clustering. The main lesson learnt from the two case studies is that the exploitability and the extraction of variability knowledge depend on the context, the nature of variability and the nature of text.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2016
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2016
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Jalalzai, Hamid;

    Les extrêmes apparaissent dans une grande variété de données. Par exemple,concernant les données hydrologiques, les extrêmes peuvent correspondre à des inondations, des moussons voire des sécheresses. Les données liées à l’activité humaine peuvent également conduire à des situations extrêmes, dans le cas des transactions bancaires, le montant alloué à une vente peut être considérable et dépasser les transactions courantes. Un autre exemple lié à l’activité humaine est la fréquence des mots utilisés : certains mots sont omniprésents alors que d’autres sont très rares. Qu’importe le contexte applicatif, les extrêmes qui sont rares par définition, correspondent à des données particulières. Ces événements sont notamment alarmants au vu de leur potentiel impact désastreux. Cependant, les données extrêmes sont beaucoup moins considérées dans les statistiques modernes ou les pratiques courantes d’apprentissage machine, principalement car elles sont considérablement sous représentées : ces événements se retrouvent noyés - à l’ère du ”big data” - par une vaste majorité de données classiques et non extrêmes. Ainsi, la grande majorité des outils d’apprentissage machine qui se concentrent naturellement sur une distribution dans son ensemble peut être inadaptée sur les queues de distribution où se trouvent les observations extrêmes. Dans cette thèse, les défis liés aux extrêmes sont détaillés et l’accent est mis sur le développement de méthodes dédiées à ces données. La première partie se consacre à l’apprentissage statistique dans les régions extrêmes. Dans le chapitre 4, des garanties non asymptotiques sur l’erreur d’estimation de la mesure angulaire empirique sont étudiées et permettent d’améliorer des méthodes de détection d’anomalies par minimum volume set sur la sphère. En particulier, le problème de la minimisation du risque empirique pour la classification binaire dédiée aux échantillons extrêmes est traitée au chapitre 5. L’analyse non paramétrique et les garanties qui en résultent sont détaillées. L’approche est adaptée pour traiter de nouveaux échantillons se trouvant hors de l’enveloppe convexe formée par les données rencontrées. Cette propriété d’extrapolation est l’élément clé et charnière nous permettant de concevoir de nouvelles représentations conservant un label donné et d’ainsi augmenter la quantité de données. Le chapitre 6 se concentre sur l’apprentissage de cette représentation à queue lourde (pour être précis, à variation régulière) à partir d’une distribution d’entrée. Les illustrations montrent une meilleure classification des extrêmes et conduit à la génération de phrases cohérentes. Enfin, le chapitre 7 propose d’analyser la structure de dépendance des extrêmes multivariés. En constatant que les extrêmes se concentrent au sein de groupes où les variables explicatives ont tendance à prendre –de manière récurrente–de grandes valeurs simultanément ; il en résulte un problème d’optimisation visant à identifier ces sous-groupes grâce à des moyennes pondérées des composantes. Extremes surround us and appear in a large variety of data. Natural data likethe ones related to environmental sciences contain extreme measurements; inhydrology, for instance, extremes may correspond to floods and heavy rainfalls or on the contrary droughts. Data related to human activity can also lead to extreme situations; in the case of bank transactions, the money allocated to a sale may be considerable and exceed common transactions. The analysis of this phenomenon is one of the basis of fraud detection. Another example related to humans is the frequency of encountered words. Some words are ubiquitous while others are rare. No matter the context, extremes which are rare by definition, correspond to uncanny data. These events are of particular concern because of the disastrous impact they may have. Extreme data, however, are less considered in modern statistics and applied machine learning, mainly because they are substantially scarce: these events are out numbered –in an era of so-called ”big data”– by the large amount of classical and non-extreme data that corresponds to the bulk of a distribution. Thus, the wide majority of machine learning tools and literature may not be well-suited or even performant on the distributional tails where extreme observations occur. Through this dissertation, the particular challenges of working with extremes are detailed and methods dedicated to them are proposed. The first part of the thesisis devoted to statistical learning in extreme regions. In Chapter 4, non-asymptotic bounds for the empirical angular measure are studied. Here, a pre-established anomaly detection scheme via minimum volume set on the sphere, is further im-proved. Chapter 5 addresses empirical risk minimization for binary classification of extreme samples. The resulting non-parametric analysis and guarantees are detailed. The approach is particularly well suited to treat new samples falling out of the convex envelop of encountered data. This extrapolation property is key to designing new embeddings achieving label preserving data augmentation. Chapter 6 focuses on the challenge of learning the latter heavy-tailed (and to be precise regularly varying) representation from a given input distribution. Empirical results show that the designed representation allows better classification performanceon extremes and leads to the generation of coherent sentences. Lastly, Chapter7 analyses the dependence structure of multivariate extremes. By noticing that extremes tend to concentrate on particular clusters where features tend to be recurrently large simulatenously, we define an optimization problem that identifies the aformentioned subgroups through weighted means of features.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2020
    Hal-Diderot
    Doctoral thesis . 2020
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2020
      Hal-Diderot
      Doctoral thesis . 2020
      Data sources: Hal-Diderot
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Liu, Xiao;

    L’internet et les nouvelles formes de média de communication, d’information, et de divertissement ont entraîné une croissance massive de la quantité des données numériques. Le traitement et l’interprétation automatique de ces données permettent de créer des bases de connaissances, de rendre les recherches plus efficaces et d’effectuer des recherches sur les médias sociaux. Les travaux de recherche sur le traitement automatique du langage naturel concernent la conception et le développement d’algorithmes, qui permettent aux ordinateurs de traiter automatiquement le langage naturel dans les textes, les contenus audio, les images ou les vidéos, pour des tâches spécifiques. De par la complexité du langage humain, le traitement du langage naturel sous forme textuelle peut être divisé en 4 niveaux : la morphologie, la syntaxe, la sémantique et la pragmatique. Les technologies actuelles du traitement du langage naturel ont eu de grands succès sur les tâches liées auxdeux premiers niveaux, ce qui a permis la commercialisation de beaucoup d’applications comme les moteurs de recherche. Cependant, les moteurs de recherches avancés (structurels) nécessitent une interprétation du langage plus avancée. L’extraction d’information consiste à extraire des informations structurelles à partir des ressources non annotées ou semi-annotées, afin de permettre des recherches avancées et la création automatique des bases de connaissances. Cette thèse étudie le problème d’extraction d’information dans le domaine spécifique de l’extraction des événements biomédicaux. Nous proposons une solution efficace, qui fait un compromis entre deux types principaux de méthodes proposées dans la littérature. Cette solution arrive à un bon équilibre entre la performance et la rapidité, ce qui la rend utilisable pour traiter des données à grande échelle. Elle a des performances compétitives face aux meilleurs modèles existant avec une complexité en temps de calcul beaucoup plus faible. Lors la conception de ce modèle, nous étudions également les effets des différents classifieurs qui sont souvent proposés pour la résolution des problèmes de classification multi-classe. Nous testons également deux méthodes permettant d’intégrer des représentations vectorielles des mots appris par apprentissage profond (deep learning). Même si les classifieurs différents et l’intégration des vecteurs de mots n’améliorent pas grandement la performance, nous pensons que ces directions de recherche ont du potentiel et sont prometteuses pour améliorer l’extraction d’information. Internet as well as all the modern media of communication, information and entertainment entails a massive increase of digital data quantities. Automatically processing and understanding these massive data enables creating large knowledge bases, more efficient search, social medial research, etc. Natural language processing research concerns the design and development of algorithms that allow computers to process natural language in texts, audios, images or videos automatically for specific tasks. Due to the complexity of human language, natural language processing of text can be divided into four levels: morphology, syntax, semantics and pragmatics. Current natural language processing technologies have achieved great successes in the tasks of the first two levels, leading to successes in many commercial applications such as search. However, advanced structured search engine would require computers to understand language deeper than at the morphology and syntactic levels. Information extraction is designed to extract meaningful structural information from unannotated or semi-annotated resources to enable advanced search and automatically create knowledge bases for further use. This thesis studies the problem of information extraction in the specific domain of biomedical event extraction. We propose an efficient solution, which is a trade-off between the two main trends of methods proposed in previous work. This solution reaches a good balance point between performance and speed, which is suitable to process large scale data. It achieves competitive performance to the best models with a much lower computational complexity. While designing this model, we also studied the effects of different classifiers that are usually proposed to solve the multi-class classification problem. We also tested two simple methods to integrate word vector representations learned by deep learning method into our model. Even if different classifiers and the integration of word vectors do not greatly improve the performance, we believe that these research directions carry some promising potential for improving information extraction.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2014
    Hal-Diderot
    Doctoral thesis . 2014
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2014
      Hal-Diderot
      Doctoral thesis . 2014
      Data sources: Hal-Diderot
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Pronti, Lucilla;

    Cette thèse porte sur l’application des images multispectrales pour l’analyse des matériaux utilisés dans une peinture par comparaison avec la photographie traditionnelle de fluorescence induite par rayons UV et la réflectoraphgie infrarouge. L’application des images multispectrales à l'étude des matériaux picturaux a été appuyée par d'autres techniques analytiques telles que la spectroscopie de réflectance et de fluorescence, la spectroscopie de fluorescence X, la spectroscopie d'absorption UV-visible et la spectroscopie infrarouge transformée de Fourier en réflectance totale atténuée. L’imagerie multispectrale a été testée comme outil de laboratoire d’identification des matériaux picturaux. Ainsi, des couches de peinture constituées de pigments (anciens et modernes), de liants (œufs et l’huile de lin) et de vernis naturels ont été analysées. Pour les matériaux organiques, des expériences de vieillissement accéléré (photodégradation et dégradation thermique) ont permis de modéliser les changements optiques et chimiques intervenant au cours de la vie d’un tableau. De plus, une analyse diagnostique a été réalisée sur deux tableaux conservés à « Accademia di San Luca » (Rome) par photographie de fluorescence induite par rayonnement UV, radiographie, spectroscopie de réflectance, spectroscopie de fluorescence X, images de fluorescence UV et réflectance multispectrale, réflectographie infrarouge multispectrale. Par rapport aux techniques traditionnelles, les images multispectrales permettent d’analyser de nombreuses régions spectrales qui, dans certains cas, permettent d’identifier le pigment et/ou des zones non homogènes de la couche superficielle picturale. Certaines gammes de longueurs d’onde infrarouge permettent notamment de voir les détails des différentes couches préparatoires, amenant à une analyse plus précise de la technique d’exécution. Cependant, une des limites des images multispectrales concerne l’identification des mélanges complexes et/ou des différentes strates de matériaux en fonction du type de filtre utilisé. This thesis focus on the application of multispectral images for the analysis of pictorial materials in comparison with the traditional UV-fluorescence photography and infrared reflectography. The assessment of multispectral imaging for the study of pictorial materials was supported by other analytical techniques such as reflectance and fluorescence spectroscopy, X-Ray Fluorescence (XRF), UV-visible absorption spectroscopy and Total Attenuated Reflectance - Fourier Transform Infrared Spectroscopy (ATR-FTIR). The multispectral imaging was tested on swatches of pictorial layers (constituted by ancient and modern pigment), binders (egg and linseed oil) and natural varnishes. For the organic materials, accelerated ageing methods (photo-chemical and thermal degradation) were used to model the optical and chemical changes occurring during the lifetime of a painting. In addition, a diagnostic investigation was performed on two paintings placed in "Accademia di San Luca" (Rome) by means of UV-fluorescence photography, radiography, reflectance spectroscopy, X-ray fluorescence spectroscopy, UV-VIS-NIR multispectral imaging. Multispectral images, comparing to traditional techniques, permit to individuate specific spectral behaviors, and, in some cases, identify the pigment and/or non-homogeneous areas of the pictorial or varnish layers. The possibility to select some infrared wavelengths allows to see details of the preparatory layers, leading to a more accurate analysis of the technique of execution. However, the limitations of multispectral images for the identification of complex mixtures and/or different layers of materials depending on the type of filter used.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hal-Diderot
    Doctoral thesis . 2016
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Benjelloun, Yacine;

    La faille nord anatolienne (NAF), une zone de faille dextre longue de 1000 km est caractérisée par un fort aléa sismique. Elle accommode le mouvement vers l’ouest de l’Anatolie par rapport à l’Eurasie. Dans sa partie ouest, la NAF se divise en trois branches, dont une borde le sud de la mer de Marmara et du lac d’Iznik. Ce segment médian de la NAF (MNAF) présente aujourd’hui une très faible sismicité. Pourtant, cette zone se caractérise par un risque sismique élevé à l’échelle des deux derniers millénaires. Plus de six séismes sont décrits par les auteurs anciens et causèrent des destructions dans la ville d’Iznik (ancienne Nicée), un centre politique et religieux important aux époques hellénistique et romaine. Notre étude a pour but de contraindre l’activité sismique récente de la MNAF dans la région d’Iznik à plusieurs échelles de temps, par une approche pluridisciplinaire combinant géosciences et archéologie.Le premier objectif de cette thèse est de développer l’étude des bâtiments anciens comme archives de la sismicité historique en observant leurs endommagements et réparations successifs. La ville de Nicée est appropriée pour ce type d’étude puisqu’elle présente plusieurs bâtiments préservés portant les traces de nombreuses réparations. J’ai concentré mon travail sur des infrastructures critiques comme la muraille défensive longue de 3 km. Cela inclut aussi l’aqueduc de la ville, recoupé par une faille active, ainsi qu’une basilique romaine découverte récemment sous les eaux du lac d’Iznik à 20 m de la côte. En appliquant plusieurs techniques de datation (stratigraphie des édifices, 14C) sur les bâtiments, j’ai pu identifier au moins trois séismes sources d’endommagement depuis le 6e siècle. La répartition des dommages sur les bâtiments permet d’estimer des intensités locales de VIII sur l’échelle macrosismique européenne (EMS98). Grâce à des simulations numériques, je montre que les déformations visibles sur un obélisque romain au nord d’Iznik sont compatibles avec des magnitudes proches de Mw 7 pour des distances épicentrales inférieures à 15 km.Le deuxième objectif de cette thèse est de contraindre la vitesse de glissement quaternaire sur la MNAF et de mieux comprendre la formation du lac d’Iznik à l’ouest de la ville. Ce lac de 313 km² est le plus grand lac d’eau douce de la région de Marmara. Les principales failles autour du lac ont été cartées avec un MNT de haute résolution dérivé d’images Pléiades. Les marqueurs géomorphologiques décalés par la MNAF ont fait l’objet de mesures systématiques. L’analyse statistique de ces décalages a mis en évidence six ruptures majeures préservées dans le paysage, avec des déplacements cosismiques entre 2 et 6 m. Les âges de trois niveaux de terrasses lacustres au nord du lac ont été quantifiés par radiocarbone et 10Be produit in situ. J’ai pu déterminer un taux de glissement horizontal minimum de 2.9 mm/yr. Le basculement vers le sud des paléorivages est compatible avec un taux de glissement vertical élevé sur la MNAF autour de 6 mm/yr.En travaillant sur la morphologie et les lithologies de la région d’Iznik, nous avons découvert des preuves d’épisodes glaciaires LGM. La morphologie en U de plusieurs vallées à l’est du lac d’Iznik, séparées par des sauts topographiques correspond à l’empreinte d’anciens glaciers. Cette hypothèse est confirmée par la présence de moraines en bord de vallée, de blocs erratiques aux lithologies variées, et de sédiments glacio-lacustres. La distribution spatiale de ces marqueurs morphologiques et lithologiques nous permet de reconstruire l’emplacement et le retrait vers l’est de ce glacier. Les âges absolus des dépôts glaciaires et des alluvions postérieurs à la glaciation sont compatibles avec des proxies paléoenvironnementaux provenant du lac d’Iznik et les études réalisées sur d’autres glaciers turcs LGM. Il s’agit de la première découverte de glaciers à si basse altitude en Turquie. The North Anatolian fault (NAF), a 1000 km-long dextral fault zone is known for its strong seismic hazard. It accommodates the westward motion of Anatolia, relative to Eurasia. In its western part, the NAF splits into three strands, one of which passing south of the Marmara sea and the Iznik lake. This NAF middle strand (MNAF) shows nowadays a very low seismic activity. However, this area has been characterized by a significant earthquake hazard over the last two millennia. Several ancient authors mention the occurrence of more than six destructive earthquakes that impacted Iznik (old Nicaea), which was an important political and religious centre during the Hellenistic and Roman periods. Our study aims to constrain the recent seismic activity on the MNAF in the Iznik area at different time scales through a multidisciplinary approach coupling earth science and archeology.The first goal of this thesis is to develop the study of ancient buildings as archives of the historical seismicity by observing their successive damages and repairs. The city of Nicaea is appropriate for this kind of study as it presents several well preserved ancient buildings that bear traces of numerous repairs. I focus my study on the critical infrastructures for the city such as the 3 km-long protecting walls. This also includes the aqueduct that provided the city with water and is crossed by a segment of active fault, and a Roman basilica recently discovered underwater in the Iznik lake 20 m far from the shore. Applying different dating techniques (stratigraphy of the archaeological building, 14C) to the various materials of these buildings (terra cotta, mortar, concretions on the aqueduct), I was able to identify at least three damaging earthquakes since the 6th century AD. The amount of damage on these buildings allows to estimate local intensities at VIII on the European macroseismic scale (EMS98). Thanks to numerical simulations, I show that the current deformation visible on a Roman obelisk north of Iznik is compatible with magnitudes close to Mw 7 for epicentral distances smaller than 15 km.The second goal of this thesis is to constrain the Quaternary slip rate on the MNAF and better understand the formation of Iznik Lake, a 313 km²-large lake located just west of the city, which is the largest freshwater lake in the Marmara region. The main faults around the lake were mapped using a high-resolution DEM derived from Pleiades images. Geomorphic markers offset by the MNAF were systematically measured. The statistical analysis of the offsets revealed six major ruptures preserved in the landscape, with coseismic displacements between 2 and 6 m. The ages of three levels of lacustrine terraces north of the lake were quantified by radiocarbon and in-situ produced 10Be. A minimal horizontal slip rate of 2.9 mm/yr was estimated. The southward tilting of the lake paeloshorelines is compatible with a high vertical slip rate on the MNAF around 6 mm/yr.While working on the morphology and lithologies of the Iznik area, we have discovered significant evidence for LGM glacial events. The U-shaped morphology of several successive valleys east of Iznik Lake separated by topographic highs is interpreted as the print of past glaciers. This is confirmed by the presence of moraine deposits on the sides of the valleys, erratic blocks from various lithologies and glacio-lacustrine sediments. The geographical distribution of these morphological and lithological markers enabled us to reconstruct the former location and eastward retreat of this glacier. The absolute ages obtained from glacial deposits and alluvial sediments postponing the glaciation are compatible with paleoenvironmental proxies in Iznik Lake and previous studies of other Turkish LGM glaciers. This constitutes the first evidence of glaciation at low elevations in Turkey.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2017
    Hal-Diderot
    Doctoral thesis . 2017
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2017
      Hal-Diderot
      Doctoral thesis . 2017
      Data sources: Hal-Diderot
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Bowers, Jack;

    This dissertation concerns a language documentation project covering the Mixtepec-Mixtec variety of Mixtec (ISO 639-3: mix). Mixtepec-Mixtec is an Oto-Manguean spoken by roughly 9000- 10000 people in San Juan Mixtepec Municipality in the Juxtlahuaca district of Oaxaca, Mexico and by several thousand speakers living in Baja California, Tlaxiaco, Santiago Juxtlahuaca. There are also significant populations in the United States, most notably in California, around Santa Maria and Oxnard, as well as in Oregon, Florida, and Arkansas.The core facets of the work are: the creation a body of linguistic resources for the MIX language and community; the evaluation the current tools, standards and practices used in language documentation; an account of how the TEI and related XML technologies can be used as the primary encoding, metadata, and annotation format for multi-dimensional linguistic projects, including under-resourced languages. The concrete resources produced are: a multilingual TEI dictionary; a collection of audio recordings published and archived on Harvard Dataverse; a corpus of texts derived from a combination of spoken language transcriptions and texts encoded and annotated in TEI, as well as linguistic and lexicographic descriptions and analyses of the Mixtepec-Mixtec language.Due to the array of different data and resources produced, this project has components that equally fall within the fields of: digital humanities, language documentation, language description and corpus linguistics. Because of this overlapping relevance, over the processes of attempting to carry out this work in line with best practices in each sub-field, this work addresses the need to further bring together the intersecting interests, technologies, practices and standards relevant to, and used in each of these related fields.; Cette thèse porte sur un projet de documentation linguistique concernant la langue mixtèque de mixtepec (ISO 639-3: mix). Le mixtèque de mixtepec est une langue otomangue essentiellement parlée par une population de 9000-1000 locuteurs dans les municipalités de San Juan Mixtepec dans la région Juxtlahuaca dans l’état d’Oaxaca, Mexique. Elle est aussi parlée par quelques milliers de locuteurs qui résident dans l’état de Baja Californie, Tlaxicao, et Santiago Juxtlahuaca en Mexique. Aux Etats-Unis, elle concerne également différentes populations significatives, en particulier dans les environs de Santa Maria et Oxnard en Californie ainsi que dans les états d’Oregon, Floride, et Arkansas.Les principaux objectifs de ce projet sont a) de créer une collection de ressources langagiers pour la langue sous licence ouverte, et la communauté des locateurs b) évaluer les logiciels, les standards et les procédures utilisés dans le champ de documentation linguistiques par rapport à celles du champ des humanités numériques et c) démontrer comment les directives de la TEI (Text Encoding Initiative) et les technologies liées à XML peuvent être utilisées pour l’encodage, les métadonnées, et pour l’annotation et le traitement d’une collection de ressources lexicales, dans le cas d’une langue pour laquelle peu de sources primaires sont disponibles. Concrètement, les ressources créées sont les suivantes : un dictionnaire multimédia et multilingue (mixtèque, espagnole, anglais); une collection d’enregistrements audio publiés et archivés publiquement et ouvertement chez Harvard Dataverse ; un corpus de textes dérivés d’une combinaison de transcriptions de la langue parlée ainsi que des textes annotés conformément aux directives de la TEI; une description sommaire des caractéristiques linguistiques et lexicales.En raison de l’étendue des données et des ressources produites au cours de ce travaux, cette entreprise est composée d’éléments qui tombent également dans le champ des humanités numériques, de la documentation linguistique, de la linguistique descriptive, et de la linguistique de corpus. De par ces chevauchements disciplinaires et dans le respect des meilleurs pratiques disciplinaires, les travaux décrit dans cette thèse cherchent à combler les fossés entre les questions méthodologiques et techniques de ces différents champs.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2019
    Hal-Diderot
    Preprint . 2019
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Moncecchi, Guillermo;

    Ce travail de thèse propose une méthodologie visant la résolution de certains problèmes de classification, notamment ceux concernant la classification séquentielle en tâches de Traitement Automatique des Langues. Afin d'améliorer les résultats de la tâche de classification, nous proposons l'utilisation d'une approche itérative basée sur l'erreur, qui intègre, dans le processus d'apprentissage, des connaissances d'un expert représentées sous la forme de "règles de connaissance". Nous avons appliqué la méthodologie à deux tâches liées à la détection de la spéculation ("hedging") dans la littérature scientifique: la détection de segments textuels spéculatifs ("hedge cue identification") et la détection de la couverture de ces segments ("hedge cue scope detection"). Les résultats son prometteurs: pour la première tâche, nous avons amélioré le F-score de la baseline de 2,5 points en intégrant des données sur la co-occurrence de segments spéculatifs. Concernant la deuxième tâche, l'intégration d'information syntaxique et des règles pour l'élagage syntaxique ont permis d'améliorer les résultats de la classification de 0,712 à 0,835 (F-score). Par rapport aux méthodes de l'état de l'art, les résultats sont très bons et ils suggèrent que l'approche consistant à améliorer les classifieurs basées seulement sur des erreurs commises dans un corpus, peut être également appliquée à d'autres tâches similaires. Qui plus est, ce travail de thèse propose un schéma de classes permettant de représenter l'analyse d'une phrase dans une structure unique qui intègre les résultats de différentes analyses linguistiques. Cela permet de mieux gérer le processus itératif d'amélioration du classifieur, dans lequel différents ensembles d'attributs d'apprentissage sont utilisés à chaque itération. Nous proposons également de stocker les attributs dans un modèle relationnel au lieu des structures textuelles classiques, afin de faciliter l'analyse et la manipulation des données apprises. This thesis studies the use of sequential supervised learning methods on two tasks related to the detection of hedging in scientific articles: those of hedge cue identification and hedge cue scope detection. Both tasks are addressed using a learning methodology that proposes the use of an iterative, error-based approach to improve classification performance, suggesting the incorporation of expert knowledge into the learning process through the use of knowledge rules. Results are promising: for the first task, we improved baseline results by 2.5 points in terms of F-score by incorporating cue cooccurence information, while for scope detection, the incorporation of syntax information and rules for syntax scope pruning allowed us to improve classification performance from an F-score of 0.712 to a final number of 0.835. Compared with state-of-the-art methods, the results are very competitive, suggesting that the approach to improving classifiers based only on the errors commited on a held out corpus could be successfully used in other, similar tasks. Additionaly, this thesis presents a class schema for representing sentence analysis in a unique structure, including the results of different linguistic analysis. This allows us to better manage the iterative process of classifier improvement, where different attribute sets for learning are used in each iteration. We also propose to store attributes in a relational model, instead of the traditional text-based structures, to facilitate learning data analysis and manipulation.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2013
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: El Aouad, Sara;

    Les sites web de critiques en ligne aident les utilisateurs à décider quoi acheter ou quels hôtels choisir. Ces plateformes permettent aux utilisateurs d’exprimer leurs opinions à l’aide d’évaluations numériques et de commentaires textuels. Les notes numériques donnent une idée approximative du service. D'autre part, les commentaires textuels donnent des détails complets, ce qui est fastidieux à lire. Dans cette thèse, nous développons de nouvelles méthodes et algorithmes pour générer des résumés personnalisés de critiques de films, basés sur les aspects, pour un utilisateur donné. Le premier problème que nous abordons consiste à extraire un ensemble de mots liés à un aspect des critiques de films. Notre évaluation montre que notre méthode est capable d'extraire même des termes impopulaires qui représentent un aspect, tels que des termes composés ou des abréviations. Nous étudions ensuite le problème de l'annotation des phrases avec des aspects et proposons une nouvelle méthode qui annote les phrases en se basant sur une similitude entre la signature d'aspect et les termes de la phrase. Le troisième problème que nous abordons est la génération de résumés personnalisés, basés sur les aspects. Nous proposons un algorithme d'optimisation pour maximiser la couverture des aspects qui intéressent l'utilisateur et la représentativité des phrases dans le résumé sous réserve de contraintes de longueur et de similarité. Enfin, nous réalisons trois études d’utilisateur qui montrent que l’approche que nous proposons est plus performante que la méthode de pointe en matière de génération de résumés. Online reviewing websites help users decide what to buy or places to go. These platforms allow users to express their opinions using numerical ratings as well as textual comments. The numerical ratings give a coarse idea of the service. On the other hand, textual comments give full details which is tedious for users to read. In this dissertation, we develop novel methods and algorithms to generate personalized, aspect-based summaries of movie reviews for a given user. The first problem we tackle is extracting a set of related words to an aspect from movie reviews. Our evaluation shows that our method is able to extract even unpopular terms that represent an aspect, such as compound terms or abbreviations, as opposed to the methods from the related work. We then study the problem of annotating sentences with aspects, and propose a new method that annotates sentences based on a similarity between the aspect signature and the terms in the sentence. The third problem we tackle is the generation of personalized, aspect-based summaries. We propose an optimization algorithm to maximize the coverage of the aspects the user is interested in and the representativeness of sentences in the summary subject to a length and similarity constraints. Finally, we perform three user studies that show that the approach we propose outperforms the state of art method for generating summaries.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2019
    Hal-Diderot
    Doctoral thesis . 2019
    Data sources: Hal-Diderot
    Hal-Diderot
    Doctoral thesis . 2019
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
Advanced search in Research products
Research products
arrow_drop_down
Searching FieldsTerms
Any field
arrow_drop_down
includes
arrow_drop_down
The following results are related to Digital Humanities and Cultural Heritage. Are you interested to view more results? Visit OpenAIRE - Explore.
26 Research products
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Ferrari, Erika;

    Le patrimoine métallique est un témoin culturel de notre passé et, pour cette raison, sa préservation et sa transmission aux générations futures sont importantes. Plusieurs stratégies sont utilisées pour la protection du patrimoine cuivreux exposée en extérieur, dont l’utilisation des inhibiteurs de corrosion organiques. Les inhibiteurs utilisés pour le patrimoine sont généralement empruntés au domaine de l’industrie. Cependant, l’état de surface du métal, couvert par des couches de produits de corrosion complexes, et le protocole d’application des inhibiteurs diffèrent considérablement de l’application industrielle.La présente étude porte spécifiquement sur les inhibiteurs de corrosion pour la conservation des artefacts exposés à base de cuivre par une approche physico-chimique innovante. L'approche prend en compte la complexité de la couche de corrosion étudiée : une plaque de cuivre naturellement corrodée, représentative de la corrosion extérieure à long terme a été choisie. Pour l'étude, trois molécules organiques, caractérisées par des fonctions chimiques différentes ont été sélectionnées comme inhibiteurs de test : le benzotriazole (BTAH), un composé azolé, employé en conservation, dont l'efficacité est débattue et l’utilisation déconseillée en raison de sa toxicité ; l'acide décanoïque (HC10) un acide gras à longue chaîne qui a été proposé comme traitement pour les objets patrimoniaux ; l'acide benzotriazole-5-carboxylique (5CBT), un composé à fonctions mixtes azole-carboxyliques. La réactivité des inhibiteurs avec des phases minérales synthétiques représentatives des produits de corrosion ainsi que des échantillons corrodés anciens (100 ans) avant et après 6 mois d'exposition extérieure ont été étudiées en combinant des observations à l'échelle nanométrique (MET, FIB-tomographie) à celles obtenues à l'échelle microscopique (Raman, MEB-EDS) et des observations globales/globales (couleur, tension de surface, XRD). Des expériences complémentaires en milieux marqués ont permis d'étudier les évolutions de perméabilité (immersion en D₂O) et de comportement passif (immersion KBr). Deux mécanismes réactionnels ont été observés et une relation avec l'efficacité et la durabilité de l'inhibition est proposée. Les molécules caractérisées par la fonction azole (BTAH et 5CBT) réagissent selon un mécanisme d'adsorption-précipitation formant un complexe amorphe adsorbé (film nanométrique) sur la phase minérale substrat (cuprite et brochantite). Les deux traitements sur les couches anciennes de corrosion diffèrent par leur profondeur de pénétration, la formation du complexe BTAH étant détectée jusqu'à la couche interne de cuprite, tandis que la complexation 5CBT n'est observée que dans la partie externe de la brochantite. Ceci a un impact sur la perméabilité de l'eau et la passivité pour les traitements au BTAH qui montrent les meilleurs résultats, et suggère une formation de complexe Cu-BTA sur la partie externe de la couche de cuprite dans ce dernier traitement. La fonction carboxylique dans HC10 conduit à la précipitation du décanoate de cuivre par un mécanisme de dissolution-précipitation. Des cristaux de décanoate se forment sur la surface externe de brochantite : cela confère une quasi-superhydrophobie à l'échantillon après traitement. Cependant, le manque de liaison chimique forte entre le précipité et la surface induit la perte de la couche hydrophobe déposée en surface après 6 mois d'exposition à l'extérieur.En plus de ces résultats phénoménologiques, une nouvelle méthodologie basée sur l'expérience KBr pour tester les inhibiteurs des artefacts corrodés par le cuivre est également proposée. Metallic heritage artefacts represent cultural traces of our past, and for this reason, their preservation and transmission to future generations is important. To protect copper-based artworks exposed outdoors, several conservation strategies are followed, including the use of organic corrosion inhibitors. Inhibitors are usually borrowed from the industrial field. However, the surface state of the metal with the presence of complex corrosion layers, and the protocol of inhibitors' application differ considerably from the industrial ones.The present study specifically addresses corrosion inhibitors for conservation of copper-based exposed artifacts by an innovative physico-chemical approach. The approach takes into account the complexity of the corrosion layer under investigation: a naturally corroded copper plate, representative for outdoor long-term corrosion have been chosen. For the study, three organic molecules, characterized by different chemical functions have been selected as test inhibitors: benzotriazole (BTAH), an azole compound, employed in conservation, which efficiency is debated and its use discouraged due to toxicity; decanoic acid (HC10) a long-chain fatty acid that has been proposed as treatment for heritage objects; benzotriazole-5-carboxylic acid (5CBT), a compound with mixed azole-carboxylic functions.The reactivity of the inhibitors with synthetic mineral phases representative of corrosion products as well as ancient corroded samples (100 years) before and after 6-months outdoor exposure have been investigated by combining observations at the nanoscale (TEM, FIB-tomography) to those obtained at the microscale (Raman, SEM-EDS) and global/bulk observations (colour, surface tension, XRD). Additional experiments in marked environment allowed to investigate changes in permeability (D₂O immersion) and the evolution of passive behavior (KBr immersion).Two reaction mechanisms have been observed and a relationship with the efficiency and durability of the inhibition is proposed. The molecules BTAH and 5CBT interaction with copper atoms occurs via the azole function and both molecules react according to an adsorption-precipitation mechanism forming an adsorbed amorphous complex (nanometric film) on the substrate mineral phase (cuprite and brochantite). The two treatments on the ancient corrosion layers differ for their depth of penetration, with Cu-BTAH complex formation being detected until the cuprite inner layer, while 5CBT complexation is observed only in the outer part of the brochantite. This has an impact on the water permeability and passivity, with the BTAH treatments showing the best results, and suggests a complex formation with the outer cuprite layer in this last treatment. The carboxylic function in HC10 leads to the precipitation of copper decanoate by a dissolution-precipitation mechanism. Crystals of decanoate are formed on the outer surface of brochantite: this confers near super-hydrophobicity to the sample after treatment. However, the lack of bond between the precipitate and the surface determines the loss of the surface-deposited hydrophobic layer after 6 months of outdoor exposure.In addition to these phenomenological results, a new methodology based on the KBr experiment for testing inhibitors for copper corroded artefacts is also proposed.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Shang, Guokan;

    Grâce aux progrès impressionnants qui ont été réalisés dans la transcription du langage parlé, il est de plus en plus possible d'exploiter les données transcrites pour des tâches qui requièrent la compréhension de ce que l'on dit dans une conversation. Le travail présenté dans cette thèse, réalisé dans le cadre d'un projet consacré au développement d'un assistant de réunion, contribue aux efforts en cours pour apprendre aux machines à comprendre les dialogues des réunions multipartites. Nous nous sommes concentrés sur le défi de générer automatiquement les résumés abstractifs de réunion.Nous présentons tout d'abord nos résultats sur le Résumé Abstractif de Réunion (RAR), qui consiste à prendre une transcription de réunion comme entrée et à produire un résumé abstractif comme sortie. Nous introduisons une approche entièrement non-supervisée pour cette tâche, basée sur la compression multi-phrases et la maximisation sous-modulaire budgétisée. Nous tirons également parti des progrès récents en vecteurs de mots et dégénérescence de graphes appliqués au TAL, afin de prendre en compte les connaissances sémantiques extérieures et de concevoir de nouvelles mesures de diversité et d'informativité.Ensuite, nous discutons de notre travail sur la Classification en Actes de Dialogue (CAD), dont le but est d'attribuer à chaque énoncé d'un discours une étiquette qui représente son intention communicative. La CAD produit des annotations qui sont utiles pour une grande variété de tâches, y compris le RAR. Nous proposons une couche neuronale modifiée de Champ Aléatoire Conditionnel (CAC) qui prend en compte non seulement la séquence des énoncés dans un discours, mais aussi les informations sur les locuteurs et en particulier, s'il y a eu un changement de locuteur d'un énoncé à l'autre.La troisième partie de la thèse porte sur la Détection de Communauté Abstractive (DCA), une sous-tâche du RAR, dans laquelle les énoncés d'une conversation sont regroupés selon qu'ils peuvent être résumés conjointement par une phrase abstractive commune. Nous proposons une nouvelle approche de la DCA dans laquelle nous introduisons d'abord un encodeur neuronal contextuel d'énoncé qui comporte trois types de mécanismes d'auto-attention, puis nous l'entraînons en utilisant les méta-architectures siamoise et triplette basées sur l'énergie. Nous proposons en outre une méthode d'échantillonnage générale qui permet à l'architecture triplette de capturer des motifs subtils (p. ex., des groupes qui se chevauchent et s'emboîtent). With the impressive progress that has been made in transcribing spoken language, it is becoming increasingly possible to exploit transcribed data for tasks that require comprehension of what is said in a conversation. The work in this dissertation, carried out in the context of a project devoted to the development of a meeting assistant, contributes to ongoing efforts to teach machines to understand multi-party meeting speech. We have focused on the challenge of automatically generating abstractive meeting summaries.We first present our results on Abstractive Meeting Summarization (AMS), which aims to take a meeting transcription as input and produce an abstractive summary as output. We introduce a fully unsupervised framework for this task based on multi-sentence compression and budgeted submodular maximization. We also leverage recent advances in word embeddings and graph degeneracy applied to NLP, to take exterior semantic knowledge into account and to design custom diversity and informativeness measures.Next, we discuss our work on Dialogue Act Classification (DAC), whose goal is to assign each utterance in a discourse a label that represents its communicative intention. DAC yields annotations that are useful for a wide variety of tasks, including AMS. We propose a modified neural Conditional Random Field (CRF) layer that takes into account not only the sequence of utterances in a discourse, but also speaker information and in particular, whether there has been a change of speaker from one utterance to the next.The third part of the dissertation focuses on Abstractive Community Detection (ACD), a sub-task of AMS, in which utterances in a conversation are grouped according to whether they can be jointly summarized by a common abstractive sentence. We provide a novel approach to ACD in which we first introduce a neural contextual utterance encoder featuring three types of self-attention mechanisms and then train it using the siamese and triplet energy-based meta-architectures. We further propose a general sampling scheme that enables the triplet architecture to capture subtle patterns (e.g., overlapping and nested clusters).

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2021
    Hal-Diderot
    Doctoral thesis . 2021
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2021
      Hal-Diderot
      Doctoral thesis . 2021
      Data sources: Hal-Diderot
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Ben Nasr, Sana;

    L'analyse du domaine vise à identifier et organiser les caractéristiques communes et variables dans un domaine. Dans la pratique, le coût initial et le niveau d'effort manuel associés à cette analyse constituent un obstacle important pour son adoption par de nombreuses organisations qui ne peuvent en bénéficier. La contribution générale de cette thèse consiste à adopter et exploiter des techniques de traitement automatique du langage naturel et d'exploration de données pour automatiquement extraire et modéliser les connaissances relatives à la variabilité à partir de documents informels. L'enjeu est de réduire le coût opérationnel de l’analyse du domaine. Nous étudions l'applicabilité de notre idée à travers deux études de cas pris dans deux contextes différents: (1) la rétro-ingénierie des Modèles de Features (FMs) à partir des exigences réglementaires de sûreté dans le domaine de l’industrie nucléaire civil et (2) l’extraction de Matrices de Comparaison de Produits (PCMs) à partir de descriptions informelles de produits. Dans la première étude de cas, nous adoptons des techniques basées sur l’analyse sémantique, le regroupement des exigences et les règles d'association. Dans la deuxième étude de cas, notre approche repose sur la technologie d'analyse contrastive pour identifier les termes spécifiques au domaine à partir du texte, l'extraction des informations pour chaque produit, le regroupement des termes et le regroupement des informations. La principale leçon à tirer de ces deux études de cas, est que l’extraction et l’exploitation de la connaissance relative à la variabilité dépendent du contexte, de la nature de la variabilité et de la nature du texte. Domain analysis is the process of analyzing a family of products to identify their common and variable features. This process is generally carried out by experts on the basis of existing informal documentation. When performed manually, this activity is both time-consuming and error-prone. In this thesis, our general contribution is to address mining and modeling variability from informal documentation. We adopt Natural Language Processing (NLP) and data mining techniques to identify features, commonalities, differences and features dependencies among related products. We investigate the applicability of this idea by instantiating it in two different contexts: (1) reverse engineering Feature Models (FMs) from regulatory requirements in nuclear domain and (2) synthesizing Product Comparison Matrices (PCMs) from informal product descriptions. In the first case study, we adopt NLP and data mining techniques based on semantic analysis, requirements clustering and association rules to assist experts when constructing feature models from these regulations. In the second case study, our proposed approach relies on contrastive analysis technology to mine domain specific terms from text, information extraction, terms clustering and information clustering. The main lesson learnt from the two case studies is that the exploitability and the extraction of variability knowledge depend on the context, the nature of variability and the nature of text.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2016
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2016
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Jalalzai, Hamid;

    Les extrêmes apparaissent dans une grande variété de données. Par exemple,concernant les données hydrologiques, les extrêmes peuvent correspondre à des inondations, des moussons voire des sécheresses. Les données liées à l’activité humaine peuvent également conduire à des situations extrêmes, dans le cas des transactions bancaires, le montant alloué à une vente peut être considérable et dépasser les transactions courantes. Un autre exemple lié à l’activité humaine est la fréquence des mots utilisés : certains mots sont omniprésents alors que d’autres sont très rares. Qu’importe le contexte applicatif, les extrêmes qui sont rares par définition, correspondent à des données particulières. Ces événements sont notamment alarmants au vu de leur potentiel impact désastreux. Cependant, les données extrêmes sont beaucoup moins considérées dans les statistiques modernes ou les pratiques courantes d’apprentissage machine, principalement car elles sont considérablement sous représentées : ces événements se retrouvent noyés - à l’ère du ”big data” - par une vaste majorité de données classiques et non extrêmes. Ainsi, la grande majorité des outils d’apprentissage machine qui se concentrent naturellement sur une distribution dans son ensemble peut être inadaptée sur les queues de distribution où se trouvent les observations extrêmes. Dans cette thèse, les défis liés aux extrêmes sont détaillés et l’accent est mis sur le développement de méthodes dédiées à ces données. La première partie se consacre à l’apprentissage statistique dans les régions extrêmes. Dans le chapitre 4, des garanties non asymptotiques sur l’erreur d’estimation de la mesure angulaire empirique sont étudiées et permettent d’améliorer des méthodes de détection d’anomalies par minimum volume set sur la sphère. En particulier, le problème de la minimisation du risque empirique pour la classification binaire dédiée aux échantillons extrêmes est traitée au chapitre 5. L’analyse non paramétrique et les garanties qui en résultent sont détaillées. L’approche est adaptée pour traiter de nouveaux échantillons se trouvant hors de l’enveloppe convexe formée par les données rencontrées. Cette propriété d’extrapolation est l’élément clé et charnière nous permettant de concevoir de nouvelles représentations conservant un label donné et d’ainsi augmenter la quantité de données. Le chapitre 6 se concentre sur l’apprentissage de cette représentation à queue lourde (pour être précis, à variation régulière) à partir d’une distribution d’entrée. Les illustrations montrent une meilleure classification des extrêmes et conduit à la génération de phrases cohérentes. Enfin, le chapitre 7 propose d’analyser la structure de dépendance des extrêmes multivariés. En constatant que les extrêmes se concentrent au sein de groupes où les variables explicatives ont tendance à prendre –de manière récurrente–de grandes valeurs simultanément ; il en résulte un problème d’optimisation visant à identifier ces sous-groupes grâce à des moyennes pondérées des composantes. Extremes surround us and appear in a large variety of data. Natural data likethe ones related to environmental sciences contain extreme measurements; inhydrology, for instance, extremes may correspond to floods and heavy rainfalls or on the contrary droughts. Data related to human activity can also lead to extreme situations; in the case of bank transactions, the money allocated to a sale may be considerable and exceed common transactions. The analysis of this phenomenon is one of the basis of fraud detection. Another example related to humans is the frequency of encountered words. Some words are ubiquitous while others are rare. No matter the context, extremes which are rare by definition, correspond to uncanny data. These events are of particular concern because of the disastrous impact they may have. Extreme data, however, are less considered in modern statistics and applied machine learning, mainly because they are substantially scarce: these events are out numbered –in an era of so-called ”big data”– by the large amount of classical and non-extreme data that corresponds to the bulk of a distribution. Thus, the wide majority of machine learning tools and literature may not be well-suited or even performant on the distributional tails where extreme observations occur. Through this dissertation, the particular challenges of working with extremes are detailed and methods dedicated to them are proposed. The first part of the thesisis devoted to statistical learning in extreme regions. In Chapter 4, non-asymptotic bounds for the empirical angular measure are studied. Here, a pre-established anomaly detection scheme via minimum volume set on the sphere, is further im-proved. Chapter 5 addresses empirical risk minimization for binary classification of extreme samples. The resulting non-parametric analysis and guarantees are detailed. The approach is particularly well suited to treat new samples falling out of the convex envelop of encountered data. This extrapolation property is key to designing new embeddings achieving label preserving data augmentation. Chapter 6 focuses on the challenge of learning the latter heavy-tailed (and to be precise regularly varying) representation from a given input distribution. Empirical results show that the designed representation allows better classification performanceon extremes and leads to the generation of coherent sentences. Lastly, Chapter7 analyses the dependence structure of multivariate extremes. By noticing that extremes tend to concentrate on particular clusters where features tend to be recurrently large simulatenously, we define an optimization problem that identifies the aformentioned subgroups through weighted means of features.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2020
    Hal-Diderot
    Doctoral thesis . 2020
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2020
      Hal-Diderot
      Doctoral thesis . 2020
      Data sources: Hal-Diderot
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Liu, Xiao;

    L’internet et les nouvelles formes de média de communication, d’information, et de divertissement ont entraîné une croissance massive de la quantité des données numériques. Le traitement et l’interprétation automatique de ces données permettent de créer des bases de connaissances, de rendre les recherches plus efficaces et d’effectuer des recherches sur les médias sociaux. Les travaux de recherche sur le traitement automatique du langage naturel concernent la conception et le développement d’algorithmes, qui permettent aux ordinateurs de traiter automatiquement le langage naturel dans les textes, les contenus audio, les images ou les vidéos, pour des tâches spécifiques. De par la complexité du langage humain, le traitement du langage naturel sous forme textuelle peut être divisé en 4 niveaux : la morphologie, la syntaxe, la sémantique et la pragmatique. Les technologies actuelles du traitement du langage naturel ont eu de grands succès sur les tâches liées auxdeux premiers niveaux, ce qui a permis la commercialisation de beaucoup d’applications comme les moteurs de recherche. Cependant, les moteurs de recherches avancés (structurels) nécessitent une interprétation du langage plus avancée. L’extraction d’information consiste à extraire des informations structurelles à partir des ressources non annotées ou semi-annotées, afin de permettre des recherches avancées et la création automatique des bases de connaissances. Cette thèse étudie le problème d’extraction d’information dans le domaine spécifique de l’extraction des événements biomédicaux. Nous proposons une solution efficace, qui fait un compromis entre deux types principaux de méthodes proposées dans la littérature. Cette solution arrive à un bon équilibre entre la performance et la rapidité, ce qui la rend utilisable pour traiter des données à grande échelle. Elle a des performances compétitives face aux meilleurs modèles existant avec une complexité en temps de calcul beaucoup plus faible. Lors la conception de ce modèle, nous étudions également les effets des différents classifieurs qui sont souvent proposés pour la résolution des problèmes de classification multi-classe. Nous testons également deux méthodes permettant d’intégrer des représentations vectorielles des mots appris par apprentissage profond (deep learning). Même si les classifieurs différents et l’intégration des vecteurs de mots n’améliorent pas grandement la performance, nous pensons que ces directions de recherche ont du potentiel et sont prometteuses pour améliorer l’extraction d’information. Internet as well as all the modern media of communication, information and entertainment entails a massive increase of digital data quantities. Automatically processing and understanding these massive data enables creating large knowledge bases, more efficient search, social medial research, etc. Natural language processing research concerns the design and development of algorithms that allow computers to process natural language in texts, audios, images or videos automatically for specific tasks. Due to the complexity of human language, natural language processing of text can be divided into four levels: morphology, syntax, semantics and pragmatics. Current natural language processing technologies have achieved great successes in the tasks of the first two levels, leading to successes in many commercial applications such as search. However, advanced structured search engine would require computers to understand language deeper than at the morphology and syntactic levels. Information extraction is designed to extract meaningful structural information from unannotated or semi-annotated resources to enable advanced search and automatically create knowledge bases for further use. This thesis studies the problem of information extraction in the specific domain of biomedical event extraction. We propose an efficient solution, which is a trade-off between the two main trends of methods proposed in previous work. This solution reaches a good balance point between performance and speed, which is suitable to process large scale data. It achieves competitive performance to the best models with a much lower computational complexity. While designing this model, we also studied the effects of different classifiers that are usually proposed to solve the multi-class classification problem. We also tested two simple methods to integrate word vector representations learned by deep learning method into our model. Even if different classifiers and the integration of word vectors do not greatly improve the performance, we believe that these research directions carry some promising potential for improving information extraction.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2014
    Hal-Diderot
    Doctoral thesis . 2014
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
      Hyper Article en Ligne
      Other literature type . 2014
      Hal-Diderot
      Doctoral thesis . 2014
      Data sources: Hal-Diderot
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Pronti, Lucilla;

    Cette thèse porte sur l’application des images multispectrales pour l’analyse des matériaux utilisés dans une peinture par comparaison avec la photographie traditionnelle de fluorescence induite par rayons UV et la réflectoraphgie infrarouge. L’application des images multispectrales à l'étude des matériaux picturaux a été appuyée par d'autres techniques analytiques telles que la spectroscopie de réflectance et de fluorescence, la spectroscopie de fluorescence X, la spectroscopie d'absorption UV-visible et la spectroscopie infrarouge transformée de Fourier en réflectance totale atténuée. L’imagerie multispectrale a été testée comme outil de laboratoire d’identification des matériaux picturaux. Ainsi, des couches de peinture constituées de pigments (anciens et modernes), de liants (œufs et l’huile de lin) et de vernis naturels ont été analysées. Pour les matériaux organiques, des expériences de vieillissement accéléré (photodégradation et dégradation thermique) ont permis de modéliser les changements optiques et chimiques intervenant au cours de la vie d’un tableau. De plus, une analyse diagnostique a été réalisée sur deux tableaux conservés à « Accademia di San Luca » (Rome) par photographie de fluorescence induite par rayonnement UV, radiographie, spectroscopie de réflectance, spectroscopie de fluorescence X, images de fluorescence UV et réflectance multispectrale, réflectographie infrarouge multispectrale. Par rapport aux techniques traditionnelles, les images multispectrales permettent d’analyser de nombreuses régions spectrales qui, dans certains cas, permettent d’identifier le pigment et/ou des zones non homogènes de la couche superficielle picturale. Certaines gammes de longueurs d’onde infrarouge permettent notamment de voir les détails des différentes couches préparatoires, amenant à une analyse plus précise de la technique d’exécution. Cependant, une des limites des images multispectrales concerne l’identification des mélanges complexes et/ou des différentes strates de matériaux en fonction du type de filtre utilisé. This thesis focus on the application of multispectral images for the analysis of pictorial materials in comparison with the traditional UV-fluorescence photography and infrared reflectography. The assessment of multispectral imaging for the study of pictorial materials was supported by other analytical techniques such as reflectance and fluorescence spectroscopy, X-Ray Fluorescence (XRF), UV-visible absorption spectroscopy and Total Attenuated Reflectance - Fourier Transform Infrared Spectroscopy (ATR-FTIR). The multispectral imaging was tested on swatches of pictorial layers (constituted by ancient and modern pigment), binders (egg and linseed oil) and natural varnishes. For the organic materials, accelerated ageing methods (photo-chemical and thermal degradation) were used to model the optical and chemical changes occurring during the lifetime of a painting. In addition, a diagnostic investigation was performed on two paintings placed in "Accademia di San Luca" (Rome) by means of UV-fluorescence photography, radiography, reflectance spectroscopy, X-ray fluorescence spectroscopy, UV-VIS-NIR multispectral imaging. Multispectral images, comparing to traditional techniques, permit to individuate specific spectral behaviors, and, in some cases, identify the pigment and/or non-homogeneous areas of the pictorial or varnish layers. The possibility to select some infrared wavelengths allows to see details of the preparatory layers, leading to a more accurate analysis of the technique of execution. However, the limitations of multispectral images for the identification of complex mixtures and/or different layers of materials depending on the type of filter used.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hal-Diderot
    Doctoral thesis . 2016
    Data sources: Hal-Diderot
    0
    citations0
    popularityAverage
    influenceAverage
    impulseAverage
    BIP!Powered by BIP!
    more_vert
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Authors: Benjelloun, Yacine;

    La faille nord anatolienne (NAF), une zone de faille dextre longue de 1000 km est caractérisée par un fort aléa sismique. Elle accommode le mouvement vers l’ouest de l’Anatolie par rapport à l’Eurasie. Dans sa partie ouest, la NAF se divise en trois branches, dont une borde le sud de la mer de Marmara et du lac d’Iznik. Ce segment médian de la NAF (MNAF) présente aujourd’hui une très faible sismicité. Pourtant, cette zone se caractérise par un risque sismique élevé à l’échelle des deux derniers millénaires. Plus de six séismes sont décrits par les auteurs anciens et causèrent des destructions dans la ville d’Iznik (ancienne Nicée), un centre politique et religieux important aux époques hellénistique et romaine. Notre étude a pour but de contraindre l’activité sismique récente de la MNAF dans la région d’Iznik à plusieurs échelles de temps, par une approche pluridisciplinaire combinant géosciences et archéologie.Le premier objectif de cette thèse est de développer l’étude des bâtiments anciens comme archives de la sismicité historique en observant leurs endommagements et réparations successifs. La ville de Nicée est appropriée pour ce type d’étude puisqu’elle présente plusieurs bâtiments préservés portant les traces de nombreuses réparations. J’ai concentré mon travail sur des infrastructures critiques comme la muraille défensive longue de 3 km. Cela inclut aussi l’aqueduc de la ville, recoupé par une faille active, ainsi qu’une basilique romaine découverte récemment sous les eaux du lac d’Iznik à 20 m de la côte. En appliquant plusieurs techniques de datation (stratigraphie des édifices, 14C) sur les bâtiments, j’ai pu identifier au moins trois séismes sources d’endommagement depuis le 6e siècle. La répartition des dommages sur les bâtiments permet d’estimer des intensités locales de VIII sur l’échelle macrosismique européenne (EMS98). Grâce à des simulations numériques, je montre que les déformations visibles sur un obélisque romain au nord d’Iznik sont compatibles avec des magnitudes proches de Mw 7 pour des distances épicentrales inférieures à 15 km.Le deuxième objectif de cette thèse est de contraindre la vitesse de glissement quaternaire sur la MNAF et de mieux comprendre la formation du lac d’Iznik à l’ouest de la ville. Ce lac de 313 km² est le plus grand lac d’eau douce de la région de Marmara. Les principales failles autour du lac ont été cartées avec un MNT de haute résolution dérivé d’images Pléiades. Les marqueurs géomorphologiques décalés par la MNAF ont fait l’objet de mesures systématiques. L’analyse statistique de ces décalages a mis en évidence six ruptures majeures préservées dans le paysage, avec des déplacements cosismiques entre 2 et 6 m. Les âges de trois niveaux de terrasses lacustres au nord du lac ont été quantifiés par radiocarbone et 10Be produit in situ. J’ai pu déterminer un taux de glissement horizontal minimum de 2.9 mm/yr. Le basculement vers le sud des paléorivages est compatible avec un taux de glissement vertical élevé sur la MNAF autour de 6 mm/yr.En travaillant sur la morphologie et les lithologies de la région d’Iznik, nous avons découvert des preuves d’épisodes glaciaires LGM. La morphologie en U de plusieurs vallées à l’est du lac d’Iznik, séparées par des sauts topographiques correspond à l’empreinte d’anciens glaciers. Cette hypothèse est confirmée par la présence de moraines en bord de vallée, de blocs erratiques aux lithologies variées, et de sédiments glacio-lacustres. La distribution spatiale de ces marqueurs morphologiques et lithologiques nous permet de reconstruire l’emplacement et le retrait vers l’est de ce glacier. Les âges absolus des dépôts glaciaires et des alluvions postérieurs à la glaciation sont compatibles avec des proxies paléoenvironnementaux provenant du lac d’Iznik et les études réalisées sur d’autres glaciers turcs LGM. Il s’agit de la première découverte de glaciers à si basse altitude en Turquie. The North Anatolian fault (NAF), a 1000 km-long dextral fault zone is known for its strong seismic hazard. It accommodates the westward motion of Anatolia, relative to Eurasia. In its western part, the NAF splits into three strands, one of which passing south of the Marmara sea and the Iznik lake. This NAF middle strand (MNAF) shows nowadays a very low seismic activity. However, this area has been characterized by a significant earthquake hazard over the last two millennia. Several ancient authors mention the occurrence of more than six destructive earthquakes that impacted Iznik (old Nicaea), which was an important political and religious centre during the Hellenistic and Roman periods. Our study aims to constrain the recent seismic activity on the MNAF in the Iznik area at different time scales through a multidisciplinary approach coupling earth science and archeology.The first goal of this thesis is to develop the study of ancient buildings as archives of the historical seismicity by observing their successive damages and repairs. The city of Nicaea is appropriate for this kind of study as it presents several well preserved ancient buildings that bear traces of numerous repairs. I focus my study on the critical infrastructures for the city such as the 3 km-long protecting walls. This also includes the aqueduct that provided the city with water and is crossed by a segment of active fault, and a Roman basilica recently discovered underwater in the Iznik lake 20 m far from the shore. Applying different dating techniques (stratigraphy of the archaeological building, 14C) to the various materials of these buildings (terra cotta, mortar, concretions on the aqueduct), I was able to identify at least three damaging earthquakes since the 6th century AD. The amount of damage on these buildings allows to estimate local intensities at VIII on the European macroseismic scale (EMS98). Thanks to numerical simulations, I show that the current deformation visible on a Roman obelisk north of Iznik is compatible with magnitudes close to Mw 7 for epicentral distances smaller than 15 km.The second goal of this thesis is to constrain the Quaternary slip rate on the MNAF and better understand the formation of Iznik Lake, a 313 km²-large lake located just west of the city, which is the largest freshwater lake in the Marmara region. The main faults around the lake were mapped using a high-resolution DEM derived from Pleiades images. Geomorphic markers offset by the MNAF were systematically measured. The statistical analysis of the offsets revealed six major ruptures preserved in the landscape, with coseismic displacements between 2 and 6 m. The ages of three levels of lacustrine terraces north of the lake were quantified by radiocarbon and in-situ produced 10Be. A minimal horizontal slip rate of 2.9 mm/yr was estimated. The southward tilting of the lake paeloshorelines is compatible with a high vertical slip rate on the MNAF around 6 mm/yr.While working on the morphology and lithologies of the Iznik area, we have discovered significant evidence for LGM glacial events. The U-shaped morphology of several successive valleys east of Iznik Lake separated by topographic highs is interpreted as the print of past glaciers. This is confirmed by the presence of moraine deposits on the sides of the valleys, erratic blocks from various lithologies and glacio-lacustrine sediments. The geographical distribution of these morphological and lithological markers enabled us to reconstruct the former location and eastward retreat of this glacier. The absolute ages obtained from glacial deposits and alluvial sediments postponing the glaciation are compatible with paleoenvironmental proxies in Iznik Lake and previous studies of other Turkish LGM glaciers. This constitutes the first evidence of glaciation at low elevations in Turkey.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Hyper Article en Lig...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
    Hyper Article en Ligne
    Other literature type . 2017
    Hal-Diderot
    Doctoral thesis . 2017
    Data sources: Hal-Diderot