Advanced search in Research products
Research products
Searching FieldsTerms
Any field
The following results are related to Digital Humanities and Cultural Heritage. Are you interested to view more results? Visit OpenAIRE - Explore.

  • Digital Humanities and Cultural Heritage
  • Publications
  • Master thesis
  • Electronic Archive of Igor Sikorsky...

Date (most recent)
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Розмір пояснювальної записки – 94 аркуші, містить 17 ілюстрацій, 25 таблиць, 5 додатків, 29 посилань на джерела. Актуальність теми. У роботі розглянуто проблему в області обробки потоків текстових даних, показано основні особливості наявних платформ обробки потоків текстових даних, їх переваги та недоліки. Виявлено потребу в удосконаленні методу обробки природної мови для потоків текстових даних. Мета дослідження. Основною метою є покращення наявних інструментів обробки природної мови для забезпечення підтримки україномовних текстів та розробка програмного забезпечення, здатного проводити аналіз потоків текстових даних в реальному часі. Об’єкт дослідження: потоки текстових даних. Предмет дослідження: методи та засоби створення програмного забезпечення для обробки природної мови для потоків текстових даних в режимі реального часу. Для реалізації поставленої мети сформульовані наступні завдання: − порівняльний аналіз наявних рішень для обробки потоків текстових даних в реальному часі; − формулювання структурних та технічних особливостей джерел потоків текстових даних; − підбір та підготовка україномовного словника; − впровадження наявних рішень для забезпечення підтримки морфологічного аналізу; − розробка програмного забезпечення обробки потоків текстових даних із використанням морфологічного аналізатора в режимі реального часу; − оцінка ефективності запропонованого рішення. Наукова новизна результатів магістерської дисертації полягає в удосконаленні методу обробки природної мови текстових даних за рахунок впровадження підтримки потокової обробки у режимі реального часу, що підвищує швидкодію обробки та дозволяє виконувати розподілені обчислення, а також покращенні рівня підтримки обробки україномовних текстів за рахунок інтеграції словника ВЕСУМ. Практичне значення отриманих результатів полягає в тому, що запропоновано архітектуру програмного забезпечення обробки потоків текстових даних в реальному часі із використанням Apache Spark та бібліотеки потокової обробки Spark Streaming з зберіганням результатів в пошуковий сервер Elasticsearch із використанням рушія візуалізації Kibana, а також розроблено програмне забезпечення з використанням запропонованої архітектури для аналізу потоків україномовних текстових даних. Розроблене програмне забезпечення може бути використане в подальшому для обробки потоків текстових даних з україномовних джерел, а також для виконання ширшого спектру задач NLP (наприклад, сентимент-аналіз або інтелектуальних аналіз текстових даних). Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Методи та технології високопродуктивних обчислень та обробки надвеликих масивів даних». Державний реєстраційний номер 0117U000924. Апробація. Наукові положення дисертації пройшли апробацію на III Всеукраїнській науково-практичній конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ. Публікації. Наукові положення дисертації опубліковані в: 1) Федорович І.А. Моделі обробки потоків текстових даних в рушії Apache Spark Structured Streaming / І.А. Федорович, Ю.О. Олійник // Матеріали III Всеукраїнської науково-практичної конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ: НТУУ «КПІ ім. Ігоря Сікорського», 23-25 листопада 2022 р. Розмір пояснювальної записки – 94 аркуші, містить 17 ілюстрацій, 25 таблиць, 5 додатків, 29 посилань на джерела. Актуальність теми. У роботі розглянуто проблему в області обробки потоків текстових даних, показано основні особливості наявних платформ обробки потоків текстових даних, їх переваги та недоліки. Виявлено потребу в удосконаленні методу обробки природної мови для потоків текстових даних. Мета дослідження. Основною метою є покращення наявних інструментів обробки природної мови для забезпечення підтримки україномовних текстів та розробка програмного забезпечення, здатного проводити аналіз потоків текстових даних в реальному часі. Об’єкт дослідження: потоки текстових даних. Предмет дослідження: методи та засоби створення програмного забезпечення для обробки природної мови для потоків текстових даних в режимі реального часу. Для реалізації поставленої мети сформульовані наступні завдання: − порівняльний аналіз наявних рішень для обробки потоків текстових даних в реальному часі; − формулювання структурних та технічних особливостей джерел потоків текстових даних; − підбір та підготовка україномовного словника; − впровадження наявних рішень для забезпечення підтримки морфологічного аналізу; − розробка програмного забезпечення обробки потоків текстових даних із використанням морфологічного аналізатора в режимі реального часу; − оцінка ефективності запропонованого рішення. Наукова новизна результатів магістерської дисертації полягає в удосконаленні методу обробки природної мови текстових даних за рахунок впровадження підтримки потокової обробки у режимі реального часу, що підвищує швидкодію обробки та дозволяє виконувати розподілені обчислення, а також покращенні рівня підтримки обробки україномовних текстів за рахунок інтеграції словника ВЕСУМ. Практичне значення отриманих результатів полягає в тому, що запропоновано архітектуру програмного забезпечення обробки потоків текстових даних в реальному часі із використанням Apache Spark та бібліотеки потокової обробки Spark Streaming з зберіганням результатів в пошуковий сервер Elasticsearch із використанням рушія візуалізації Kibana, а також розроблено програмне забезпечення з використанням запропонованої архітектури для аналізу потоків україномовних текстових даних. Розроблене програмне забезпечення може бути використане в подальшому для обробки потоків текстових даних з україномовних джерел, а також для виконання ширшого спектру задач NLP (наприклад, сентимент-аналіз або інтелектуальних аналіз текстових даних). Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Методи та технології високопродуктивних обчислень та обробки надвеликих масивів даних». Державний реєстраційний номер 0117U000924. Апробація. Наукові положення дисертації пройшли апробацію на III Всеукраїнській науково-практичній конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ. Публікації. Наукові положення дисертації опубліковані в: 1) Федорович І.А. Моделі обробки потоків текстових даних в рушії Apache Spark Structured Streaming / І.А. Федорович, Ю.О. Олійник // Матеріали III Всеукраїнської науково-практичної конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ: НТУУ «КПІ ім. Ігоря Сікорського», 23-25 листопада 2022 р. Explanatory note size – 94 pages, contains 17 illustrations, 25 tables, 5 applications, 29 references. Topicality. Examines the problem in the field of text data stream processing, shows the main features of existing text data stream processing platforms, their advantages and disadvantages. The need to improve the natural language processing method for text data streams has been identified. The aim of the study. The main goal is to improve existing natural language processing tools to provide support for the Ukrainian language and to develop software capable of analyzing text data streams in real time. The object of research: methods of text data stream processing. The subject of research: methods and means of creating software for natural language processing for text data streams in real time. To achieve this goal, the following tasks were formulated: − comparative analysis of available solutions for processing text data streams in real time; − formulation of structural and technical features of sources of text data flows; − selection and preparation of a Ukrainian dictionary; − implementation of existing solutions to support morphological analysis; − development of software for processing text data streams using a morphological analyzer in real time; − assessment of the effectiveness of the proposed solution. The scientific novelty of the results of the master's dissertation is is that the improvement of the natural language processing method of text data due to the introduction of real-time stream processing support, which increases the speed of processing and allows to perform distributed calculations, as well as the improvement of the level of support for the Ukrainian language due to the integration of the WESUM dictionary. The practical value of the obtained results is that the software architecture for real-time processing of text data streams using Apache Spark and the Spark Streaming library with storage of results in the Elasticsearch search server using the Kibana visualization engine is proposed, and software is developed using of the proposed architecture for the analysis of streams of Ukrainian-language textual data. The developed software can be used in the future to process streams of text data from Ukrainian-language sources, as well as to perform a wider range of NLP tasks (for example, sentiment analysis or intellectual analysis of text data). Relationship with working with scientific programs, plans, topics. The work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute” in the framework of the topic “Methods and technologies of high-performance computing and big data processing”. State registration number 0117U000924. Approbation. The scientific provisions of the dissertation were tested at the Third All-Ukrainian Scientific and Practical Conference of Young Scientists and Students "Software Engineering and Advanced Information Technologies" (SoftTech- 2022 autumn) - Kyiv. Publications. The scientific provisions of the dissertation were published in: 1) Fedorovych I.A. Processing models of text data streams in the Apache Spark Structured Streaming engine / I.A. Fedorovych, Yu.O. Oliinyk // Materials of the III All-Ukrainian scientific and practical conference of young scientists and students "Software engineering and advanced information technologies" (SoftTech-2022 autumn) - Kyiv: NTUU "KPI them. Igor Sikorsky", November 23-25, 2022. Explanatory note size – 94 pages, contains 17 illustrations, 25 tables, 5 applications, 29 references. Topicality. Examines the problem in the field of text data stream processing, shows the main features of existing text data stream processing platforms, their advantages and disadvantages. The need to improve the natural language processing method for text data streams has been identified. The aim of the study. The main goal is to improve existing natural language processing tools to provide support for the Ukrainian language and to develop software capable of analyzing text data streams in real time. The object of research: methods of text data stream processing. The subject of research: methods and means of creating software for natural language processing for text data streams in real time. To achieve this goal, the following tasks were formulated: − comparative analysis of available solutions for processing text data streams in real time; − formulation of structural and technical features of sources of text data flows; − selection and preparation of a Ukrainian dictionary; − implementation of existing solutions to support morphological analysis; − development of software for processing text data streams using a morphological analyzer in real time; − assessment of the effectiveness of the proposed solution. The scientific novelty of the results of the master's dissertation is is that the improvement of the natural language processing method of text data due to the introduction of real-time stream processing support, which increases the speed of processing and allows to perform distributed calculations, as well as the improvement of the level of support for the Ukrainian language due to the integration of the WESUM dictionary. The practical value of the obtained results is that the software architecture for real-time processing of text data streams using Apache Spark and the Spark Streaming library with storage of results in the Elasticsearch search server using the Kibana visualization engine is proposed, and software is developed using of the proposed architecture for the analysis of streams of Ukrainian-language textual data. The developed software can be used in the future to process streams of text data from Ukrainian-language sources, as well as to perform a wider range of NLP tasks (for example, sentiment analysis or intellectual analysis of text data). Relationship with working with scientific programs, plans, topics. The work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute” in the framework of the topic “Methods and technologies of high-performance computing and big data processing”. State registration number 0117U000924. Approbation. The scientific provisions of the dissertation were tested at the Third All-Ukrainian Scientific and Practical Conference of Young Scientists and Students "Software Engineering and Advanced Information Technologies" (SoftTech- 2022 autumn) - Kyiv. Publications. The scientific provisions of the dissertation were published in: 1) Fedorovych I.A. Processing models of text data streams in the Apache Spark Structured Streaming engine / I.A. Fedorovych, Yu.O. Oliinyk // Materials of the III All-Ukrainian scientific and practical conference of young scientists and students "Software engineering and advanced information technologies" (SoftTech-2022 autumn) - Kyiv: NTUU "KPI them. Igor Sikorsky", November 23-25, 2022.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Загальний обсяг роботи с. 103, рис. 19 , таблиць 24, додатки 1, джерел 30. Актуальність теми дослідження полягає у тому, що хмарні медичні системи широко інтегруються в повсякденне життя людей у всьому світі, що потребує якісного і обґрунтованого підходу до їх архітектурної побудови, сталого розвитку і довгочасної підтримки, що потребують гнучкості такої системи. Також взаємна інтеграція і кількість різних сервісів потребують стандартизації та взаємозамінності - інтероперабельності в широкому сенсі цього терміну. Таким чином можна побудувати гнучку та надійну медичну систему, що поєднує у собі багато уніфікованих медичних сервісів, що в свою чергу зменшить витрати на розробку нових сервісів, мінімізує час для розгортання, впровадження та пошуку в спільній медичній систем. Мета та задачі дослідження. Метою даної роботи є створення та імплементація базової архітектури інтелектуального репозитарію медичних сервісів. Поставлена мета вимагає вирішення наступних дослідницько-наукових задач: Аналіз стандартів обміну медичними даними, що необхідні для забезпечення інтероперабельності сервісів. Аналіз механізмів service discovery. Визначення критеріїв для семантичного пошуку медичних сервісів. Дослідження та розробка методу семантичного пошуку медичних сервісів. Реалізація тестового репозитарію медичних сервісів та дослідження ефективності їх семантичного вибору. Об’єкт досліджень - медичні сервіс-орієнтовані архітектури. Предмет досліджень - виявлення, реєстрація та семантичний пошук інтероперабельних медичних сервісів. Методи досліджень. Для вирішення проблеми в даній роботі використовуються методи системного аналізу, синтезу, проектування логічних структур даних порівняння, логічного узагальнення результатів. Наукова новизна. Наукова новизна дипломної роботи полягає у тому, що представлена архітектура для хмарних медичних сервісів та розроблений інтелектуальний репозитарій інтероперабельних медичних сервісів є одним з перших, що використовує методи семантичного пошуку на основі онтологій або схем OpenAPI у сфері охорони здоров’я. Публікація: 1. Представлення інтероперабельних сервісів для роботи з медичними даними в мікросервісній архітектурі / Кандель К.В., Кулик В.О., Мельник О.Р., Письменний І.О. // Системні науки та інформатика: збірник доповідей І науково-практичної конференції «Системні науки та інформатика», 22–29 листопада 2022 року, Київ. – К., НН ІПСА КПІ ім. Ігоря Сікорського, 2022. – с. 323-330. The total amount of work is pages 103, figures 19, tables 24, appendices 1, sources 30. The relevance of the topic of the master's thesis lies in the fact that cloud medical systems are widely integrated into the everyday life of people all over the world, which requires a high-quality and reasonable approach to their architectural construction, sustainable development and long-term support, which require the flexibility of such a system. Also, mutual integration and the number of different services require standardization and interchangeability - interoperability in the broadest sense of the term. In this way, it is possible to build a flexible and reliable medical system that combines many unified medical services, which in turn will reduce costs for the development of new services, and minimize the time for deployment, implementation and search in a common medical system. The aim and objectives of the research. The purpose of this work is to create and implement the basic architecture of an intelligent repository of medical services. The set goal requires solving the following research and scientific problems: Analysis of medical data exchange standards necessary to ensure interoperability of services. Analysis of service discovery mechanisms. Definition of criteria for the semantic search of medical services. Research and development of the method of semantic search of medical services. Implementation of a test repository of medical services and research on the effectiveness of their semantic selection. Object of research: medical service-oriented architecture. The subject of research is the detection, registration and semantic search of interoperable medical services. Research methods. To solve the problem in this paper, the methods of system analysis, synthesis, design of logical structures of comparison data, and logical generalization of results are used. Scientific novelty. The scientific novelty of the thesis lies in the fact that the presented architecture for cloud medical services and an intelligent repository of interoperable services is one of the first to use semantic search methods based on OpenAPI ontologies or schemas. Publication: 1. Presentation of interoperable services for working with medical data in microservice architecture / K.V. Kandel, V.O. Kulyk, O.R. Melnyk, I.O. Pysmennyi.// System sciences and informatics: collection of reports of the 1st scientific and practical conference "System sciences and informatics", November 22–29, 2022, Kyiv. – K., ES IASA KPI named after Igor Sikorsky, 2022. - p. 323-330.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Розмір пояснювальної записки — 77 аркушів, містить 18 ілюстрацій, 10 таблиць, 7 додатків, 4 розділи та 32 джерела. Актуальність теми. Пропаганда — комунікаційна стратегія, що відома ефективністю та, зазвичай, намаганням ввести в оману для поширення певної точки зору, переконання, нав’язування поглядів. Певні категорії населення (наприклад, молодь) статистично є особливо вразливими. Характерною рисою пропаганди є використанням усталених прийомів та засобів, що вже досліджувались протягом ХХ та ХХІ сторіч. Тож актуальним є завдання створення програмного засобу, системи для автоматичного виявлення пропаганди в текстах, для інформування вразивих категорій населення. Метою дослідження є розробка системи, що аналізує наданий текст на предмет наявності в ньому пропаганди та виводить інформацію про результати аналізу. Об’єкт дослідження — обробка природної мови у контексті методів розпізнавання пропаганди в текстах. Предмет дослідження — методи та засоби розпізнавання пропаганди в текстах. Новизна роботи: – Вперше сформовано набір даних для класифікації, що включає сучасні зразки державної пропаганди Російської Федерації в медіа за період повномасштабного вторгнення до України 2022 року. Проведено дослідження на цьому наборі даних. – Надано подальшого розвитку способу виявлення пропаганди в текстах англійською мовою за рахунок її адаптації для роботи з українською мовою. Практичне значення одержаних результатів. Практичні результати магістерської дисертації мають цінність в сфері аналізу текстів природною мовою. Результати включають реалізацію прототипу запропонованої системи, що аналізує наданий текст, використовуючи навчену модель виявлення пропаганди та надає відповідь з результатами аналізу. Система, надана як сервіс, може бути використана для побудови процесу фільтрації контенту в інших системах. Explanatory note size – 77 pages, contains 18 illustrations, 10 tables, 7 applications, 4 sections, 32 sources. Topicality. Propaganda is a communication strategy known for its effectiveness and, as a rule, for its attempts to mislead the audience to spread some agenda, persuade, and impose certain viewpoints. Some population categories (e.g. youth) are statistically particularly vulnerable to it. A key feature of propaganda is the use of certain established techniques and tools researched during the XX and XXI centuries. Therefore, the task to design a software tool, a system for automatic detection of propaganda in texts, to inform vulnerable categories of the population is topical. The purpose of the study is to develop a system that analyzes the text provided for the presence of propaganda in it and displays information about the results of the analysis. The object of research is the natural language processing in the context of methods of propaganda detection in texts. The subject of research is methods and means of recognizing propaganda in texts. The novelty of work: – For the first time, a new dataset for the classification has been formed. It includes modern examples of Russian Federation state propaganda in the media for the period of the full-scale invasion of Ukraine in 2022. The research has been conducted on this dataset. – The method for propaganda detection in texts was further developed for processing the Ukrainian language. The practical value of the obtained results. The practical results of the master's dissertation are valuable in the field of natural language processing. The results include the implementation of a prototype of the proposed system that analyzes the provided text using a trained model of propaganda detection and provides a response with the results of the analysis. The system, provided as a service, could be used to build a content filtering process in other systems.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Дана магістерська дисертація присвячена розробленню та реалізації алгоритмічно-програмного параметризованого методу реферування текстових даних. В дисертації проаналізовано переваги та недоліки існуючих методів автоматизованого реферування текстових даних, підтверджено гіпотезу щодо впливу параметрів вхідного тексту на результуючий реферат, запропоновано шляхи до подолання впливу згаданих параметрів, сформульовано вимоги до розроблюваного методу, обґрунтовано підібрано найбільш доцільну для використання модель нейронної мережі BERT. Новизна запропонованого методу полягає у визначенні параметрів вхідного тексту та використанні відповідної моделі нейронної мережі для генерації реферату тексту. Практична цінність отриманих в роботі результатів полягає в тому, що запропонований метод дозволив підвищити якість отримуваного реферату за обраними критеріями. У даній магістерській дисертації розроблено програмну реалізацію параметризованого реферування текстових даних на основі запропонованого алгоритмічно-програмного методу. Given master's dissertation is devoted to the development and implementation of algorithmic-software parameterized method of summarization text data. The dissertation analyzes the advantages and disadvantages of existing methods of automated text abstracting, confirms the hypothesis of the influence of input text parameters on the resulting abstract, suggests ways to overcome the influence of these parameters, formulates requirements for the developed method, substantiated the selection of the most expedient neural network model BERT. The novelty of the proposed method is to determine the parameters of the input text and use the appropriate neural network model to form an abstract of the text. The practical value of the results obtained in the work is that the proposed method has improved the quality of the abstract according to selected criteria. This master's dissertation developed the software implementation of parameterized summarization of text data on the basis of the proposed algorithmic-program method.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Магістерська дисертація: 78 с., 19 рис., 32 табл., 37 джерел. Об’єкт дослідження – Методи та моделі ШІ. Предмет дослідження – Системи розпізнавання фейкових новин на основі методів штучного інтелекту. Мета роботи – дослідити та зробити власну модель розпізнавання фейкової інформації, зробити аналіз з найсучаснішими суміжними роботами, що показали найкращий результат. У минулому для виявлення фейкових новин здебільшого використовували класифікаційні та регресійні моделі, в яких вхідними даними були або зміст статті, або шляхи поширення чуток. Однак у цій роботі представлено модель глибокої нейронної мережі на основі двонаправленої довготривалої короткочасної пам'яті (LSTM). Дана робота має неабияку актуальність в сьогодення, а саме у військовий час, коли кожен може отримувати величезну кількість інформації з соціальних мереж, але не кожен вміє її правильно аналізувати чи сприйняти, що може створювати негативні настрої в суспільстві. Проте використовуючи відповідну розробку, наприклад як телеграм бот чи додаток в браузері користувач може побачити певну інформацію як потенційно недостовірну, хоча вона і матиме гучні заголовки. Master’s thesis explanatory note: 78 p., 19 fig., 32 tables, 37 sources. Object of research - Methods and models of AI. Subject of research - The systems of recognition of fake news are on the basis of methods of artificial intelligence. The purpose of the work is to investigate and make our own model for recognizing fake information, to make an analysis with the most modern related works that have shown the best result. In the past, fake news detection mostly used classification and regression models, in which the input data was either the content of the article or the path of the rumor. However, this paper presents a deep neural network model based on bidirectional long short-term memory (LSTM). This work is of great relevance today, namely in wartime, when everyone can receive a huge amount of information from social networks, but not everyone knows how to analyze or perceive it correctly, which can create negative sentiments in society. However, using the appropriate development, such as a Telegram bot or a browser application, the user can see certain information as potentially unreliable, although it will have loud headlines.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Магістерська дисертація: 81 с., 10 табл., 10 рис., 16 джерел, 1 додаток. Об’єктом дослідження є задача автоматичного визначення зв’язку між текстами. Предмет дослідження – алгоритми та моделі задачі автоматичного визначення зв’язку між текстами. Мета дослідження полягає у аналізі алгоритмів та методів для задачі автоматичного визначення зв'язку між текстами, зокрема методи, що базуються на використанні глибоких нейронних мереж. Запропонована та розроблена модель вирішення автоматичного визначення логічного зв'язку між текстами на основі моделей типу Трансформер. Дані моделі здатні швидко оброблювати послідовності пар передпосилка-гіпотеза для співставлення цієї пари до одного з класів – логічного наслідку, протиріччя чи нейтрального класу. Проведено порівняння запропонованої моделі з існуючими методами вирішення задачі логічного зв’язку між текстами – моделями типу Трансформер, рекурентних нейроних мереж на основі LSTM з використанням механізму уваги. Master’s thesis 81 p., 10 tab., 10 fig., 16 references, 1 appendix. The object of research is the task of recognition of textual entailment(natural language inference). The subject of the research is algorithms and models of the problem of recognition of textual entailment(natural language inference). The aim of the study is to analyze algorithms and methods for the task of automatically determining the relationship between texts, in particular methods based on the use of deep neural networks. The model of task of recognition of textual entailment(natural language inference) on the basis of models like Transformer is offered and developed. These models are able to quickly process the sequences of premise-hypothesis pairs to compare this pair to one of the classes - logical entailment, contradiction or neutral class. The proposed model is compared with the existing methods of solving the problem of natural language inference – models such as Transformer, recurrent neural networks based on LSTM using the attention mechanism.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Розмір пояснювальної записки – 98 аркушів, містить 15 ілюстрацій, 53 таблиці, 4 додатків. Актуальність теми. У роботі розглянуто проблему відсутності розвинених систем генерації діалогів українською мовою, показано основні особливості існуючих рішень для генерації діалогів, їх переваги та недоліки. Виявлено потребу в розробці програмного забезпечення пристосованого до української мови. Мета дослідження. Основною метою є розширення функціоналу простих моделей генерації діалогів для того щоб покривати більший перелік запитів користувачів та зробити діалог більш природним Об’єкт дослідження: засоби розробки для обробки природної мови, пристосовані до української мови. Предмет дослідження: програмне та математичне забезпечення для генерації діалогових систем, що пристосовані до української мови. Для реалізації поставленої мети сформульовані наступні завдання: - виконати аналітичний огляд існуючих наукових робіт, які направлені на реалізацію програмного та математичного забезпечення генерації діалогових систем; - розробка алгоритму підготовки даних для їх аналізу моделлю; - пристосування алгоритму кластеризації до аналізу природної мови; - розробка алгоритму перетворення проаналізованих даних у речення; - програмна реалізація розроблених алгоритмів. Наукова новизна результатів магістерської дисертації полягає в тому, що запропоновано алгоритм для генерації діалогів українською мовою, що використовує остові дерева як основу та кластеризацію як функцію оцінки результатів. Результат досягнутий шляхом розробки модернізованого алгоритму з адаптацією під роботу з базою даних. Практичне значення отриманих результатів полягає в тому, що реалізовано алгоритм пристосований до української мови який дозволяє генерувати діалог на різні теми. Також було розроблено програмне забезпечення яке дозволяє використовувати данні з бази даних при генерації діалогу. Дане програмне забезпечення може буті використане розробниками чат-ботів у різних сферах. Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України "Київський політехнічний інститут імені Ігоря Сікорського". Апробація. Наукові положення дисертації пройшли апробацію на всеукраїнській науково-практичній конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech2021) – м. Київ. Публікації. Наукові положення дисертації опубліковані в: Корольова Л.В. Алгоритм навчання діалогової системи з використанням остових дерев / Л.В. Корольова, О.А. Халус // Матеріали всеукраїнської науково-практичної конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech2021) – м. Київ: НТУУ «КПІ ім. Ігоря Сікорського», 2021 р. Explanatory note size – 98 pages, contains 15 illustrations, 53 tables, 4 applications. Topicality. Examines the problem of the lack of developed dialogue generation systems in the Ukrainian language, shows the main features of existing solutions for dialogue generation, their advantages and disadvantages. The need for the development of software adapted to the Ukrainian language has been identified. The aim of the study. The main target is to extend the functionality of simple models for generating dialogs in order to cover a larger list of user requests and make the dialogue more natural. Object of research: development tools for natural language processing, adapted to the Ukrainian language. Subject of research: software and mathematical software for generating dialog systems adapted to the Ukrainian language. To achieve this goal, the following tasks were formulated: - perform an analytical review of existing research papers aimed at implementing software and mathematical software for generating dialog systems; - development of algorithm of data preparation for their analysis by model; - adaptation of the clustering algorithm to the analysis of natural language; - development of an algorithm for converting the analyzed data into sentences; - software implementation of the developed algorithms. The scientific novelty of the results of the master's dissertation is that an algorithm for generating dialogues in the Ukrainian language is proposed, which uses skeleton trees as a basis and clustering as a function of evaluating the results. The result was achieved by developing an upgraded algorithm with adaptation to work with the database. The practical value of the obtained results is that the implemented algorithm is adapted to the Ukrainian language which allows to generate a dialogue on various topics. Software has also been developed that allows the use of database data when generating a dialog. This software can be used by chatbot developers in various fields. Relationship with working with scientific programs, plans, topics. Work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine «Kyiv Polytechnic Institute. Igor Sikorsky». Approbation. The scientific provisions of the dissertation were tested at the All-Ukrainian scientific-practical conference of young scientists and students "Software Engineering and Advanced Information Technologies" (SoftTech2021) - Kyiv. Publications. The scientific provisions of the dissertation published in: Korolova LV Algorithm for learning a dialog system using skeletal trees / L.V. Korolova, О.А. Khalus // Proceedings of the All-Ukrainian scientific- practical conference of young scientists and students "Software Engineering and Advanced Information Technologies" (SoftTech2021) - Kyiv: NTUU "KPI. Igor Sikorsky ", 2021

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Актуальність теми. Розвиток штучного інтелекту у світі стимулює майже всі області нашого життя. Останні досягнення в області штучного інтелекту, а саме природньої обробки мови, показують актуальність вивчення даної теми. Кожен день хтось робить пошуковий запит в інтернеті, пише відгук, коментар тощо. Це генерує великий об’єм текстової інформації яку потрібно обробляти та зберігати. Але на те що обробити великі обєми текстових даних, штучним інтелектом потрібно дуже багато дороговартісних ресурсів, а саме графічних процесорів. Тому використання процесу «дистиляції знань» дозволяє скоротити витрати на дороговартісні ресурси, і перекласти обчислення нейронних мереж з графічного процесора на центральний. Що в свою чергу набагато дешевше. Об’єктом дослідження є процес визначення тонального забарвлення текстів природною мовою. Предметом дослідження є процес оптимізації навчання двох штучних нейронних, для виконання задачі тонального забарвлення тексту українською та російською мовами. Мета роботи – збільшити швидкодію обробки текстів при визначенні тонального забарвлення тексту та зменшити витрати на хмарні ресурси при роботі з нейронними мережами в області обробки природньої мови. Завдяки адаптації процесу «дистиляції знань» з області комп’ютерного зору, в область обробки природньої мови. Методи дослідження. Основним методом дослідження є використання найкращих архітектурних нейронних мереж, та застосування їх до задачі тонального забарвлення тексту. Особливу увагу приділялося збору та аналізу даних для навчання штучних нейронних мереж. Використання процесу «дистиляції знань» дозволяє нам перенести знання які вивчила глибока нейронна мережа на не глибоку, втрачаючи декілька пунктів точності ми отримуємо підвищення швидкодії та зменшення ресурсів у декілька разів. Наукова новизна полягає в тому, що створено підхід використання методу «дистиляції знань» для задачі тонального забарвлення тексту області обробки природньої мови української та російської мови, відрізняється від інших у використанні одної громіздкої нейронної мережі замість ансамблю та перенесенню знань від неї до малої нейронної мережі, що дозволяє підвищити швидкодію ~5 разів, та зменшити використання обчислювальних ресурсів. Практична цінність полягає в зменшенні ресурсів на застосування нейронної мережі для тонального забарвлення тексту та зменшення витрат на хмарні обчислення при розгортанні в хмарній інфраструктури. Апробація роботи. Основні положення і результати роботи були представлені та обговорювались на конференціях: - XIV науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг» ПМК-2021 (Київ, 17-19 листопада 2021 р.). - Міжнародний симпозіум з інжинірингу та виробництва (International Symposium on Engineering and Manufacturing(ISEM2021)) - онлайн-конференція. Тема роботи «Adaptation of Distilling Knowledge Method in Natural Language Processing for Sentiment Analysis». Прийняті роботи ISEM2021 будуть опубліковані у «Lecture Notes in Networks and Systems» - Springer(Pending), який індексується в SCOPUS, INSPEC, WTI Frankfurt eG, zbMATH, SCImago. (Київ, 25-26 грудня 2021) Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьох розділів, висновків та додатків. У вступі було описано проблему та загальний опис, та рішення У першому розділі описано аналіз існуючих проблем та завдань в області обробки природньої мови та рішень для оптимізації обчислювальних ресурсів при використанні нейронних мереж. У другому розділі описано аналіз процесу «дистиляції знань», використаних архітектур нейронних мереж, їх переваги, недоліки порівняння. У третьому розділі описано створення вибірки даних, процесу навчання та аналіз синтетичних даних. У четвертому розділі описано результати тестування, порівняльний аналіз двох нейронних мереж та тестування швидкодії. У висновках підведено підсумки та думки як можна імплентувати даний процес до інших задач в області обробки природньої мови. Робота представлена на 83 аркушах, містить 31 рисунок, 4 таблиці та посилання на список використаних літературних джерел. Actuality of theme. The development of artificial intelligence in the world stimulates almost all areas of our lives. Recent advances in artificial intelligence, namely natural language processing, show the relevance of studying this topic. Every day someone makes a search query on the Internet, writes a review, comment, etc. This generates a large amount of textual information that needs to be processed and stored. But in order to process large amounts of text data, artificial intelligence requires a lot of expensive resources, namely graphics processors. Therefore, the use of the process of "distillation of knowledge" can reduce the cost of expensive resources, and transfer the calculation of neural networks from the GPU to the central. Which in turn is much cheaper. The object of research is the process of determining the tonal color of texts in natural language. The subject of the research is the process of optimizing the learning of two artificial neurons to perform the task of tonal coloring of the text in Ukrainian and Russian. The purpose of the work is to increase the speed of word processing in determining the tonal color of the text and reduce the cost of cloud resources when working with neural networks in the field of natural language processing. By adapting the process of "distillation of knowledge" from the field of computer vision to the field of natural language processing. Research methods. The main research method is to use the best architectural neural networks and apply them to the problem of tonal coloring of the text. Particular attention was paid to data collection and analysis for the training of artificial neural networks. Using the process of "distillation of knowledge" allows us to transfer the knowledge learned by the deep neural network to the shallow, losing a few points of accuracy, we get increased performance and reduced resources several times. The scientific novelty is that the approach of using the method of "distillation of knowledge" for the problem of tonal coloring of the text of the natural language processing of Ukrainian and Russian, differs from others in using one cumbersome neural network instead of ensemble and transferring knowledge from it to a small neural network. which allows to increase the speed of ~ 5 times, and reduce the use of computing resources. The practical value is to reduce the resources for the use of neural networks for tonal text coloring and reduce the cost of cloud computing when deployed in the cloud infrastructure. Approbation of work. The main provisions and results of the work were presented and discussed at conferences: - XIV Scientific Conference of Undergraduates and Postgraduates "Applied Mathematics and Computing" PMK-2021 (Kyiv, November 17-19, 2021). - International Symposium on Engineering and Manufacturing (ISEM2021) - online conference. Theme of the work "Adaptation of Distilling Knowledge Method in Natural Language Processing for Sentiment Analysis". Accepted works ISEM2021 will be published in "Lecture Notes in Networks and Systems" - Springer (Pending), which is indexed in SCOPUS, INSPEC, WTI Frankfurt eG, zbMATH, SCImago. (Kyiv, December 25-26, 2021) Structure and scope of work. The master's dissertation consists of an introduction, four chapters, conclusions and appendices. The introduction described the problem and the general description and solution The first section describes the analysis of existing problems and challenges in the field of natural language processing and solutions for optimizing computing resources using neural networks. The second section describes the analysis of the process of "distillation of knowledge", the used neural network architectures, their advantages and disadvantages of comparison. The third section describes the creation of a data sample, learning process and analysis of synthetic data. The fourth section describes the test results, comparative analysis of two neural networks and speed testing. The conclusions summarize and suggest how this process can be implemented in other tasks in the field of natural language processing. The work is presented on 83 sheets, contains 31 figures, 4 tables and references to the list of used literature sources.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Магістерська дисертація містить 132 с., 23 табл., 16 рис., 1 дод. та 15 джерел. Обʼєкт дослідження – підходи до обробки природної мови, а саме вектроне представлення тексту за допомогою трансформерних нейронних мереж, та їх використання у рекомендаційних системах з метою підвищення точності рекомендацій. Предмет дослідження – векторне представлення тексту за допомогою трансформерних нейронних мереж та вплив його використання на точність гібридної контентно-колаборативної рекомендаційної моделі. Мета роботи – розробка сервісу рекомендаційної системи, що використовує методи обробки природної мови з метою підвищення точності рекомендацій. У ході виконання роботи було проведено аналіз існуючих підходів до обробки природної мови та порівняння рекомендаційного алгоритму, що використовує векторне представлення тексту з класичними підходами: описано процес проектування сервісу та аналіз створеного програмного продукту. В рамках подальшої роботи доцільно досліджувати інші підходи до обробки природної мови та їх вплив на точність рекомендацій; проводити оптимізацію алгоритмів векторного представлення тексту з метою зниження їх обчислювальної вартості; проводити експерименти з гібридизації рекомендаційних систем. Dissertation includes: 132 p., 23 tables, 16 fig., 1 add. and 15 references. The research objects are the approaches to natural language processing, especially text embedding generation using transformer neural networks and its usage in recommender systems in order to improve recommender efficiency. The research subjects are text embedding generation using transformer neural networks and its impact on recommender system efficiency. The research purpose is the development and analysis of a recommender system that benefits from natural language processing algorithms. During the research there were existing approaches to natural language processing analyzed and recommender algorithms that benefit from the usage of text embeddings and classic recommender algorithms compared; the process of building and analysis of a program product described. As for further research, it is recommended to continue to experiment with alternative natural language processing approaches, to optimize and tune existing text embedding generation algorithms and to experiment with recommender system hybridization.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Дисертація містить 101 сторінку, 43 рисунків, 46 таблиць, 8 додатків, 17 джерел. Об`єкт дослідження: системи аналізу бізнес-даних. Мета магістерської дисертації: спрощення взаємодії користувача із програмними засобами бізнес-аналітики за допомогою інструментів оброблення природних мов. На базі огляду сучасних рішень на ринку BI платформ та аналізу засобів, які вже імплементовано для спрощення сценаріїв використання, розроблено систему аналізу бізнес-даних з використанням технології оброблення природних мов. Така система призначена для впровадження у діяльність компаній середнього та великого бізнесу, які мають необхідність у BI, але відчувають нестачу спеціалістів по даним. The dissertation contains 101 pages, 43 figures, 46 tables, 8 applications, 17 sources. The object of study: business data analysis system. The aim of the Master's dissertation: to simplify user interaction with business intelligence software with natural language processing tools. Based on a review of current solutions in the market of BI platforms and analysis of tools that have already been implemented to simplify usage scenarios, a system of business data analysis using natural language processing technology has been developed. Such a system is designed to be integrated into the activities of medium and large businesses that need BI, but do not have a sufficient number of specialists in data.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
Advanced search in Research products
Research products
Searching FieldsTerms
Any field
The following results are related to Digital Humanities and Cultural Heritage. Are you interested to view more results? Visit OpenAIRE - Explore.
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Розмір пояснювальної записки – 94 аркуші, містить 17 ілюстрацій, 25 таблиць, 5 додатків, 29 посилань на джерела. Актуальність теми. У роботі розглянуто проблему в області обробки потоків текстових даних, показано основні особливості наявних платформ обробки потоків текстових даних, їх переваги та недоліки. Виявлено потребу в удосконаленні методу обробки природної мови для потоків текстових даних. Мета дослідження. Основною метою є покращення наявних інструментів обробки природної мови для забезпечення підтримки україномовних текстів та розробка програмного забезпечення, здатного проводити аналіз потоків текстових даних в реальному часі. Об’єкт дослідження: потоки текстових даних. Предмет дослідження: методи та засоби створення програмного забезпечення для обробки природної мови для потоків текстових даних в режимі реального часу. Для реалізації поставленої мети сформульовані наступні завдання: − порівняльний аналіз наявних рішень для обробки потоків текстових даних в реальному часі; − формулювання структурних та технічних особливостей джерел потоків текстових даних; − підбір та підготовка україномовного словника; − впровадження наявних рішень для забезпечення підтримки морфологічного аналізу; − розробка програмного забезпечення обробки потоків текстових даних із використанням морфологічного аналізатора в режимі реального часу; − оцінка ефективності запропонованого рішення. Наукова новизна результатів магістерської дисертації полягає в удосконаленні методу обробки природної мови текстових даних за рахунок впровадження підтримки потокової обробки у режимі реального часу, що підвищує швидкодію обробки та дозволяє виконувати розподілені обчислення, а також покращенні рівня підтримки обробки україномовних текстів за рахунок інтеграції словника ВЕСУМ. Практичне значення отриманих результатів полягає в тому, що запропоновано архітектуру програмного забезпечення обробки потоків текстових даних в реальному часі із використанням Apache Spark та бібліотеки потокової обробки Spark Streaming з зберіганням результатів в пошуковий сервер Elasticsearch із використанням рушія візуалізації Kibana, а також розроблено програмне забезпечення з використанням запропонованої архітектури для аналізу потоків україномовних текстових даних. Розроблене програмне забезпечення може бути використане в подальшому для обробки потоків текстових даних з україномовних джерел, а також для виконання ширшого спектру задач NLP (наприклад, сентимент-аналіз або інтелектуальних аналіз текстових даних). Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Методи та технології високопродуктивних обчислень та обробки надвеликих масивів даних». Державний реєстраційний номер 0117U000924. Апробація. Наукові положення дисертації пройшли апробацію на III Всеукраїнській науково-практичній конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ. Публікації. Наукові положення дисертації опубліковані в: 1) Федорович І.А. Моделі обробки потоків текстових даних в рушії Apache Spark Structured Streaming / І.А. Федорович, Ю.О. Олійник // Матеріали III Всеукраїнської науково-практичної конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ: НТУУ «КПІ ім. Ігоря Сікорського», 23-25 листопада 2022 р. Розмір пояснювальної записки – 94 аркуші, містить 17 ілюстрацій, 25 таблиць, 5 додатків, 29 посилань на джерела. Актуальність теми. У роботі розглянуто проблему в області обробки потоків текстових даних, показано основні особливості наявних платформ обробки потоків текстових даних, їх переваги та недоліки. Виявлено потребу в удосконаленні методу обробки природної мови для потоків текстових даних. Мета дослідження. Основною метою є покращення наявних інструментів обробки природної мови для забезпечення підтримки україномовних текстів та розробка програмного забезпечення, здатного проводити аналіз потоків текстових даних в реальному часі. Об’єкт дослідження: потоки текстових даних. Предмет дослідження: методи та засоби створення програмного забезпечення для обробки природної мови для потоків текстових даних в режимі реального часу. Для реалізації поставленої мети сформульовані наступні завдання: − порівняльний аналіз наявних рішень для обробки потоків текстових даних в реальному часі; − формулювання структурних та технічних особливостей джерел потоків текстових даних; − підбір та підготовка україномовного словника; − впровадження наявних рішень для забезпечення підтримки морфологічного аналізу; − розробка програмного забезпечення обробки потоків текстових даних із використанням морфологічного аналізатора в режимі реального часу; − оцінка ефективності запропонованого рішення. Наукова новизна результатів магістерської дисертації полягає в удосконаленні методу обробки природної мови текстових даних за рахунок впровадження підтримки потокової обробки у режимі реального часу, що підвищує швидкодію обробки та дозволяє виконувати розподілені обчислення, а також покращенні рівня підтримки обробки україномовних текстів за рахунок інтеграції словника ВЕСУМ. Практичне значення отриманих результатів полягає в тому, що запропоновано архітектуру програмного забезпечення обробки потоків текстових даних в реальному часі із використанням Apache Spark та бібліотеки потокової обробки Spark Streaming з зберіганням результатів в пошуковий сервер Elasticsearch із використанням рушія візуалізації Kibana, а також розроблено програмне забезпечення з використанням запропонованої архітектури для аналізу потоків україномовних текстових даних. Розроблене програмне забезпечення може бути використане в подальшому для обробки потоків текстових даних з україномовних джерел, а також для виконання ширшого спектру задач NLP (наприклад, сентимент-аналіз або інтелектуальних аналіз текстових даних). Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Методи та технології високопродуктивних обчислень та обробки надвеликих масивів даних». Державний реєстраційний номер 0117U000924. Апробація. Наукові положення дисертації пройшли апробацію на III Всеукраїнській науково-практичній конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ. Публікації. Наукові положення дисертації опубліковані в: 1) Федорович І.А. Моделі обробки потоків текстових даних в рушії Apache Spark Structured Streaming / І.А. Федорович, Ю.О. Олійник // Матеріали III Всеукраїнської науково-практичної конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2022 осінь) – м. Київ: НТУУ «КПІ ім. Ігоря Сікорського», 23-25 листопада 2022 р. Explanatory note size – 94 pages, contains 17 illustrations, 25 tables, 5 applications, 29 references. Topicality. Examines the problem in the field of text data stream processing, shows the main features of existing text data stream processing platforms, their advantages and disadvantages. The need to improve the natural language processing method for text data streams has been identified. The aim of the study. The main goal is to improve existing natural language processing tools to provide support for the Ukrainian language and to develop software capable of analyzing text data streams in real time. The object of research: methods of text data stream processing. The subject of research: methods and means of creating software for natural language processing for text data streams in real time. To achieve this goal, the following tasks were formulated: − comparative analysis of available solutions for processing text data streams in real time; − formulation of structural and technical features of sources of text data flows; − selection and preparation of a Ukrainian dictionary; − implementation of existing solutions to support morphological analysis; − development of software for processing text data streams using a morphological analyzer in real time; − assessment of the effectiveness of the proposed solution. The scientific novelty of the results of the master's dissertation is is that the improvement of the natural language processing method of text data due to the introduction of real-time stream processing support, which increases the speed of processing and allows to perform distributed calculations, as well as the improvement of the level of support for the Ukrainian language due to the integration of the WESUM dictionary. The practical value of the obtained results is that the software architecture for real-time processing of text data streams using Apache Spark and the Spark Streaming library with storage of results in the Elasticsearch search server using the Kibana visualization engine is proposed, and software is developed using of the proposed architecture for the analysis of streams of Ukrainian-language textual data. The developed software can be used in the future to process streams of text data from Ukrainian-language sources, as well as to perform a wider range of NLP tasks (for example, sentiment analysis or intellectual analysis of text data). Relationship with working with scientific programs, plans, topics. The work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute” in the framework of the topic “Methods and technologies of high-performance computing and big data processing”. State registration number 0117U000924. Approbation. The scientific provisions of the dissertation were tested at the Third All-Ukrainian Scientific and Practical Conference of Young Scientists and Students "Software Engineering and Advanced Information Technologies" (SoftTech- 2022 autumn) - Kyiv. Publications. The scientific provisions of the dissertation were published in: 1) Fedorovych I.A. Processing models of text data streams in the Apache Spark Structured Streaming engine / I.A. Fedorovych, Yu.O. Oliinyk // Materials of the III All-Ukrainian scientific and practical conference of young scientists and students "Software engineering and advanced information technologies" (SoftTech-2022 autumn) - Kyiv: NTUU "KPI them. Igor Sikorsky", November 23-25, 2022. Explanatory note size – 94 pages, contains 17 illustrations, 25 tables, 5 applications, 29 references. Topicality. Examines the problem in the field of text data stream processing, shows the main features of existing text data stream processing platforms, their advantages and disadvantages. The need to improve the natural language processing method for text data streams has been identified. The aim of the study. The main goal is to improve existing natural language processing tools to provide support for the Ukrainian language and to develop software capable of analyzing text data streams in real time. The object of research: methods of text data stream processing. The subject of research: methods and means of creating software for natural language processing for text data streams in real time. To achieve this goal, the following tasks were formulated: − comparative analysis of available solutions for processing text data streams in real time; − formulation of structural and technical features of sources of text data flows; − selection and preparation of a Ukrainian dictionary; − implementation of existing solutions to support morphological analysis; − development of software for processing text data streams using a morphological analyzer in real time; − assessment of the effectiveness of the proposed solution. The scientific novelty of the results of the master's dissertation is is that the improvement of the natural language processing method of text data due to the introduction of real-time stream processing support, which increases the speed of processing and allows to perform distributed calculations, as well as the improvement of the level of support for the Ukrainian language due to the integration of the WESUM dictionary. The practical value of the obtained results is that the software architecture for real-time processing of text data streams using Apache Spark and the Spark Streaming library with storage of results in the Elasticsearch search server using the Kibana visualization engine is proposed, and software is developed using of the proposed architecture for the analysis of streams of Ukrainian-language textual data. The developed software can be used in the future to process streams of text data from Ukrainian-language sources, as well as to perform a wider range of NLP tasks (for example, sentiment analysis or intellectual analysis of text data). Relationship with working with scientific programs, plans, topics. The work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute” in the framework of the topic “Methods and technologies of high-performance computing and big data processing”. State registration number 0117U000924. Approbation. The scientific provisions of the dissertation were tested at the Third All-Ukrainian Scientific and Practical Conference of Young Scientists and Students "Software Engineering and Advanced Information Technologies" (SoftTech- 2022 autumn) - Kyiv. Publications. The scientific provisions of the dissertation were published in: 1) Fedorovych I.A. Processing models of text data streams in the Apache Spark Structured Streaming engine / I.A. Fedorovych, Yu.O. Oliinyk // Materials of the III All-Ukrainian scientific and practical conference of young scientists and students "Software engineering and advanced information technologies" (SoftTech-2022 autumn) - Kyiv: NTUU "KPI them. Igor Sikorsky", November 23-25, 2022.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Загальний обсяг роботи с. 103, рис. 19 , таблиць 24, додатки 1, джерел 30. Актуальність теми дослідження полягає у тому, що хмарні медичні системи широко інтегруються в повсякденне життя людей у всьому світі, що потребує якісного і обґрунтованого підходу до їх архітектурної побудови, сталого розвитку і довгочасної підтримки, що потребують гнучкості такої системи. Також взаємна інтеграція і кількість різних сервісів потребують стандартизації та взаємозамінності - інтероперабельності в широкому сенсі цього терміну. Таким чином можна побудувати гнучку та надійну медичну систему, що поєднує у собі багато уніфікованих медичних сервісів, що в свою чергу зменшить витрати на розробку нових сервісів, мінімізує час для розгортання, впровадження та пошуку в спільній медичній систем. Мета та задачі дослідження. Метою даної роботи є створення та імплементація базової архітектури інтелектуального репозитарію медичних сервісів. Поставлена мета вимагає вирішення наступних дослідницько-наукових задач: Аналіз стандартів обміну медичними даними, що необхідні для забезпечення інтероперабельності сервісів. Аналіз механізмів service discovery. Визначення критеріїв для семантичного пошуку медичних сервісів. Дослідження та розробка методу семантичного пошуку медичних сервісів. Реалізація тестового репозитарію медичних сервісів та дослідження ефективності їх семантичного вибору. Об’єкт досліджень - медичні сервіс-орієнтовані архітектури. Предмет досліджень - виявлення, реєстрація та семантичний пошук інтероперабельних медичних сервісів. Методи досліджень. Для вирішення проблеми в даній роботі використовуються методи системного аналізу, синтезу, проектування логічних структур даних порівняння, логічного узагальнення результатів. Наукова новизна. Наукова новизна дипломної роботи полягає у тому, що представлена архітектура для хмарних медичних сервісів та розроблений інтелектуальний репозитарій інтероперабельних медичних сервісів є одним з перших, що використовує методи семантичного пошуку на основі онтологій або схем OpenAPI у сфері охорони здоров’я. Публікація: 1. Представлення інтероперабельних сервісів для роботи з медичними даними в мікросервісній архітектурі / Кандель К.В., Кулик В.О., Мельник О.Р., Письменний І.О. // Системні науки та інформатика: збірник доповідей І науково-практичної конференції «Системні науки та інформатика», 22–29 листопада 2022 року, Київ. – К., НН ІПСА КПІ ім. Ігоря Сікорського, 2022. – с. 323-330. The total amount of work is pages 103, figures 19, tables 24, appendices 1, sources 30. The relevance of the topic of the master's thesis lies in the fact that cloud medical systems are widely integrated into the everyday life of people all over the world, which requires a high-quality and reasonable approach to their architectural construction, sustainable development and long-term support, which require the flexibility of such a system. Also, mutual integration and the number of different services require standardization and interchangeability - interoperability in the broadest sense of the term. In this way, it is possible to build a flexible and reliable medical system that combines many unified medical services, which in turn will reduce costs for the development of new services, and minimize the time for deployment, implementation and search in a common medical system. The aim and objectives of the research. The purpose of this work is to create and implement the basic architecture of an intelligent repository of medical services. The set goal requires solving the following research and scientific problems: Analysis of medical data exchange standards necessary to ensure interoperability of services. Analysis of service discovery mechanisms. Definition of criteria for the semantic search of medical services. Research and development of the method of semantic search of medical services. Implementation of a test repository of medical services and research on the effectiveness of their semantic selection. Object of research: medical service-oriented architecture. The subject of research is the detection, registration and semantic search of interoperable medical services. Research methods. To solve the problem in this paper, the methods of system analysis, synthesis, design of logical structures of comparison data, and logical generalization of results are used. Scientific novelty. The scientific novelty of the thesis lies in the fact that the presented architecture for cloud medical services and an intelligent repository of interoperable services is one of the first to use semantic search methods based on OpenAPI ontologies or schemas. Publication: 1. Presentation of interoperable services for working with medical data in microservice architecture / K.V. Kandel, V.O. Kulyk, O.R. Melnyk, I.O. Pysmennyi.// System sciences and informatics: collection of reports of the 1st scientific and practical conference "System sciences and informatics", November 22–29, 2022, Kyiv. – K., ES IASA KPI named after Igor Sikorsky, 2022. - p. 323-330.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Розмір пояснювальної записки — 77 аркушів, містить 18 ілюстрацій, 10 таблиць, 7 додатків, 4 розділи та 32 джерела. Актуальність теми. Пропаганда — комунікаційна стратегія, що відома ефективністю та, зазвичай, намаганням ввести в оману для поширення певної точки зору, переконання, нав’язування поглядів. Певні категорії населення (наприклад, молодь) статистично є особливо вразливими. Характерною рисою пропаганди є використанням усталених прийомів та засобів, що вже досліджувались протягом ХХ та ХХІ сторіч. Тож актуальним є завдання створення програмного засобу, системи для автоматичного виявлення пропаганди в текстах, для інформування вразивих категорій населення. Метою дослідження є розробка системи, що аналізує наданий текст на предмет наявності в ньому пропаганди та виводить інформацію про результати аналізу. Об’єкт дослідження — обробка природної мови у контексті методів розпізнавання пропаганди в текстах. Предмет дослідження — методи та засоби розпізнавання пропаганди в текстах. Новизна роботи: – Вперше сформовано набір даних для класифікації, що включає сучасні зразки державної пропаганди Російської Федерації в медіа за період повномасштабного вторгнення до України 2022 року. Проведено дослідження на цьому наборі даних. – Надано подальшого розвитку способу виявлення пропаганди в текстах англійською мовою за рахунок її адаптації для роботи з українською мовою. Практичне значення одержаних результатів. Практичні результати магістерської дисертації мають цінність в сфері аналізу текстів природною мовою. Результати включають реалізацію прототипу запропонованої системи, що аналізує наданий текст, використовуючи навчену модель виявлення пропаганди та надає відповідь з результатами аналізу. Система, надана як сервіс, може бути використана для побудови процесу фільтрації контенту в інших системах. Explanatory note size – 77 pages, contains 18 illustrations, 10 tables, 7 applications, 4 sections, 32 sources. Topicality. Propaganda is a communication strategy known for its effectiveness and, as a rule, for its attempts to mislead the audience to spread some agenda, persuade, and impose certain viewpoints. Some population categories (e.g. youth) are statistically particularly vulnerable to it. A key feature of propaganda is the use of certain established techniques and tools researched during the XX and XXI centuries. Therefore, the task to design a software tool, a system for automatic detection of propaganda in texts, to inform vulnerable categories of the population is topical. The purpose of the study is to develop a system that analyzes the text provided for the presence of propaganda in it and displays information about the results of the analysis. The object of research is the natural language processing in the context of methods of propaganda detection in texts. The subject of research is methods and means of recognizing propaganda in texts. The novelty of work: – For the first time, a new dataset for the classification has been formed. It includes modern examples of Russian Federation state propaganda in the media for the period of the full-scale invasion of Ukraine in 2022. The research has been conducted on this dataset. – The method for propaganda detection in texts was further developed for processing the Ukrainian language. The practical value of the obtained results. The practical results of the master's dissertation are valuable in the field of natural language processing. The results include the implementation of a prototype of the proposed system that analyzes the provided text using a trained model of propaganda detection and provides a response with the results of the analysis. The system, provided as a service, could be used to build a content filtering process in other systems.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Дана магістерська дисертація присвячена розробленню та реалізації алгоритмічно-програмного параметризованого методу реферування текстових даних. В дисертації проаналізовано переваги та недоліки існуючих методів автоматизованого реферування текстових даних, підтверджено гіпотезу щодо впливу параметрів вхідного тексту на результуючий реферат, запропоновано шляхи до подолання впливу згаданих параметрів, сформульовано вимоги до розроблюваного методу, обґрунтовано підібрано найбільш доцільну для використання модель нейронної мережі BERT. Новизна запропонованого методу полягає у визначенні параметрів вхідного тексту та використанні відповідної моделі нейронної мережі для генерації реферату тексту. Практична цінність отриманих в роботі результатів полягає в тому, що запропонований метод дозволив підвищити якість отримуваного реферату за обраними критеріями. У даній магістерській дисертації розроблено програмну реалізацію параметризованого реферування текстових даних на основі запропонованого алгоритмічно-програмного методу. Given master's dissertation is devoted to the development and implementation of algorithmic-software parameterized method of summarization text data. The dissertation analyzes the advantages and disadvantages of existing methods of automated text abstracting, confirms the hypothesis of the influence of input text parameters on the resulting abstract, suggests ways to overcome the influence of these parameters, formulates requirements for the developed method, substantiated the selection of the most expedient neural network model BERT. The novelty of the proposed method is to determine the parameters of the input text and use the appropriate neural network model to form an abstract of the text. The practical value of the results obtained in the work is that the proposed method has improved the quality of the abstract according to selected criteria. This master's dissertation developed the software implementation of parameterized summarization of text data on the basis of the proposed algorithmic-program method.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Магістерська дисертація: 78 с., 19 рис., 32 табл., 37 джерел. Об’єкт дослідження – Методи та моделі ШІ. Предмет дослідження – Системи розпізнавання фейкових новин на основі методів штучного інтелекту. Мета роботи – дослідити та зробити власну модель розпізнавання фейкової інформації, зробити аналіз з найсучаснішими суміжними роботами, що показали найкращий результат. У минулому для виявлення фейкових новин здебільшого використовували класифікаційні та регресійні моделі, в яких вхідними даними були або зміст статті, або шляхи поширення чуток. Однак у цій роботі представлено модель глибокої нейронної мережі на основі двонаправленої довготривалої короткочасної пам'яті (LSTM). Дана робота має неабияку актуальність в сьогодення, а саме у військовий час, коли кожен може отримувати величезну кількість інформації з соціальних мереж, але не кожен вміє її правильно аналізувати чи сприйняти, що може створювати негативні настрої в суспільстві. Проте використовуючи відповідну розробку, наприклад як телеграм бот чи додаток в браузері користувач може побачити певну інформацію як потенційно недостовірну, хоча вона і матиме гучні заголовки. Master’s thesis explanatory note: 78 p., 19 fig., 32 tables, 37 sources. Object of research - Methods and models of AI. Subject of research - The systems of recognition of fake news are on the basis of methods of artificial intelligence. The purpose of the work is to investigate and make our own model for recognizing fake information, to make an analysis with the most modern related works that have shown the best result. In the past, fake news detection mostly used classification and regression models, in which the input data was either the content of the article or the path of the rumor. However, this paper presents a deep neural network model based on bidirectional long short-term memory (LSTM). This work is of great relevance today, namely in wartime, when everyone can receive a huge amount of information from social networks, but not everyone knows how to analyze or perceive it correctly, which can create negative sentiments in society. However, using the appropriate development, such as a Telegram bot or a browser application, the user can see certain information as potentially unreliable, although it will have loud headlines.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Магістерська дисертація: 81 с., 10 табл., 10 рис., 16 джерел, 1 додаток. Об’єктом дослідження є задача автоматичного визначення зв’язку між текстами. Предмет дослідження – алгоритми та моделі задачі автоматичного визначення зв’язку між текстами. Мета дослідження полягає у аналізі алгоритмів та методів для задачі автоматичного визначення зв'язку між текстами, зокрема методи, що базуються на використанні глибоких нейронних мереж. Запропонована та розроблена модель вирішення автоматичного визначення логічного зв'язку між текстами на основі моделей типу Трансформер. Дані моделі здатні швидко оброблювати послідовності пар передпосилка-гіпотеза для співставлення цієї пари до одного з класів – логічного наслідку, протиріччя чи нейтрального класу. Проведено порівняння запропонованої моделі з існуючими методами вирішення задачі логічного зв’язку між текстами – моделями типу Трансформер, рекурентних нейроних мереж на основі LSTM з використанням механізму уваги. Master’s thesis 81 p., 10 tab., 10 fig., 16 references, 1 appendix. The object of research is the task of recognition of textual entailment(natural language inference). The subject of the research is algorithms and models of the problem of recognition of textual entailment(natural language inference). The aim of the study is to analyze algorithms and methods for the task of automatically determining the relationship between texts, in particular methods based on the use of deep neural networks. The model of task of recognition of textual entailment(natural language inference) on the basis of models like Transformer is offered and developed. These models are able to quickly process the sequences of premise-hypothesis pairs to compare this pair to one of the classes - logical entailment, contradiction or neutral class. The proposed model is compared with the existing methods of solving the problem of natural language inference – models such as Transformer, recurrent neural networks based on LSTM using the attention mechanism.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Розмір пояснювальної записки – 98 аркушів, містить 15 ілюстрацій, 53 таблиці, 4 додатків. Актуальність теми. У роботі розглянуто проблему відсутності розвинених систем генерації діалогів українською мовою, показано основні особливості існуючих рішень для генерації діалогів, їх переваги та недоліки. Виявлено потребу в розробці програмного забезпечення пристосованого до української мови. Мета дослідження. Основною метою є розширення функціоналу простих моделей генерації діалогів для того щоб покривати більший перелік запитів користувачів та зробити діалог більш природним Об’єкт дослідження: засоби розробки для обробки природної мови, пристосовані до української мови. Предмет дослідження: програмне та математичне забезпечення для генерації діалогових систем, що пристосовані до української мови. Для реалізації поставленої мети сформульовані наступні завдання: - виконати аналітичний огляд існуючих наукових робіт, які направлені на реалізацію програмного та математичного забезпечення генерації діалогових систем; - розробка алгоритму підготовки даних для їх аналізу моделлю; - пристосування алгоритму кластеризації до аналізу природної мови; - розробка алгоритму перетворення проаналізованих даних у речення; - програмна реалізація розроблених алгоритмів. Наукова новизна результатів магістерської дисертації полягає в тому, що запропоновано алгоритм для генерації діалогів українською мовою, що використовує остові дерева як основу та кластеризацію як функцію оцінки результатів. Результат досягнутий шляхом розробки модернізованого алгоритму з адаптацією під роботу з базою даних. Практичне значення отриманих результатів полягає в тому, що реалізовано алгоритм пристосований до української мови який дозволяє генерувати діалог на різні теми. Також було розроблено програмне забезпечення яке дозволяє використовувати данні з бази даних при генерації діалогу. Дане програмне забезпечення може буті використане розробниками чат-ботів у різних сферах. Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України "Київський політехнічний інститут імені Ігоря Сікорського". Апробація. Наукові положення дисертації пройшли апробацію на всеукраїнській науково-практичній конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech2021) – м. Київ. Публікації. Наукові положення дисертації опубліковані в: Корольова Л.В. Алгоритм навчання діалогової системи з використанням остових дерев / Л.В. Корольова, О.А. Халус // Матеріали всеукраїнської науково-практичної конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech2021) – м. Київ: НТУУ «КПІ ім. Ігоря Сікорського», 2021 р. Explanatory note size – 98 pages, contains 15 illustrations, 53 tables, 4 applications. Topicality. Examines the problem of the lack of developed dialogue generation systems in the Ukrainian language, shows the main features of existing solutions for dialogue generation, their advantages and disadvantages. The need for the development of software adapted to the Ukrainian language has been identified. The aim of the study. The main target is to extend the functionality of simple models for generating dialogs in order to cover a larger list of user requests and make the dialogue more natural. Object of research: development tools for natural language processing, adapted to the Ukrainian language. Subject of research: software and mathematical software for generating dialog systems adapted to the Ukrainian language. To achieve this goal, the following tasks were formulated: - perform an analytical review of existing research papers aimed at implementing software and mathematical software for generating dialog systems; - development of algorithm of data preparation for their analysis by model; - adaptation of the clustering algorithm to the analysis of natural language; - development of an algorithm for converting the analyzed data into sentences; - software implementation of the developed algorithms. The scientific novelty of the results of the master's dissertation is that an algorithm for generating dialogues in the Ukrainian language is proposed, which uses skeleton trees as a basis and clustering as a function of evaluating the results. The result was achieved by developing an upgraded algorithm with adaptation to work with the database. The practical value of the obtained results is that the implemented algorithm is adapted to the Ukrainian language which allows to generate a dialogue on various topics. Software has also been developed that allows the use of database data when generating a dialog. This software can be used by chatbot developers in various fields. Relationship with working with scientific programs, plans, topics. Work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine «Kyiv Polytechnic Institute. Igor Sikorsky». Approbation. The scientific provisions of the dissertation were tested at the All-Ukrainian scientific-practical conference of young scientists and students "Software Engineering and Advanced Information Technologies" (SoftTech2021) - Kyiv. Publications. The scientific provisions of the dissertation published in: Korolova LV Algorithm for learning a dialog system using skeletal trees / L.V. Korolova, О.А. Khalus // Proceedings of the All-Ukrainian scientific- practical conference of young scientists and students "Software Engineering and Advanced Information Technologies" (SoftTech2021) - Kyiv: NTUU "KPI. Igor Sikorsky ", 2021

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Актуальність теми. Розвиток штучного інтелекту у світі стимулює майже всі області нашого життя. Останні досягнення в області штучного інтелекту, а саме природньої обробки мови, показують актуальність вивчення даної теми. Кожен день хтось робить пошуковий запит в інтернеті, пише відгук, коментар тощо. Це генерує великий об’єм текстової інформації яку потрібно обробляти та зберігати. Але на те що обробити великі обєми текстових даних, штучним інтелектом потрібно дуже багато дороговартісних ресурсів, а саме графічних процесорів. Тому використання процесу «дистиляції знань» дозволяє скоротити витрати на дороговартісні ресурси, і перекласти обчислення нейронних мереж з графічного процесора на центральний. Що в свою чергу набагато дешевше. Об’єктом дослідження є процес визначення тонального забарвлення текстів природною мовою. Предметом дослідження є процес оптимізації навчання двох штучних нейронних, для виконання задачі тонального забарвлення тексту українською та російською мовами. Мета роботи – збільшити швидкодію обробки текстів при визначенні тонального забарвлення тексту та зменшити витрати на хмарні ресурси при роботі з нейронними мережами в області обробки природньої мови. Завдяки адаптації процесу «дистиляції знань» з області комп’ютерного зору, в область обробки природньої мови. Методи дослідження. Основним методом дослідження є використання найкращих архітектурних нейронних мереж, та застосування їх до задачі тонального забарвлення тексту. Особливу увагу приділялося збору та аналізу даних для навчання штучних нейронних мереж. Використання процесу «дистиляції знань» дозволяє нам перенести знання які вивчила глибока нейронна мережа на не глибоку, втрачаючи декілька пунктів точності ми отримуємо підвищення швидкодії та зменшення ресурсів у декілька разів. Наукова новизна полягає в тому, що створено підхід використання методу «дистиляції знань» для задачі тонального забарвлення тексту області обробки природньої мови української та російської мови, відрізняється від інших у використанні одної громіздкої нейронної мережі замість ансамблю та перенесенню знань від неї до малої нейронної мережі, що дозволяє підвищити швидкодію ~5 разів, та зменшити використання обчислювальних ресурсів. Практична цінність полягає в зменшенні ресурсів на застосування нейронної мережі для тонального забарвлення тексту та зменшення витрат на хмарні обчислення при розгортанні в хмарній інфраструктури. Апробація роботи. Основні положення і результати роботи були представлені та обговорювались на конференціях: - XIV науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг» ПМК-2021 (Київ, 17-19 листопада 2021 р.). - Міжнародний симпозіум з інжинірингу та виробництва (International Symposium on Engineering and Manufacturing(ISEM2021)) - онлайн-конференція. Тема роботи «Adaptation of Distilling Knowledge Method in Natural Language Processing for Sentiment Analysis». Прийняті роботи ISEM2021 будуть опубліковані у «Lecture Notes in Networks and Systems» - Springer(Pending), який індексується в SCOPUS, INSPEC, WTI Frankfurt eG, zbMATH, SCImago. (Київ, 25-26 грудня 2021) Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьох розділів, висновків та додатків. У вступі було описано проблему та загальний опис, та рішення У першому розділі описано аналіз існуючих проблем та завдань в області обробки природньої мови та рішень для оптимізації обчислювальних ресурсів при використанні нейронних мереж. У другому розділі описано аналіз процесу «дистиляції знань», використаних архітектур нейронних мереж, їх переваги, недоліки порівняння. У третьому розділі описано створення вибірки даних, процесу навчання та аналіз синтетичних даних. У четвертому розділі описано результати тестування, порівняльний аналіз двох нейронних мереж та тестування швидкодії. У висновках підведено підсумки та думки як можна імплентувати даний процес до інших задач в області обробки природньої мови. Робота представлена на 83 аркушах, містить 31 рисунок, 4 таблиці та посилання на список використаних літературних джерел. Actuality of theme. The development of artificial intelligence in the world stimulates almost all areas of our lives. Recent advances in artificial intelligence, namely natural language processing, show the relevance of studying this topic. Every day someone makes a search query on the Internet, writes a review, comment, etc. This generates a large amount of textual information that needs to be processed and stored. But in order to process large amounts of text data, artificial intelligence requires a lot of expensive resources, namely graphics processors. Therefore, the use of the process of "distillation of knowledge" can reduce the cost of expensive resources, and transfer the calculation of neural networks from the GPU to the central. Which in turn is much cheaper. The object of research is the process of determining the tonal color of texts in natural language. The subject of the research is the process of optimizing the learning of two artificial neurons to perform the task of tonal coloring of the text in Ukrainian and Russian. The purpose of the work is to increase the speed of word processing in determining the tonal color of the text and reduce the cost of cloud resources when working with neural networks in the field of natural language processing. By adapting the process of "distillation of knowledge" from the field of computer vision to the field of natural language processing. Research methods. The main research method is to use the best architectural neural networks and apply them to the problem of tonal coloring of the text. Particular attention was paid to data collection and analysis for the training of artificial neural networks. Using the process of "distillation of knowledge" allows us to transfer the knowledge learned by the deep neural network to the shallow, losing a few points of accuracy, we get increased performance and reduced resources several times. The scientific novelty is that the approach of using the method of "distillation of knowledge" for the problem of tonal coloring of the text of the natural language processing of Ukrainian and Russian, differs from others in using one cumbersome neural network instead of ensemble and transferring knowledge from it to a small neural network. which allows to increase the speed of ~ 5 times, and reduce the use of computing resources. The practical value is to reduce the resources for the use of neural networks for tonal text coloring and reduce the cost of cloud computing when deployed in the cloud infrastructure. Approbation of work. The main provisions and results of the work were presented and discussed at conferences: - XIV Scientific Conference of Undergraduates and Postgraduates "Applied Mathematics and Computing" PMK-2021 (Kyiv, November 17-19, 2021). - International Symposium on Engineering and Manufacturing (ISEM2021) - online conference. Theme of the work "Adaptation of Distilling Knowledge Method in Natural Language Processing for Sentiment Analysis". Accepted works ISEM2021 will be published in "Lecture Notes in Networks and Systems" - Springer (Pending), which is indexed in SCOPUS, INSPEC, WTI Frankfurt eG, zbMATH, SCImago. (Kyiv, December 25-26, 2021) Structure and scope of work. The master's dissertation consists of an introduction, four chapters, conclusions and appendices. The introduction described the problem and the general description and solution The first section describes the analysis of existing problems and challenges in the field of natural language processing and solutions for optimizing computing resources using neural networks. The second section describes the analysis of the process of "distillation of knowledge", the used neural network architectures, their advantages and disadvantages of comparison. The third section describes the creation of a data sample, learning process and analysis of synthetic data. The fourth section describes the test results, comparative analysis of two neural networks and speed testing. The conclusions summarize and suggest how this process can be implemented in other tasks in the field of natural language processing. The work is presented on 83 sheets, contains 31 figures, 4 tables and references to the list of used literature sources.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Магістерська дисертація містить 132 с., 23 табл., 16 рис., 1 дод. та 15 джерел. Обʼєкт дослідження – підходи до обробки природної мови, а саме вектроне представлення тексту за допомогою трансформерних нейронних мереж, та їх використання у рекомендаційних системах з метою підвищення точності рекомендацій. Предмет дослідження – векторне представлення тексту за допомогою трансформерних нейронних мереж та вплив його використання на точність гібридної контентно-колаборативної рекомендаційної моделі. Мета роботи – розробка сервісу рекомендаційної системи, що використовує методи обробки природної мови з метою підвищення точності рекомендацій. У ході виконання роботи було проведено аналіз існуючих підходів до обробки природної мови та порівняння рекомендаційного алгоритму, що використовує векторне представлення тексту з класичними підходами: описано процес проектування сервісу та аналіз створеного програмного продукту. В рамках подальшої роботи доцільно досліджувати інші підходи до обробки природної мови та їх вплив на точність рекомендацій; проводити оптимізацію алгоритмів векторного представлення тексту з метою зниження їх обчислювальної вартості; проводити експерименти з гібридизації рекомендаційних систем. Dissertation includes: 132 p., 23 tables, 16 fig., 1 add. and 15 references. The research objects are the approaches to natural language processing, especially text embedding generation using transformer neural networks and its usage in recommender systems in order to improve recommender efficiency. The research subjects are text embedding generation using transformer neural networks and its impact on recommender system efficiency. The research purpose is the development and analysis of a recommender system that benefits from natural language processing algorithms. During the research there were existing approaches to natural language processing analyzed and recommender algorithms that benefit from the usage of text embeddings and classic recommender algorithms compared; the process of building and analysis of a program product described. As for further research, it is recommended to continue to experiment with alternative natural language processing approaches, to optimize and tune existing text embedding generation algorithms and to experiment with recommender system hybridization.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
  • image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos

    Дисертація містить 101 сторінку, 43 рисунків, 46 таблиць, 8 додатків, 17 джерел. Об`єкт дослідження: системи аналізу бізнес-даних. Мета магістерської дисертації: спрощення взаємодії користувача із програмними засобами бізнес-аналітики за допомогою інструментів оброблення природних мов. На базі огляду сучасних рішень на ринку BI платформ та аналізу засобів, які вже імплементовано для спрощення сценаріїв використання, розроблено систему аналізу бізнес-даних з використанням технології оброблення природних мов. Така система призначена для впровадження у діяльність компаній середнього та великого бізнесу, які мають необхідність у BI, але відчувають нестачу спеціалістів по даним. The dissertation contains 101 pages, 43 figures, 46 tables, 8 applications, 17 sources. The object of study: business data analysis system. The aim of the Master's dissertation: to simplify user interaction with business intelligence software with natural language processing tools. Based on a review of current solutions in the market of BI platforms and analysis of tools that have already been implemented to simplify usage scenarios, a system of business data analysis using natural language processing technology has been developed. Such a system is designed to be integrated into the activities of medium and large businesses that need BI, but do not have a sufficient number of specialists in data.

    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
    image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos
    BIP!Powered by BIP!
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Electronic Archive o...arrow_drop_down
      image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos