Print | Slovak Economic Library of the UE in Bratislava

1. Analysis of Semantic Relationships in Ukrainian Text Content Based on Word2Vec and Machine Learning

Title

Analysis of Semantic Relationships in Ukrainian Text Content Based on Word2Vec and Machine Learning

Translation

Analýza sémantických vzťahov v ukrajinskom textovom obsahu na základe Word2Vec a strojového učenia

Author info

Pavlo Kryndach, Victoria Vysotska, Sofia Chyrun, Lyubomyr Chyrun, Svitlana Goloshchuk, Roman Holoshchuk

Author

Co-authors

Goloshchuk Svitlana EUBFAJKIK - Katedra interkultúrnej komunikácie FAJ

Holoshchuk Roman

Source document

2023 IEEE 18th International Conference on Computer Science and Information Technologies (CSIT). Pp. 1-6. - Lviv : IEEE, 2023 ; International Conference on Computer Science and Information Technologies (CSIT). ISBN 979-8-3503-6046-2

DOI

10.1109/CSIT61576.2023.10324074

Note

09I03-03-V01-00118. - Registrovaný: Scopus

Document kind

schedule of articles from year books

Language

English

Country of Edition

Slovak Republic

Keywords

učenie strojové * jazykoveda * jazyky cudzie * siete neurónové

Annotation

Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕňajú prípravu dát, trénovanie modelu, analýzu získaných vektorov a porovnanie výsledkov s existujúcimi metódami. Hlavnými výzvami projektu sú veľké množstvá vysokokvalitných súborov údajov v ukrajinskom jazyku na trénovanie modelu, vytvorenie efektívneho algoritmu učenia Word2vec a vývoj používateľského rozhrania. Pomocou Pythonu a TensorFlow sa dosiahne efektívna aplikácia metódy Word2vec, ktorá vykazuje vysoký výkon. Beží približne 2,8 sekundy a využíva obmedzené množstvo pamäte v rozsahu od 140 do 200 megabajtov.

Public work category

Reports at international scientific conferences

Registered in

SCOPUS

Database

PUBLIKAČNÁ ČINNOSŤ

No. of Archival Copy

E23 00524-001, kópia plného textu

File name	Size	Typ prístupu
Plný text PDF	1.1 MB	z IP adresy SEK po prihlásení