2023 IEEE 18th International Conference on Computer Science and Information Technologies (CSIT). Pp. 1-6. - Lviv : IEEE, 2023 ; International Conference on Computer Science and Information Technologies (CSIT). ISBN 979-8-3503-6046-2
Štúdia použila korpus ukrajinských textov z kníh od rôznych autorov na trénovanie modelu Word2Vec na identifikáciu sémantických vzťahov medzi slovami. Cieľom projektu je analyzovať sémantické vzťahy medzi slovami a skonštruovať vektorové reprezentácie slov pomocou metódy Word2vec. Úlohy výskumu zahŕňajú prípravu dát, trénovanie modelu, analýzu získaných vektorov a porovnanie výsledkov s existujúcimi metódami. Hlavnými výzvami projektu sú veľké množstvá vysokokvalitných súborov údajov v ukrajinskom jazyku na trénovanie modelu, vytvorenie efektívneho algoritmu učenia Word2vec a vývoj používateľského rozhrania. Pomocou Pythonu a TensorFlow sa dosiahne efektívna aplikácia metódy Word2vec, ktorá vykazuje vysoký výkon. Beží približne 2,8 sekundy a využíva obmedzené množstvo pamäte v rozsahu od 140 do 200 megabajtov.