Нейронна система пошуку українських термінів (НеСПУТ)

За зразком наявних безплатних онлайнових інструментів видобутку термінів (https://termcoord.eu/discover__trashed/free-term-extractors/term-extraction-tools/https://termnet.eu/terminology-toolshttps://hypcol.marutank.net/http://docman.dbcls.jp/im/https://meshb.nlm.nih.gov/search) буде створено відповідну програму для української мови. Цей інструмент буде натреновано, звалідовано і випробувано на авторських текстах і на інших відкритих текстових даних відповідної тематики. Програма буде визначати в науково-технічних і загальномовних текстах лексичні одиниці (слова і словосполучення), які є можливими термінами, і видавати три списки: (1) список нових кандидатів на терміни, які трапилися вперше; (2) список перевірених раніше термінів, які наявні у відповідній базі; (3) список неправильних термінів, які раніше вже були відзначені як хибні. Ці списки будуть подані українською мовою з варіантами перекладу термінів на російську та англійську мови. У результаті виконання проекту можна проводити в напівавтоматичному режимі термінологічну та загальномовну експертизу, галузеву класифікацію та семантичний аналіз українських текстів.

 

Стан проєкту: Завершено.