RULES FOR THE FORMATION OF COMPLEX LINKS FROM UNSTRUCTURED TEXT

Lavlinskiy V.; Zol'nikova Yuliya Olegovna

doi:doi:10.12737/article_5c4f196f7f9592.03992856

RULES FOR THE FORMATION OF COMPLEX LINKS FROM UNSTRUCTURED TEXT

Submit manuscript

To cite

Citations:

RULES FOR THE FORMATION OF COMPLEX LINKS FROM UNSTRUCTURED TEXT

Journal: MODELING OF SYSTEMS AND PROCESSES Volume 11 № 3 , 2019

Rubrics: TEHNICHESKIE NAUKI

UDK 60 Прикладные науки. Общие вопросы

Lavlinskiy V. ¹

Zol'nikova Yuliya Olegovna ²

Author and publication information

Authors:

1. Voronezh State University of Forestry and Technologies named after G.F. Morozov

Russian Federation

2. FSBE Institution of Higher Education Voronezh State University of Forestry and Technologies named after G.F. Morozov

Voronezh, Russian Federation

Type:

Article

DOI:

https://doi.org/10.12737/article_5c4f196f7f9592.03992856

Pages:

from 34 to 39

Status:

Published

Received:

28.01.2019

Accepted:

28.01.2019

Published:

28.01.2019

Subject area:

Language:

Russian

Keywords:

Grammaticheskiy razbor, izvlechenie smyslovoy informacii, ontologii, nestrukturirovannyy tekst, graf zavisimostey.

Abstract and keywords

Abstract (English):
V stat'e rassmatrivayutsya pravila dlya izvlecheniya slozhnyh smyslovyh svyazey iz neobrabotannogo teksta. Dannye pravila pozvolyayut izvlech' poleznuyu informaciyu s vnutrennimi predlozheniyami. Dannyy vid svyazey harakterizuetsya tem, chto on imeet glavnoe podlezhaschee, kotoroe ssylaetsya na vnutrennee predlozhenie cherez glagol. V rabote privoditsya metodologiya postroeniya grafa zavisimostey dlya predlozheniya.

Keywords:
Grammaticheskiy razbor, izvlechenie smyslovoy informacii, ontologii, nestrukturirovannyy tekst, graf zavisimostey.

Text

I. Введение

Большинство сложных смысловых связей в тексте характеризуются явными или неявными зависимостями между частями предложения. Такие связи описываются графом зависимостей. Для формирования правил извлечения будем использовать методологию [1]:

Обращение к описаниям зависимостей из необработанного текста и выбор тех, которые соответствуют структуре данного типа комплексных связей.
Формирование условий, основанных на том, найдена ли метка зависимости (или очередность меток) в множестве ребер в графе зависимостей.
Формирование действий, основанных на решениях о том, какие вершины нужно извлечь в виде составляющих.
Установление предпосылок и следствий для формирования правила извлечения.

Рассмотрим выполнение этих шагов к каждой сложной связи с внутренними предложениями.

References

1. Software - The Stanford Natural Language Processing Group. -Rezhim dostupa: http://nlp.stanford.edu/software/. - Zagl. s ekrana.

2. Sokolov, E. G. Primenenie LSA/LSI metodov dlya izvlecheniya dannyh iz nestrukturirovannogo teksta / E. G. Sokolov, M. M. Sharnin // Trudy Mezhdunarodnoy nauchnoy konferencii po fiziko-tehnicheskoy informatike CPT2018. - Car'grad, 2018. - S. 59-63.

3. Metody avtomaticheskoy klassifikacii tekstov po funkcional'nym stilyam / L.M. Ermakova, M.A. Abashev, R.V. Nikitin, R.I. Ushakov // Vestnik Permskogo universiteta. Seriya: Matematika. Mehanika. Informatika. - 2014. - № 4 (27). - S. 78-83.

4. Bogatyrev, M. Yu. Izvlechenie faktov iz tekstov estestvennogo yazyka s primeneniem konceptual'nyh grafovyh modeley / M.Yu. Bogatyrev // Izvestiya Tul'skogo gosudarstvennogo universiteta. Tehnicheskie nauki. - 2016. - № 7-1. - S. 198-208.

5. Stulov, N. Patent landscapes & new technology trends in iot: extracting and visualizing data patterns / N. Stulov // Otkrytye semanticheskie tehnologii proektirovaniya intellektual'nyh sistem. - 2018. - T. 2, № 8. - S. 293-297.

6. Metod avtomatizirovannogo izvlecheniya adresov iz nestrukturirovannyh tekstov / A. V. Komarova, A. A. Menschikov, A. V. Polev, Yu. A. Gatchin // International Journal of Open Information Technologies. - 2017. - T. 5, № 11. - S. 21-27.

7. Freitag, D. Boosted wrapper induction : In Proceedings of 17th National Conference on Artificial Intelligence / D.Freitag, N.Kushmerick. - 2000. - Pp.577-583

8. Kauchak, D. Sources of success for boosted wrapper induction / D. Kauchak, J.Smarr, C. Elkan // The Journal of Machine Learning Research. - 2004. - T. 5. - Pp. 499-527.

9. Kushmerick, N. Wrapper induction for information extraction / N. Kushmerick, D. S. Weld, R.Doorenbos // Proceedings of the International Joint Conference on Artificial Intelligence (IJCAI’97). - 1997. - Pp.729-737.

10. Muslea, I. STALKER: Learning extraction rules for semistructured, web-based information sources. / I.Muslea, S. Minton, C. Knoblock // AAAI Workshop on AI and Information Integration. - 1998. - Pp.74-81.

Submit manuscript

To cite

Citations:

I. Введение

Confirmation

Регистрация