RULES FOR THE FORMATION OF COMPLEX LINKS FROM UNSTRUCTURED TEXT
Abstract and keywords
Abstract (English):
V stat'e rassmatrivayutsya pravila dlya izvlecheniya slozhnyh smyslovyh svyazey iz neobrabotannogo teksta. Dannye pravila pozvolyayut izvlech' poleznuyu informaciyu s vnutrennimi predlozheniyami. Dannyy vid svyazey harakterizuetsya tem, chto on imeet glavnoe podlezhaschee, kotoroe ssylaetsya na vnutrennee predlozhenie cherez glagol. V rabote privoditsya metodologiya postroeniya grafa zavisimostey dlya predlozheniya.

Keywords:
Grammaticheskiy razbor, izvlechenie smyslovoy informacii, ontologii, nestrukturirovannyy tekst, graf zavisimostey.
Text

I. Введение

Большинство сложных смысловых связей в тексте характеризуются явными или неявными зависимостями между частями предложения. Такие связи описываются графом зависимостей. Для формирования правил извлечения будем использовать методологию [1]:

  1. Обращение к описаниям зависимостей из необработанного текста и выбор тех, которые соответствуют структуре данного типа комплексных связей.
  2. Формирование условий, основанных на том, найдена ли метка зависимости (или очередность меток) в множестве ребер в графе зависимостей.
  3. Формирование действий, основанных на решениях о том, какие вершины нужно извлечь в виде составляющих.
  4. Установление предпосылок и следствий для формирования правила извлечения.

Рассмотрим выполнение этих шагов к каждой сложной связи с внутренними предложениями.

References

1. Software - The Stanford Natural Language Processing Group. -Rezhim dostupa: http://nlp.stanford.edu/software/. - Zagl. s ekrana.

2. Sokolov, E. G. Primenenie LSA/LSI metodov dlya izvlecheniya dannyh iz nestrukturirovannogo teksta / E. G. Sokolov, M. M. Sharnin // Trudy Mezhdunarodnoy nauchnoy konferencii po fiziko-tehnicheskoy informatike CPT2018. - Car'grad, 2018. - S. 59-63.

3. Metody avtomaticheskoy klassifikacii tekstov po funkcional'nym stilyam / L.M. Ermakova, M.A. Abashev, R.V. Nikitin, R.I. Ushakov // Vestnik Permskogo universiteta. Seriya: Matematika. Mehanika. Informatika. - 2014. - № 4 (27). - S. 78-83.

4. Bogatyrev, M. Yu. Izvlechenie faktov iz tekstov estestvennogo yazyka s primeneniem konceptual'nyh grafovyh modeley / M.Yu. Bogatyrev // Izvestiya Tul'skogo gosudarstvennogo universiteta. Tehnicheskie nauki. - 2016. - № 7-1. - S. 198-208.

5. Stulov, N. Patent landscapes & new technology trends in iot: extracting and visualizing data patterns / N. Stulov // Otkrytye semanticheskie tehnologii proektirovaniya intellektual'nyh sistem. - 2018. - T. 2, № 8. - S. 293-297.

6. Metod avtomatizirovannogo izvlecheniya adresov iz nestrukturirovannyh tekstov / A. V. Komarova, A. A. Menschikov, A. V. Polev, Yu. A. Gatchin // International Journal of Open Information Technologies. - 2017. - T. 5, № 11. - S. 21-27.

7. Freitag, D. Boosted wrapper induction : In Proceedings of 17th National Conference on Artificial Intelligence / D.Freitag, N.Kushmerick. - 2000. - Pp.577-583

8. Kauchak, D. Sources of success for boosted wrapper induction / D. Kauchak, J.Smarr, C. Elkan // The Journal of Machine Learning Research. - 2004. - T. 5. - Pp. 499-527.

9. Kushmerick, N. Wrapper induction for information extraction / N. Kushmerick, D. S. Weld, R.Doorenbos // Proceedings of the International Joint Conference on Artificial Intelligence (IJCAI’97). - 1997. - Pp.729-737.

10. Muslea, I. STALKER: Learning extraction rules for semistructured, web-based information sources. / I.Muslea, S. Minton, C. Knoblock // AAAI Workshop on AI and Information Integration. - 1998. - Pp.74-81.

Login or Create
* Forgot password?