В статье рассматриваются особенности реализации алгоритма распознавания текста методом «скользящего увеличивающегося окна», используемого для кодирования множественных причин смерти. Используемый алгоритм динамически «настраивает» степень совпадения и находит наиболее похожий вариант, а также позволяет распознавать текст с грамматическими ошибками и с переставленными словами в формулировке причины смерти. В статье представлены три варианта реализации алгоритма распознавания текста, увеличивающих быстродействие. Первый вариант основан на исключении одного из цикла путем замены его одновременным вычислением с различными размерами окна (от 1 до 16). Второй вариант основан на предварительной фильтрации, например, сканированием по трем буквам, и использование промежуточной базы для размещения в ней фильтрованной информации. Этот вариант позволяет уменьшить объем сортируемой информации и за счет этого увеличивает быстродействие. Третий вариант также основан на фильтрации и заключается в сортировке информации в запросе, выполнен-ном на базе предыдущего запроса с фильтрацией информации. По каждому варианту реализации указаны достоинства и недостатки. Оценка результата оценивалась по быстродействию и правильности распознавания. При этом база насчитывала 8472 формулировок, предназначенных для кодирования множественных причин смерти. Изложенный анализ путей реализации полезен в разработке программного модуля, используемого в регистре смертности населения. Рекомендуется третий вариант, основанный на фильтрации, для реализации на языке Visual C++.
распознавание, алгоритм, база данных, поиск, оценка.
1. Вайсман Д.Ш., Погорелова Э.И., Хромушин В.А. О создании автоматизированной комплексной системы сбора, обработки и анализа информации о рождаемости и смертности в Тульской области // Вестник новых медицинских технологий. 2001. №4. С. 80-81.
2. Вайсман Д.Ш., Никитин С.В., Погорелова Э.И., Секриеру Е.М., Хромушин В.А. Повышение достоверности кодирования внешних причин смерти // Вестник новых медицинских технологий. 2006. Т.13, №1. С. 147-148.
3. Даильнев В.И., Хромушин В.А., Китанина К.Ю. Анализ смертности населения Тульской области от болезней системы кровообращения // Вестник новых медицинских технологий (электронное издание). 2013. №1. Публикация 2-15. URL: http://medtsu.tula.ru/VNMT/Bulletin/E2013-1/4210.pdf (дата обращения 10.01.2013).
4. Макишева Р.Т., Хадарцев А.А., Хромушин В.А., Даильнев В.И. Возрастной анализ смертности населения Тульской области от сахарного диабета // Вестник новых медицинских технологий (электрон-ное издание). 2014. №1. Публикация 7-9. URL: http://medtsu.tula.ru/VNMT/Bulletin/E2014-1/4900.pdf. (дата обращения 06.08.2014). DOIhttps://doi.org/10.12737/5613.
5. Макишева Р.Т., Хромушин В.А., Прилепа С.А., Ластовецкий А.Г. Гендерные особенности смертности больных сахарным диабетом в Тульской области // Вестник новых медицинских технологий. 2015. Т. 22, №2. С. 60-67. DOIhttps://doi.org/10.12737/11835.
6. Погорелова Э.И., Секриеру Е.М., Стародубов В.И., Мелехина Л.Е., Нотсон Ф.К., Хромушин В.А., Вайсман Д.Ш., Мельников В.А., Дегтерева М.И., Одинцова И.А., Корчагин Е.Е., Виноградов К.А. Заключительный научный доклад «Разработка системы мероприятий для совершенствования использо-вания статистических данных о смертности населения Российской Федерации» (Международный иссле-довательский проект 1АХ202)». Москва: ЦНИИ организации и информатизации МЗ РФ, 2003. 34 с.
7. Китанина К.Ю., Хромушин В.А. Анализ инвалидности населения Тульской области // Вестник новых медицинских технологий (электронное издание). 2012. №1. URL: http://medtsu.tula.ru/VNMT/Bulletin/E2012-1/3717.pdf (дата обращения 19.01.2012).
8. Хадарцев А.А., Хромушин В.А., Андреева Ю.В., Даильнев В.И. Анализ смертности от сахарного диабета 2 типа в Тульской области // Вестник новых медицинских технологий. 2012. Т.XIX, №3. С. 164-167.
9. Хромушин В.А., Китанина К.Ю., Даильнев В.И. Кодирование множественных причин смерти // Учебное пособие. Тула: Изд-во ТулГУ, 2012. 60 с.
10. Хромушин В.А., Хадарцев А.А., Даильнев В.И., Ластовецкий А.Г. Принципы реализации мо-ниторинга смертности на региональном уровне // Вестник новых медицинских технологий (электронное издание). 2014. №1. Публикация 7-6. URL: http://medtsu.tula.ru/VNMT/Bulletin/E2014-1/4897.pdf (дата обращения 06.08.2014). DOIhttps://doi.org/10.12737/5610.
11. Хромушин В.А. Системный анализ и обработка информации медицинских регистров в регио-нах // Автореферат диссертации на соискание ученой степени доктора биологических наук. Тула: Науч-но-исследовательский институт новых медицинских технологий, 2006. 44 с.
12. Хромушин В.А., Черешнев А.В., Честнова Т.В. Информатизация здравоохранения. Учебное пособие. Тула: Изд-во ТулГУ, 2007. 207 с.
13. Хромушин В.А., Вайсман Д.Ш. Мониторинг смертности с международной сопоставимостью данных // В сборнике тезисов докладов научно-практической конференции "Современные инфокомму-никационные технологии в системе охраны здоровья". 2003 Нояб. 13-14., Москва. С. 122.
14. Хромушин В.А. Методология обработки информации медицинских регистров. Монография. Тула: Изд-во ТулГУ, 2004. 120 с.
15. Хромушин В.А. Методология анализа множественных причин смерти // Вестник новых меди-цинских технологий. 2004. №3. С. 107-109.
16. Хромушин В.А., Хадарцев А.А., Даильнев В.И., Китанина К.Ю. Анализ динамики смертности возрастных когорт населения Тульской области // Вестник новых медицинских технологий. 2014. №1. Публикация 7-5. URL: http://medtsu.tula.ru/VNMT/Bulletin/E2014-1/4896.pdf (дата обращения 06.08.2014). DOIhttps://doi.org/10.12737/5609.
17. Хромушин В.А., Погорелова Э.И., Секриеру Е.М. Возможности дополнительного повышения достоверности данных по смертности населения // Вестник новых медицинских технологий. 2005. Т.12, №2. С. 95-96.
18. Хромушин В.А. Анализ алгоритма распознавания текста в базе данных // Вестник новых меди-цинских технологий. 2013. Т. 20, №3. С. 13-16.
19. Щеглов В.Н., Бучель В.Ф., Хромушин В.А. Логические модели структур заболеваний за 1986-1999 годы участников ликвидации аварии на ЧАЭС и/или мужчин, проживающих в пораженной зоне и имеющих злокачественные новообразования органов дыхания // Радиация и риск. 2002. №13. С. 57-59.