Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/33444
Title: Автоматическая идентификация языка документа для последующего Cross-Language анализа
Authors: Бредихин, Ю. А.
Калугина, М. А.
Keywords: публикации ученых;обработка естественных языков (NLP),;информационный поиск (IR);вопросно-ответные системы (QA);автоматическое реферирование (Summarization);автоматическое определение языка;алгоритм N-грамм
Issue Date: 2017
Publisher: АНС «СибАК»
Citation: Бредихин, Ю. А. Автоматическая идентификация языка документа для последующего Cross-Language анализа / Ю. А. Бредихин, М. А. Калугина // Студенческий: электрон. научн. журн. - 2017. - № 19 (19). – Режим доступа : https://sibac.info/journal/student/19/89477 (дата обращения: 07.02.2018).
Abstract: Определение языка является важной стадией работы с текстовыми документами, так как от нее зависит эффективность приложений по обработке естественных языков (NLP): информационный поиск (IR), вопросно-ответные системы (QA), автоматическое реферирование (Summarization). В зависимости от применяемых правил построения поисковых образов и стратегий их сравнения различают несколько основных методов. Статья посвящена описанию программной реализации модифицированной версии алгоритма N-грамм, основанному на статистиках документов с известным заранее языком и кодировкой.
URI: https://libeldoc.bsuir.by/handle/123456789/33444
Appears in Collections:Публикации в зарубежных изданиях

Files in This Item:
File Description SizeFormat 
Bredikhin_Avtomaticheskaya.PDF725.64 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.