DC Field | Value | Language |
dc.contributor.author | Бредихин, Ю. А. | - |
dc.contributor.author | Калугина, М. А. | - |
dc.date.accessioned | 2018-11-12T11:36:17Z | - |
dc.date.available | 2018-11-12T11:36:17Z | - |
dc.date.issued | 2017 | - |
dc.identifier.citation | Бредихин, Ю. А. Автоматическая идентификация языка документа для последующего Cross-Language анализа / Ю. А. Бредихин, М. А. Калугина // Студенческий: электрон. научн. журн. - 2017. - № 19 (19). – Режим доступа : https://sibac.info/journal/student/19/89477 (дата обращения: 07.02.2018). | ru_RU |
dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/33444 | - |
dc.description.abstract | Определение языка является важной стадией работы с текстовыми документами, так как от нее зависит эффективность приложений по обработке естественных языков (NLP): информационный поиск (IR), вопросно-ответные системы (QA), автоматическое реферирование (Summarization). В зависимости от применяемых правил построения поисковых образов и стратегий их сравнения различают несколько основных методов. Статья посвящена описанию программной реализации модифицированной версии алгоритма N-грамм, основанному на статистиках документов с известным заранее языком и кодировкой. | ru_RU |
dc.language.iso | ru | ru_RU |
dc.publisher | АНС «СибАК» | ru_RU |
dc.subject | публикации ученых | ru_RU |
dc.subject | обработка естественных языков (NLP), | ru_RU |
dc.subject | информационный поиск (IR) | ru_RU |
dc.subject | вопросно-ответные системы (QA) | ru_RU |
dc.subject | автоматическое реферирование (Summarization) | ru_RU |
dc.subject | автоматическое определение языка | ru_RU |
dc.subject | алгоритм N-грамм | ru_RU |
dc.title | Автоматическая идентификация языка документа для последующего Cross-Language анализа | ru_RU |
dc.type | Статья | ru_RU |
Appears in Collections: | Публикации в зарубежных изданиях
|