Ученая степень
|
канд. физ.-мат. наук, ОАО "Лафарж цемент"
|
Местоположение
|
г. Химки
|
Статьи автора
|
В настоящей статье излагается метод классификации текстов на основе анализа статистических закономерностей буквенных распределений, т. е. вероятностей встречаемости букв и буквосочетаний. Подробно рассматривается задача кластеризации литературных произведений по определенным жанрам, а также вопрос определения авторства произведения. При этом решение должно быть найдено без вторжения в область литературы, т. е. без анализа синтаксиса, литературных приемов и схем взаимодействий персонажей. Читать дальше...
|