Сервис позволяет определить такие качественные показатели текста как удобочитаемость и естественность.
Данный параметр раскрывается через два индекса: фог-индекс и индекс Флеша.
Фог-индекс (Индекс туманности Ганнинга)
Фог-индекс обычно используется для подтверждения легкости чтения предполагаемой аудиторией. Тексты для широкой аудитории, как правило, требуют индекса туманности менее 12, тексты для детей нуждаются в индексе менее 8. Научные публикации имеют индекс 20 и выше, такие тексты очень трудно понять без специальной подготовки.
В нашем сервисе данный коэффициент рассчитывается с некоторыми особенностями:
Для расчета используются все слова, а не выборка из 100 слов.
Учитываются сложносочинённые предложения, они считаются за два предложения.
Используется поправочный коэффициент 0,78 для русских текстов.
При подсчете сложных слов не учитываются составные слова и имена собственные, а глаголы ставятся в начальную форму. Сложные слова - это слова из трёх или более слогов.
Еще один индекс для определения сложности восприятия текста. Изначальная формула применяется для английского языка, в нашем сервисе используется адаптированная версия для русского языка.
Индексы удобочитаемости имеют ограничения, так как на трудность восприятия сильнее всего оказывают влияние семантика и абстрактность текста.
Следующая группа показателей позволяет сделать оценку текста с точки зрения злоупотреблений ключевыми словами и фразами, которые могут повлиять на признание текстов поисковым спамом.
Общая естественность текста по Ципфу
Данный показатель рассчитывается по закону Ципфа. Частотность слов в тексте распределяется по статистическому закону - то есть обратно пропорционально рангу в тексте (ранг - это порядковый номер слова в списке, который составлен по убыванию частотности слов в тексте).
Общая естественность расшифровывается подробной таблицей, где показывается ранг слов в тексте, их частотность и отклонения от нормы. Даны рекомендации о необходимых изменениях в тексте для увеличения его естественности. Если данный показатель больше 50, то текст вполне естественный. Желательно поднимать данный показатель до 80 или выше.
Данный показатель рассчитывается по всем часто повторяющимся словам, показывает общую загруженность текста повторами слов. При написании текстов, не рекомендуется превышать данный показатель выше 40%.
В отличие от предыдущего показателя, данный рассчитывается по одному, самому часто повторяемому слову. Желательно писать тексты с показателем ниже 7, а лучше ниже 3.
Также в сервисе "Анализ и оценка удобочитаемости и естественности текста" приводятся общие статистические показатели текста, которые используются при расчетах.