CMS RUEN
ruen.suCMS RUEN
RUEN
ПоддержкаПродвижениеНастройкаОформлениеРазработка

Комплексный анализ текста

2015.10.06
Создание сайта – это сложный и длительный процесс, особенно если при этом выполняется предварительное исследование аудитории и UX-проектирование. Но самые продолжительные процессы – это поддержка и продвижение сайта, так как они выполняются все время существования сайта. При этом сайт пополняется множеством текстов с фотографиями, таблицами и прочим. Для правильного продвижения сайта необходимо, чтобы тексты соответствовали определенным правилам. Конечно, этих правил не так много и за их соблюдением можно следить самостоятельно, но при больших объемах работ это становится затруднительным и многое просто упускается из виду.

Мы доработали нашу систему управления сайтами с тем, чтобы в процессе редактирования страниц сайта она автоматически делала комплексный анализ текстов и показывала статистику и возможные ошибки. Теперь она дает возможность следить сразу за несколькими показателями.

  • Количество символов всего, количество символов без команд и количество без команд и без пробелов, то есть чистый текст.
  • Количество слов всего, уникальных слов и значимых слов.
  • Количество стоп-слов – незначимых слов вроде предлогов, союзов и прочих слов, не несущих смысловой нагрузки и служащих для связки текста.
  • Количество воды – учитываются стоп-слова, HTML-коды и специализированные команды.
  • Статистика по использованию слов в тексте и наличие переспама.

Стоп-слова разбавляют текст и не несут смысловой нагрузки, поэтому они вычеркиваются поисковыми системами при индексации сайта. Если количество стоп-слов значительно, то при неудачном стечении обстоятельств вся страница может быть проигнорирована поисковыми системами. Вода – тоже важный показатель, включающий в себя стоп-слова, HTML-коды и прочие команды, которые также разбавляют текст и делают страницы менее интересными для поисковых систем. Значительные количества стоп-слов и воды означают, что текст может быть малоинтересен или вовсе не интересен поисковым системам.

Каждая ситуация индивидуальна по своей сути. Например, новость, содержащая множество фотографий, будет иметь зашкаливающий параметр наличия воды, но при этом страница с новостью будет интересна и посетителям, и поисковым системам. Анализ текста нужен для того, чтобы оперативно видеть сразу все параметры текста. Ниже приведен скриншот экрана с анализом данной страницы.

Комплексный анализ текстов

Комплексный анализ текста выполняется при каждом открытии текстового редактора или при сохранении страницы. Благодаря этому можно отследить изменение ситуации и вовремя внести нужные корректировки. Важным преимуществом данного анализа является наличие рейтинга используемых слов. Сразу можно видеть, какие слова как часто используются и их вес. Это нужно для избежания явления переспама, когда ключевые слова используются слишком часто, таким образом подводя сайт под монастырь, то есть под санкции. Одновременно можно отследить и исправить недостаточное использование ключевиков.

Переспам очень опасен. Прошли времена, когда поисковые системы не замечали переспам и благополучно учитывали многократно указанные ключевики, поднимая сайт выше добропорядочных конкурентов, брезгающих спамом и переспамом. Теперь переспам может быстро привести к попаданию сайта под фильтры поисковиков. К тому же переспам изрядно раздражает посетителей, пришедших за полезной информацией. Ну, про переспам вы поняли... Для быстрого обнаружения переспама служит таблица в правой части анализа текста, отображающая статистику по самым часто используемым ключевикам. При обнаружении злоупотребления вес ключевых слов выделяется красным и пишется соответствующее предупреждение.

Анализ отображает четыре вкладки, дающие дополнительную информацию:
  • Анализ текста – собственно сам анализ, про который мы написали выше.
  • Чистый текст – текст, очищенный от различных команд и знаков препинания.
  • Все слова – полный список используемых в тексте слов, отсортированный по алфавиту.
  • Значимые слова – список, очищенный от незначимых слов и отсортированный по количеству вхождений.

Таким образом, система управления CMS RUEN – одна из немногих систем, а может быть и единственная, которая дает возможность автоматического комплексного анализа текстов, не заставляя прибегать к внешним сервисам. Мы заботимся о вас и вашем времени!

Рекомендуем ознакомиться:

2015.09.29 Контроль адресов страниц
2015.09.25 Расширяем информацию по оформлению сайта
2015.09.20 Шаблонизатор по вашему желанию

Пост #12. Постоянная ссылка на пост: http://ruen.su/novosti/post/kompleksnyj-analiz-teksta/

Информация на данной странице недостаточно понятна, не полна или содержит ошибки? Просто напишите нам об этом и мы все исправим.Напишите замечание!