Автоматическая очистка HTML кода от «мусора»

Cleaner – сервис очистки тегов от «мусора», который остается в документе после сохранения страницы в формате из программы .

html-cleaner

Давным давно я написал подобный плагин, но он был сделан на скорую руку, сейчас механизм полностью переписан.

Очистка кода происходит методом перебора введенной строки из которой формируется новая, содержащая «чистый» . Плагин удаляет абсолютно все из тегов, в том числе и из тегов . В непарных тегах проставляется символ /(слеш). Удаляются пустые теги, например конструкция <p></p> будет удалена, так как она ничего не содержит.

Как работает html cleaner?

Есть два способа:

  1. В программе MS Word выберите данные, которые хотите очистить от мусора, чтобы выбрать все, нажмите Ctrl + A. Вставьте скопированный текст в поле ниже(должна быть выбрана вкладка «Вставить данные MS Office»), нажмите кнопку «Готово».
  2. Перед тем, как оптимизировать код выберите в Word «Сохранить как…», далее укажите Тип файла «Веб-страница с фильтром», затем откройте сохраненный файл в текстовом редакторе, скопируйте код и вставьте в поле ниже(должна быть выбрана вкладка «Вставить HTML»), нажмите кнопку «Готово».

В результате Вы получите девственно чистый html код.
Не тронутыми остаются следующие атрибуты:

'colspan', 'rowspan', 'href', 'src', 'type', 'value', 'lang', 'tabindex', 'title', 'code', 'alt', 'target', 'dir', 'span', 'action', 'method'

Результат:

Не забывайте оставлять свои комментарии, которые помогут мне исправить ошибки или сделать доработки.

Вам будет интересно...

Добавить комментарий