Удаление HTML тэгов
12.01.2016

Иногда возникает задача получения из HTML страницы чистого текста.

Для получения плоского текста HTML разметку можно удалить посредством регулярных выражений:

 

REGEXP_REPLACE(html, '<[^>]*>')

сохранит переносы строк, пробелы, табуляцию и т.п.

 

TRIM(REGEXP_REPLACE(preview, '(<[^>]*>)|[[:cntrl:]]'))

удалит все непечаемые сымволы, включая переносы строк, а так же начальные и конечные пробелы.

release 1.0