Иногда возникает задача получения из HTML страницы чистого текста.
Для получения плоского текста HTML разметку можно удалить посредством регулярных выражений:
REGEXP_REPLACE(html, '<[^>]*>')
сохранит переносы строк, пробелы, табуляцию и т.п.
TRIM(REGEXP_REPLACE(preview, '(<[^>]*>)|[[:cntrl:]]'))
удалит все непечаемые сымволы, включая переносы строк, а так же начальные и конечные пробелы.