Ayant récupéré un corpus d’email écrit en html, je souhaiterais modifier tous les termes qui sont en balises html, comment faire ?

 

Cela revient en fait à supprimer les mots qui sont compris entre < et >.

 

Soit notre corpus :

< html >

< body >

Ceci est mon texte < p >

Voici un paragraphe. < /p >

< /body >

< /html >

 

Je veux remplacer tous les balises par seulement  < html >

gsub("<[^>]+>", "< html >", email_text)

 

Article publié le 2 novembre 2015 par Comité de Caritat.

Posez votre question, nos experts vous répondront