Jag har en string som innehåller html taggar och lite text.Hur gör man får att får bort allt HTML-tagagar? Antar att du får använda RegEx och matcha i stil med RegEx.Replace <*> etc. Regex xp = new Regex("<*>"); \> uppfattas fel av RegEx eftersom \ är en special character. skrev så här: Kan varmt rekommendera följande program om du jobbar med regextabort HTML-taggar
Tex:
string pelle= "<p><b>Testar lite<b/>"
skall bara bli
Testar liteSv: tabort HTML-taggar
/andrecSv:tabort HTML-taggar
textBox1.Text = xp.Replace(test,"dsfsfafdsafsafadsfsd");
Tar bara bort den sista > men inte den första + den som finns där i mellan.Sv: tabort HTML-taggar
Du får ersätta dessa först med en \ innan.
Ex.
* blir \*
\ blir \ \ (utan mellanslag (går inte skriva det här i forumet))
( blir \(
Exempel: (metod jag gjorde häromdan)
<code>
private string replaceRegExSpecialCharacters(string text)
{
char[] specialChars = new char[] { '\\', '-', '+', '*', '?', '(', ')', '[', ']', '|', '$', '^', '!' }; //'\' must be first
foreach (char cs in specialChars)
text = text.Replace(cs.ToString(), @"\" + cs);
return text;
}
</code>Sv:tabort HTML-taggar
Regex xp = new Regex(@"<(.|\n)*?>");
textBox1.Text = xp.Replace(test,"");
Det funka fint.
Sv: tabort HTML-taggar
http://www.regexbuddy.com/