laddar ett xhtml sida in i ett xmldocument och det går så fruktansvärt slött så det är något horribelt. Du kan ju testa med System.Xml.XmlTextReader å se om det går något snabbare. Roger, jag har inte haft tid att kolla på det så tråden är varken löst eller stängd. det gick att sätta mydoc.XmlResolver=null så gick det miljarder ggr snabbare att ladda. då kommer nästa problem... gör man så så kan xmldocumentet inte parsa saker som tex " " eller "&" Om jag kör: med flera är inte valid XML. > med flera är inte valid XML. detta kanske kan vara nåt att titta på?!? ska ta en titt på det där, Nu har jag iaf skapat min egen xmlresolver klass , och embeddat xhtml dtd filerna i min assembly så nu går det iaf skapligt fort.xmdocument är slött som ####
tar kanske 3 sekunder på en 1.5gghz burk att ladda en xhtml sida (svårt att säga hur stor den är men en vanlig sida från w3c.com iaf)
och nästan lika slött går det när man ska parsa eländet oxo.
loopar nod för nod rekursivt.
finns det något annat sätt att läsa alla noder och attruibut som är snabbare??
//RogerSv: xmdocument är slött som ####
Sv: xmdocument är slött som ####
Löste ditt problem sig eller behöver du mer hjälp? Om du är klar med detta problemet så markera inlägget som antingen <b>löst</b> (om du hittat en lösning - skriva gärna vad den var så andra kan ta del av både fråga och svar) eller <b>stängd</b> (om du inte hittat en lösning men problemet inte är aktuellt längre).
Om du inte löst problemet och vill ha mer hjälp så skriv ett inlägg som beskriver var du står idag med problemet (vad du har provat etc) så skall vi se om vi inte kan hitta en lösning.
//AndreasSv: xmdocument är slött som ####
//RogerSv: xmdocument är slött som ####
så istället för 12 sec så tar det 0.5 att ladda xml'en
//RogerSv: xmdocument är slött som ####
Sv: xmdocument är slött som ####
string strContent="<?xml version=\"1.0\" encoding=\"utf-8\"?><!DOCTYPE html PUBLIC \"-//W3C//DTD XHTML 1.0 Strict//EN\" \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd\">" +
"<html xmlns=\"http://www.w3.org/1999/xhtml\" xml:lang=\"en-US\" lang=\"en-US\">" +
"<head></head><body><p>home and away'hej&</p></body></html>";
XmlDocument doc=new XmlDocument();
doc.XmlResolver=null;
try
{
doc.LoadXml(strContent);
}
catch(Exception e)
{
Console.WriteLine(e.ToString());
}
så ballar den ut på nbsp men om jag tar bort just nbsp så går den igenom... skumt
i värsta fall kanske du får göra ett litet hack som byter ut nbsp till #160
Sv: xmdocument är slött som ####
Om du tänker stoppa in HTML i en XML-struktur är det en bra idé att använda CDATA-taggar runt HTML-strängen. Ex:
<![CDATA[<html>.....</html>]]>
/Peter
Sv: xmdocument är slött som ####
nä, men det är väl valid xhtml, eller? W3C validator ger inga felmeddelande på det iallafall. Sen om du läser hela tråden så handlar det ju om att parsa xhtml...Sv: xmdocument är slött som ####
http://www.gotdotnet.com/Community/UserSamples/Details.aspx?SampleGuid=B90FDDCE-E60D-43F8-A5C4-C3BD760564BCSv: xmdocument är slött som ####
kan det vara så att om xhtmlkoden innehålelr refs till dtd filer som tex "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"
att dessa downloadas automagiskt och att det är en av anledningarna varför det går slött?
//RogerSv: xmdocument är slött som ####
//Roger