Har inte pysslat så mycket med RegExp tidigare och har därför stött på patrull.RegExp för att hitta ASCII
Följande RegExp kommer från regexlib.com och hittar ASCII tecken, t.ex. "e; © '
<code>
&
(?ni:\#
((x
([\dA-F]){1,5}
)
|
(104857[0-5]
|10485[0-6]\d
|1048[0-4]\d\d
|104[0-7]\d{3}
|10[0-3]\d{4}
|0?\d{1,6})
)
|
([A-Za-z\d.]{2,31}) #accept ASCII alphanumeric and period
);
</code>
Jag ska då byta ut den funna ASCII koden till en annan kod (PDF-koder. Har en klass som fixar det).
<code>
public static string convertASCII(string word)
{
text.regularexpressions.regex re = new text.regularexpressions.regex();
re.pattern = "&(?ni:\#((x([\dA-F]){1,5})|(104857[0-5]|10485[0-6]\d|1048[0-4]\d\d|104[0-7]\d{3}|10[0-3]\d{4}|0?\d{1,6}))|([A-Za-z\d.]{2,31}))";
}
</code>
Av det lilla jag förstått hittills så ska jag sedan göra en re.replace till det jag ska ha på något sätt. Det är här jag stampar. Dels får jag i det pattern jag har ovan får jag felmeddelandet "Unrecognized escape sequence"
Om jag har följande sträng:
"Patrik Dahlén och Patrik Dahlén är samma sak"
så är det två typer av ASCII, den ena i Glyphs och den andra med siffror. RegExpet ovan hittar båda typerna men för att konvertera så måste de anropa olika funktioner.
Jag vet inte om jag krånglar till saker och ting i onödan.