<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
Thanks!&nbsp; Let me know if there's anything I can do to help, I don't have
a ton of free time but I'm definitely interested in this project..<br>
<br>
Mike<br>
<br>
Arshan Dabirsiaghi wrote:
<blockquote
 cite="mid:B9A412898630124ABE8350F4EBD32E8493C84D@mymail.aspectsecurity.com"
 type="cite">
  <title>Re: [Owasp-antisamy] Why does &nbsp; tags get escaped?</title>
  <meta http-equiv="Content-Type" content="text/html; ">
  <meta content="MSHTML 6.00.6001.18183" name="GENERATOR">
  <div id="idOWAReplyText25882" dir="ltr">
  <div dir="ltr"><font color="#000000" face="Arial" size="2">Sorry for
the quiet response - I talked with Jerry who wrote the .NET version and
he is trying to address this and other requests before releasing the
next version. </font></div>
  <div dir="ltr">&nbsp;</div>
  <div dir="ltr"><font face="Arial" size="2">Thanks for helping us stay
focused! We do need nudges every now and again.</font></div>
  <div dir="ltr">&nbsp;</div>
  <div dir="ltr"><font face="Arial" size="2">Arshan</font></div>
  </div>
  <div dir="ltr"><br>
  <hr tabindex="-1">
  <font face="Tahoma" size="2"><b>From:</b>
<a class="moz-txt-link-abbreviated" href="mailto:owasp-antisamy-bounces@lists.owasp.org">owasp-antisamy-bounces@lists.owasp.org</a> on behalf of Mike Christensen<br>
  <b>Sent:</b> Wed 2/18/2009 3:31 PM<br>
  <b>To:</b> <a class="moz-txt-link-abbreviated" href="mailto:owasp-antisamy@lists.owasp.org">owasp-antisamy@lists.owasp.org</a><br>
  <b>Subject:</b> Re: [Owasp-antisamy] Why does &amp;nbsp; tags get
escaped?<br>
  </font><br>
  </div>
  <div>
  <p><font size="2">I'm sending this again as I never got a response to
it..<br>
  <br>
Mike Christensen wrote:<br>
&gt; Hi guys - there appears to be a bug in AntiSamy (actually it might
be<br>
&gt; more accurate to say there's a bug in the HtmlAgilityPack) that's<br>
&gt; kinda driving me nuts.&nbsp; It appears if you enter the HTML:<br>
&gt;<br>
&gt; Hello&amp;nbsp;There<br>
&gt;<br>
&gt; It gets converted to:<br>
&gt;<br>
&gt; Hello&amp;amp;nbsp;There<br>
&gt;<br>
&gt; Which is obviously not what I want.&nbsp; This is happening in<br>
&gt; AntiSamyDOMScanner.cs in the scan function on this line:<br>
&gt;<br>
&gt; string finalCleanHTML = doc.DocumentNode.InnerHtml;<br>
&gt;<br>
&gt; It appears the InnerHtml property actually escapes markup within
the<br>
&gt; document.&nbsp; Are people aware of this issue and is there any
documented<br>
&gt; work-around or planned fix?&nbsp; I think it's perfectly valid for HTML
to<br>
&gt; safely contain these entities and I don't want markup to be escaped<br>
&gt; and displayed back to my users.&nbsp; For now, I've worked around this
with:<br>
&gt;<br>
&gt; res = res.Replace("&amp;amp;nbsp;", "&amp;nbsp;");<br>
&gt;<br>
&gt; But that's a bit lame &lt;g&gt;<br>
&gt;<br>
&gt; Thanks!<br>
&gt; Mike<br>
&gt;<br>
_______________________________________________<br>
Owasp-antisamy mailing list<br>
<a class="moz-txt-link-abbreviated" href="mailto:Owasp-antisamy@lists.owasp.org">Owasp-antisamy@lists.owasp.org</a><br>
  <a moz-do-not-send="true"
 href="https://lists.owasp.org/mailman/listinfo/owasp-antisamy">https://lists.owasp.org/mailman/listinfo/owasp-antisamy</a><br>
  </font></p>
  </div>
</blockquote>
</body>
</html>