Jobu,<div><br></div><div>I believe this encoding is being done by the NekoHTML parser - though someone on the AntiSamy mailing list can correct me if I&#39;m wrong. There may be a way to override this behavior but off the top of my head I&#39;m not sure.</div>

<div><br></div><div>AntiSamy is meant to be an HTML validation/sanitizing engine and &amp;eacute; is the properly encoded HTML version of that particular character. Changing this encoding behavior can probably be done - but I believe there have been known XSS attacks in the past that have depended on the fact that some international letters are interpreted differently depending on locale and region. As a result, I believe it&#39;s safer to rely on the HTML entity encoded version if possible.</div>

<div><br></div><div>Obviously if you&#39;re not placing the data directly into an HTML context, that conversion might have side effects...</div><div><br></div><div>-Jason</div><div><br><div class="gmail_quote">On Thu, Aug 11, 2011 at 7:12 AM, Jobus <span dir="ltr">&lt;<a href="mailto:jobuss@gmail.com">jobuss@gmail.com</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Hi Jason,<div><br></div><div>I am facing an issue related to Antisamy. In my application user can give input in French characters. But Antisamy is encoding it and not giving the input string back<br>

<br>eg:</div><div>My input string is </div>

<div><br></div><div>Pour accéder au journal de test</div><div><br></div><div>and output given from getCleanHTMl is </div><div><br></div><div>Pour acc&amp;eacute;der au journal de test</div><div><br></div><div>how can i solve this issue? i need to get exactly the same input string i provided. mine is a multilingual application.</div>



<div><br></div><div>I really appreciate if you can help me on this issue.</div><div><br></div><div>tanks</div><div>Jobu</div><div><br></div>
</blockquote></div><br></div>