<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
I cannot answer this easily. Does anyone else on the dev team have
experience with i18n and RegEx's inside of ESAPI?<br>
<br>
- Jim<br>
<br>
<blockquote
 cite="mid:4348cbf91001261218j121933b5h2bec4204df93834@mail.gmail.com"
 type="cite">
  <div>Hi guys, a question has arisen re: input validation</div>
  <div> </div>
  <div>I should prefix this by stating we are on 1.4, not 2.0.</div>
  <div> </div>
  <div>Let's say I want to pass "グ" in my input.  For those of you who
can't read that, it's a Japanese Katakana with Unicode value 30B0</div>
  <div> <a moz-do-not-send="true"
 href="http://www.fileformat.info/info/unicode/char/30b0/index.htm">http://www.fileformat.info/info/unicode/char/30b0/index.htm</a></div>
  <div> </div>
  <div>I want to allow this in my input, so I need to create a regex
that will permit it.  What I'm not sure about is:</div>
  <div>1) what canonicalize is going to do to that string, and </div>
  <div>2) if there's a locale-aware way of identifying characters in a
regex.</div>
  <div> </div>
  <div>I can see this potentially showing up as </div>
  <div>\u30b0, where I would need to permit \ characters, </div>
  <div>\u30b0, where the slash is encoded, though I doubt this.</div>
  <div>グ</div>
  <div> </div>
  <div>the latter can lead to two possibilities</div>
  <div>1) my regex would need to allow a range of Unicode values</div>
  <div>2) a character class (\p{Alpha} and such) would seamlessly match
'letters' of any langauge.</div>
  <div> </div>
  <div>The confusion on my end is due to lack of knowledge on
characters outside the typical US character set.  Can anyone shed some
light on this issue, as to the expected canonicalization and
recommended whitelist regex?</div>
  <div> </div>
  <pre wrap="">
<fieldset class="mimeAttachmentHeader"></fieldset>
_______________________________________________
Esapi-user mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Esapi-user@lists.owasp.org">Esapi-user@lists.owasp.org</a>
<a class="moz-txt-link-freetext" href="https://lists.owasp.org/mailman/listinfo/esapi-user">https://lists.owasp.org/mailman/listinfo/esapi-user</a>
  </pre>
</blockquote>
<br>
<br>
<pre class="moz-signature" cols="72">-- 
Jim Manico
OWASP Podcast Host/Producer
OWASP ESAPI Project Manager
<a class="moz-txt-link-freetext" href="http://www.manico.net">http://www.manico.net</a></pre>
</body>
</html>