Hi everyone.<div>I am trying to access a corpus in cyrillic (cp1251) in Windows with cqp.exe. I got the cqp.exe window to accept cyrillic characters, but now I encountered another problem.</div><div><br></div><div> In the registry I change to charset to &quot;cyrillic&quot; and I get this error:</div>
<div><br></div><div><div>MKCORPUS&gt; &quot;кога&quot;;</div><div>CL: Regex Compile Error: unrecognized character after (? or (?-</div><div>CQP Error:</div><div>        Illegal regular expression: ????</div><div><br></div>
<div><br></div><div>When I change the charset to &quot;cp1251&quot;, I get this error</div><div><br></div><div><div>MKCORPUS&gt; &quot;кога&quot;;</div><div>CL: Error, unrecognised CorpusCharset in cl_string_validate_encoding.</div>
<div>CQP Error:</div><div>        Query includes a character or character sequence that is invalid</div><div>in the encoding specified for this corpus</div></div><div><br></div><div><br></div><div>Someone else reported a similar problem with the charset here <a href="http://liste.sslmit.unibo.it/pipermail/cwb/2007-July/000077.html">http://liste.sslmit.unibo.it/pipermail/cwb/2007-July/000077.html</a> and the advice given was </div>
<div><br></div><div>All you have to do is keep the &quot;##::&quot; and change the charset value to  </div><div>&quot;latin2&quot; (CQP won&#39;t understand iso-8859-2), like so:</div><div><br></div><div>What should I set the charset value to so that cqp can understand cyrillic texts?</div>
<div><br></div><div>Thanks much.</div>-- <br>Dr. George Mitrevski<br>Professor Emeritus<br>Auburn University<div><b>Website</b>: <a href="http://www.auburn.edu/~mitrege" target="_blank">http://www.auburn.edu/~mitrege</a><br>
<div><b>Macedonian Higher Education Blog:</b> <a href="http://visokoobrazovanie.blogspot.com/" target="_blank">http://visokoobrazovanie.blogspot.com/</a></div></div><br>
</div>