<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Verdana",sans-serif;
        color:#1F497D;
        font-weight:normal;
        font-style:normal;
        text-decoration:none none;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">If you use | then you can treat the attribute as a feature set. This might be useful. You can see a description of what feature sets
 allow you to do in the encoding tutorial. <o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">If you don’t care about it being a feature set, then you can use any character. People often&nbsp; do use : as a joiner, but there is no
 reason not to use ; or , instead if that makes more sense for your purposes. I’d suggest not using . because it is a regular expression metacharacter.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">best<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">Andrew.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:11.0pt;font-family:&quot;Calibri&quot;,sans-serif">From:</span></b><span lang="EN-US" style="font-size:11.0pt;font-family:&quot;Calibri&quot;,sans-serif"> cwb-bounces@sslmit.unibo.it [mailto:cwb-bounces@sslmit.unibo.it]
<b>On Behalf Of </b>mansur<br>
<b>Sent:</b> 05 March 2018 12:46<br>
<b>To:</b> Open source development of the Corpus WorkBench &lt;cwb@sslmit.unibo.it&gt;<br>
<b>Subject:</b> Re: [CWB] Escape &quot;&lt;&quot; and &quot;&gt;&quot; symbols<o:p></o:p></span></p>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<div>
<div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt">Hello, Stefan, Andrew and others!!!<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt">You advised to use tagging style like:<br>
<br>
n:sg:px3sp:nom<br>
or<br>
n|sg|px3sp|nom<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">Is there any particular reason why &quot;:&quot; or &quot;|&quot; instead of &quot;&lt;&quot; or &quot;&gt;&quot;. Is it possible to use &quot;,&quot; (comma)? What do you usually use in your projects?<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
<div>
<p class="MsoNormal">Thank you!<o:p></o:p></p>
</div>
<p class="MsoNormal">With best wishes,<o:p></o:p></p>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt">Mansur<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<div>
<p class="MsoNormal">On 22 February 2018 at 11:52, Stefan Evert &lt;<a href="mailto:stefanML@collocations.de" target="_blank">stefanML@collocations.de</a>&gt; wrote:<o:p></o:p></p>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-top:5.0pt;margin-right:0cm;margin-bottom:5.0pt">
<p class="MsoNormal" style="margin-left:4.8pt">Dear Mansur,<br>
<br>
most of the remaining issues are related to CQPweb, so Andrew will be in a much better position to answer them and help you with the debugging.&nbsp; Some of them are clearly (mis-)configuration issues, e.g. the failure to locate the CEQL backend that is part of
 CQPweb or the failure to run CQP.<br>
<br>
Are you working with an up-to-date version of CQPweb checked out from the SVN repository?<br>
<br>
<br>
&gt; 3) After rebooting computer any search does not work at all:<br>
&gt; ERROR: CQP backend startup failed; the reported CQP version [] could not be parsed.<br>
&gt; But from the comman line I can perform search with 'cqp -e' and it seems to be working, at least I can see search results.<br>
<br>
This suggests that you have CQP installed, but in a &quot;private&quot; path that's only visible to your user account and not to the Web server running CQPweb.&nbsp; You may also need to configure CQPweb and set appropriate paths there.<br>
<br>
&gt; 4) Is it possible to choose ranges of periods in search according to the 'date'?<br>
&gt; &lt;text id=&quot;&quot; date=?????&gt;<br>
<br>
I think Andrew is working on support for date attributes in CQPweb.<br>
<br>
In plain CQP, there are two ways of doing date searches:<br>
<br>
a) The reasonable way: Store your dates in a simple standard format – I prefer ISO YYYY-MM-DD, so alphabetical and chronological sort order are the same – and then construct regular expressions for your suitable date ranges, e.g. in the global constraint of
 a CQP query:<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; … :: match.text_date = &quot;2011-03.*&quot;;&nbsp; # anything in March 2011<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; … :: match.text_date = &quot;1990-(01-(1[2-9]|[23]\d)|02-.*|03-([0-1]\d|2[0-4]))&quot;;&nbsp; # 12 Jan 1990 .. 24 Mar 1990<br>
<br>
b) The &quot;I'm a Unix hacker way&quot;: convert your dates to 32-bit integers and use numeric comparisons.&nbsp; The obvious choice would be consecutive numbers for days (or even seconds as in Unix timestamps), but conversion from/to human-readable dates will be complicated.&nbsp;
 However, you could encode the ISO-format above _without_ the hyphens to get 8-digit numbers, e.g.<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; &lt;text id=&quot;…&quot; date=&quot;20180222&quot;&gt;<br>
<br>
and then cast to integers for numerical comparisons:<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; … :: int(match.text_date) &gt;= 19900112 &amp; int(match.text_date) &lt;= 19900324;<br>
<br>
Nice trick, isn't it?<br>
<br>
&gt; 5) When I press 'Show tags' button I get<br>
&gt; 2012_ нче_ елда_ республикада_ 55_ мең_ 839_ бала_ дөньяга_ килгән_ ._<br>
&gt; but no tags.<br>
<br>
That's because CQPweb failed to do proper HTML-escaping for the annotation strings (which is not only incovenient but also a security risk).<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; @Andrew: has this bug been fixed in the lastest CQPweb code?<br>
<br>
I've been bitten by similar issues before and would recommend avoiding HTML metacharacters (and other funny things) in annotation strings.&nbsp; Better recode to something like<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; n:sg:px3sp:nom<br>
<br>
or even<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; |n|sg|px3sp|nom|<br>
<br>
so you can use the &quot;contains&quot; operator in searches.<br>
<br>
&gt; I think it is maybe because I didn't replace &quot;&lt;&quot; and &quot;&gt;&quot; in my morphological tags to their XML entities yet. Please, correct me if I'm wrong.<br>
<br>
That won't help!&nbsp; With -x, cwb-encode will decode the XML entities in your input file and you'll end up with &lt; and &gt; in the indexed corpus.&nbsp; You could encode without the -x flag, but then your annotation strings will be<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; &amp;lt;n&amp;gt;&amp;lt;sg&amp;gt;&amp;lt;px3sp&amp;gt;&amp;lt;nom&amp;gt;<br>
<br>
which happens to display nicely only until HTML escaping in CQPweb is fixed – and you will have to search for<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; [pos = &quot;.*&amp;lt;nom&amp;gt;.*&quot;]<br>
<br>
instead of<br>
<br>
&nbsp; &nbsp; &nbsp; &nbsp; [pos = &quot;.*&lt;nom&gt;.*&quot;]<br>
<br>
&gt; 7) I also saw the button 'Export corpus -&gt; Export whole corpus'. Does that mean that users can download the whole corpus? Is it possible to turn it off somehow?<br>
<br>
AFAIK, only users with the &quot;full access privilege&quot; are allowed to download a corpus.&nbsp; So if you want to disable downloads, simply keep to &quot;normal access&quot;.<br>
<br>
<br>
Best,<br>
Stefan<br>
<br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" target="_blank">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><o:p></o:p></p>
</blockquote>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
</div>
</body>
</html>