<div dir="ltr"><div>Thanks a lot, Stefan! I will upgrade CQP until the end of the year, and will let you know if I get any problems.</div><div>Diana<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Stefan Evert &lt;<a href="mailto:stefanML@collocations.de">stefanML@collocations.de</a>&gt; escreveu no dia terça, 8/12/2020 à(s) 15:48:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">In addition to what Andrew explained, you should also (when you can afford the time :) …<br>
<br>
&gt; Thanks a lot. However (maybe this is because I am using a version of cqp which is too old? 3.0.0)<br>
<br>
1) Get a current version of CWB (3.4.27 at the moment).  There are a lot of improvements and bug fixes that haven&#39;t been ported back to the old 3.0 branch.<br>
<br>
You&#39;ll need to check CWB out from the SVN repository and compile from source, but that&#39;s not too difficult (internal note: I guess we should provide some instructions on the Web site).  Unless you have Ubuntu 20.04 because the install script is broken there.<br>
<br>
&gt; The corpus is encoded with eg.<br>
&gt; &lt;mwe lema=one=example=of lema pos=N&gt;<br>
<br>
2) Encode your XML tags as proper XML, i.e. with attribute values quoted:<br>
<br>
&lt;mwe lema=&quot;some noun&quot; pos=&quot;N&quot;&gt;<br>
…<br>
&lt;/mwe&gt;<br>
<br>
&gt; and created with the flag -V mwe.<br>
<br>
3) Encode with -S mwe:0+lema+pos<br>
<br>
This will split out the annotations on &lt;mwe&gt; tags into separate attributes mwe_lema and mwe_pos; the &quot;:0&quot; checks that your open and close tags are properly balanced and will ignore any nested &lt;mwe&gt; regions (with warnings).<br>
<br>
&gt; However, when I query<br>
&gt; [ ] :: match.mwe=&quot;/.*/&quot;;<br>
<br>
Then you can directly match lemma and pos<br>
<br>
        … :: match.mwe_lema=&quot;.+ness&quot; &amp; match.mwe_pos = &quot;N&quot;;<br>
<br>
Best,<br>
Stefan<br>
<br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it" target="_blank">CWB@sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" rel="noreferrer" target="_blank">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
</blockquote></div>