<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
Hi again,</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
<br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
&gt; <font size="2"><span style="font-size:11pt" class="ContentPasted0">That means the start tags of these XML elements contain attribute-value pairs, which you're ignoring – cwb-encode simply warns you about this fact.
</span></font><br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted1">
I tried to run the command with attribute values: .... &nbsp;-xsBC9 -c utf8 -P pos -P lemma -S text:code+title -S p:id -S s:id<br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted1">
And the programme issued the same warnings.</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted1">
<br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted1 ContentPasted2">
&gt;Are you sure there isn't any error message?
<div><br>
</div>
<div>No message, it terminates silently.</div>
<div><br class="ContentPasted2">
</div>
&gt; A first step would be to re-run cwb-encode with the -v option added (at the start, not after the attribute flags). This should print how many tokens have been read and encoded from the vrt file.<br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
<br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
I ran the same command with the -v option.<br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
Now it adds in the end:</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted3">
Total size: 31747 tokens (0.0M)</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted3">
<br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted3">
Best,</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof ContentPasted3">
Mikhail <br>
</div>
<div style="font-family: &quot;Times New Roman&quot;, Times, serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
<br>
</div>
<div id="appendonsend"></div>
<div style="font-family:&quot;Times New Roman&quot;,Times,serif; font-size:12pt; color:rgb(0,0,0)">
<br>
</div>
<hr tabindex="-1" style="display:inline-block; width:98%">
<div id="divRplyFwdMsg" dir="ltr"><font style="font-size:11pt" face="Calibri, sans-serif" color="#000000"><b>From:</b> cwb-bounces@sslmit.unibo.it &lt;cwb-bounces@sslmit.unibo.it&gt; on behalf of Stephanie Evert &lt;stefanML@collocations.de&gt;<br>
<b>Sent:</b> Monday, February 13, 2023 22:39<br>
<b>To:</b> CWBdev Mailing List &lt;cwb@sslmit.unibo.it&gt;<br>
<b>Subject:</b> Re: [CWB] CWB: problems with indexing a corpus</font>
<div>&nbsp;</div>
</div>
<div class="BodyFragment"><font size="2"><span style="font-size:11pt">
<div class="PlainText">&gt; I am trying to process a vrt file with cwb-encode.<br>
&gt; The file has pos tagging and I used the examples from CWB-manuals as a template.
<br>
&gt; <br>
&gt; I run the command<br>
&gt; cwb-encode -f /path_to_file.vrt -d /path/datafiles -R /path/registry/corpus_name -9 -c utf8 -P pos -P lemma -S text -S p -S s<br>
&gt; <br>
&gt; and I am getting the following warnings:<br>
&gt; &gt; Annotations of s-attribute &lt;text&gt; not stored (file /xxx.vrt, line #1, warning issued only once).<br>
&gt; &gt; Annotations of s-attribute &lt;p&gt; not stored (file /xx.vrt, line #3, warning issued only once).<br>
&gt; &gt; Annotations of s-attribute &lt;s&gt; not stored (file /xx.vrt, line #4, warning issued only once).<br>
<br>
That means the start tags of these XML elements contain attribute-value pairs, which you're ignoring – cwb-encode simply warns you about this fact.
<br>
<br>
&gt; And the programme terminates without producing any result. <br>
<br>
That sounds like an error, though, and completely unrelated to the warnings.&nbsp; After successful completion of the command, your data directory /path/datafiles should be populated with index files.<br>
<br>
Are you sure there isn't any error message?<br>
<br>
A first step would be to re-run cwb-encode with the -v option added (at the start, not after the attribute flags). This should print how many tokens have been read and encoded from the vrt file.<br>
<br>
Best,<br>
Stephanie<br>
_______________________________________________<br>
CWB mailing list<br>
CWB@sslmit.unibo.it<br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" data-auth="NotApplicable">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
</div>
</span></font></div>
</body>
</html>