<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Sun, Jul 24, 2016 at 11:29 AM, Hardie, Andrew <span dir="ltr">&lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt;</span> wrote:</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">





<div lang="EN-GB" link="blue" vlink="purple">
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">First point – your text ID codes won’t work, they need to be
<b>handles</b>, i.e. just ASCII letters, numbers, and underscore – no hyphens/full stops.</span></p></div></div></blockquote><div><br></div><div>Now corrected!</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div lang="EN-GB" link="blue" vlink="purple"><div><p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u><u></u></span></p>
<p class="MsoNormal"><span style="color:rgb(31,73,125);font-family:Verdana,sans-serif;font-size:10pt">Second point – the various s-attributes text_corpus , text_tagger etc. need (a) to exist in the registry – did your correction fix this? (b) CQPweb needs to
 have logged their existence – if it’s saying “No XML annotations found” that suggests it hasn’t, which could be a consequence of (a), or could be a bug.</span></p></div></div></blockquote><div><br></div><div>Unless I&#39;m mistaken about what attributes are what, they are indeed in the registry. I&#39;ve pasted it at the end of this e-mail, along with a single tagged source text sentence.</div><div> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div lang="EN-GB" link="blue" vlink="purple"><p class="MsoNormal"><span style="color:rgb(31,73,125);font-family:Verdana,sans-serif;font-size:10pt">There was in fact a bug with s-attributes in the registry failing to be detected which I fixed a few months back: I cannot recall if that was before or after
 the version of the code in the VM image. If you want to rule this out, connect the VM’s networking, upgrade CQPweb to the latest version from SVN (don’t forget to do the database upgrade!), and try again: if that fixes it, it was the old bug.</span></p></div></blockquote><div><br></div><div>I&#39;ve been using revision 879 (3.2.20) the whole time, so it shouldn&#39;t be the old bug. </div><div> </div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div lang="EN-GB" link="blue" vlink="purple"><p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">Once CQPweb is aware of your XML attributes you should be able to use them to derive text metadata.<u></u><u></u></span><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p></div></blockquote><div><br></div><div>Thanks for your patience!</div><div><br></div><div>Cheers,</div><div>Scott</div><div><br></div><div><br></div><div><div><font face="monospace, monospace" size="1">&lt;text id=&quot;CCN_F2_25_Ca&quot; corpus=&quot;test_two&quot; tagger=&quot;freeling_xml&quot; language=&quot;spanish&quot; channel=&quot;oral&quot; instrument=&quot;interview&quot; lingualism=&quot;monolingual&quot; location=&quot;concepcion&quot; sex=&quot;f&quot; generation=&quot;G2&quot; sel=&quot;Ca&quot;&gt;</font></div><div><font face="monospace, monospace" size="1">&lt;s&gt;</font></div><div><font face="monospace, monospace" size="1">¿<span class="" style="white-space:pre">        </span>¿<span class="" style="white-space:pre">        </span>Fia<span class="" style="white-space:pre">        </span>Fia<span class="" style="white-space:pre">        </span>punctuation<span class="" style="white-space:pre">        </span>questionmark</font></div><div><font face="monospace, monospace" size="1">todavía<span class="" style="white-space:pre">        </span>todavía<span class="" style="white-space:pre">        </span>RG<span class="" style="white-space:pre">        </span>RG<span class="" style="white-space:pre">        </span>adverb<span class="" style="white-space:pre">        </span>general</font></div><div><font face="monospace, monospace" size="1">está<span class="" style="white-space:pre">        </span>estar<span class="" style="white-space:pre">        </span>VAIP3S0<span class="" style="white-space:pre">        </span>VAI<span class="" style="white-space:pre">        </span>verb<span class="" style="white-space:pre">        </span>auxiliary</font></div><div><font face="monospace, monospace" size="1">grabando<span class="" style="white-space:pre">        </span>grabar<span class="" style="white-space:pre">        </span>VMG0000<span class="" style="white-space:pre">        </span>VMG<span class="" style="white-space:pre">        </span>verb<span class="" style="white-space:pre">        </span>main</font></div><div><font face="monospace, monospace" size="1">?<span class="" style="white-space:pre">        </span>?<span class="" style="white-space:pre">        </span>Fit<span class="" style="white-space:pre">        </span>Fit<span class="" style="white-space:pre">        </span>punctuation<span class="" style="white-space:pre">        </span>questionmark</font></div><div><font face="monospace, monospace" size="1">&lt;/s&gt;</font></div><div><font face="monospace, monospace" size="1">&lt;/text&gt;</font></div></div><div><br></div><div><br></div><div><br></div><div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1">## registry entry for corpus TEST_TWO</font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># long descriptive name for the corpus</font></div><div><font face="monospace, monospace" size="1">NAME &quot;&quot;</font></div><div><font face="monospace, monospace" size="1"># corpus ID (must be lowercase in registry!)</font></div><div><font face="monospace, monospace" size="1">ID   test_two</font></div><div><font face="monospace, monospace" size="1"># path to binary data files</font></div><div><font face="monospace, monospace" size="1">HOME /var/cqpweb/index/test_two</font></div><div><font face="monospace, monospace" size="1"># optional info file (displayed by &quot;info;&quot; command in CQP)</font></div><div><font face="monospace, monospace" size="1">INFO /var/cqpweb/index/test_two/.info</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># corpus properties provide additional information about the corpus:</font></div><div><font face="monospace, monospace" size="1">##:: charset  = &quot;utf8&quot; # character encoding of corpus data</font></div><div><font face="monospace, monospace" size="1">##:: language = &quot;es&quot;     # insert ISO code for language (de, en, fr, ...)</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1">## p-attributes (token annotations)</font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE word</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE lemma</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE tag</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE ctag</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE pos</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE type</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1">## s-attributes (structural markup)</font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># &lt;s&gt; ... &lt;/s&gt;</font></div><div><font face="monospace, monospace" size="1"># (no recursive embedding allowed)</font></div><div><font face="monospace, monospace" size="1">STRUCTURE s</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># &lt;text id=&quot;..&quot; corpus=&quot;..&quot; tagger=&quot;..&quot; file=&quot;..&quot; language=&quot;..&quot; channel=&quot;..&quot; instrument=&quot;..&quot; lingualism=&quot;..&quot; location=&quot;..&quot; sex=&quot;..&quot; generation=&quot;..&quot; sel=&quot;..&quot;&gt; ... &lt;/text&gt;</font></div><div><font face="monospace, monospace" size="1"># (no recursive embedding allowed)</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_id              # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_corpus          # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_tagger          # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_file            # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_language        # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_channel         # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_instrument      # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_lingualism      # [annotations]</font></div><div><span style="font-family:monospace,monospace;font-size:x-small">STRUCTURE text_location        # [annotations]</span><br></div><div><font face="monospace, monospace" size="1">STRUCTURE text_sex             # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_generation      # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE text_sel             # [annotations]</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># Yours sincerely, the Encode tool.</font></div></div><div><br></div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div lang="EN-GB" link="blue" vlink="purple"><div>

<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif">From:</span></b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif"> <a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">cwb-bounces@liste.sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">cwb-bounces@liste.sslmit.unibo.it</a>]
<b>On Behalf Of </b>Scott Sadowsky<br>
<b>Sent:</b> 24 July 2016 15:52<br>
<b>To:</b> CWBdev Mailing List</span></p><div><div class="h5"><br>
<b>Subject:</b> [CWB] WebInABox: Can&#39;t import existing corpora from host<u></u><u></u></div></div><p></p><div><div class="h5">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal">On Sun, Jul 24, 2016 at 10:19 AM, Hardie, Andrew &lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt; wrote:<u></u><u></u></p>
</div>
<div>
<blockquote style="border-style:none none none solid;border-left-width:1pt;border-left-color:rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">CQPweb requires all corpora to have at least one &lt;text&gt; element, and every text element has to have
 an id i.e. everything within the corpus has to be contained within a sequence of one or more</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"> </span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">&lt;text id=”somethinghere”&gt;</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">…</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">&lt;/text&gt;</span><u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks, Andrew. It turns out the problem was that I had been using the name &quot;id&quot; instead of &quot;text&quot; for the element. Now that I&#39;ve changed that, I was able to successfully create the corpus in CQPweb.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">My source files have quite a bit of metadata, which I&#39;ve encoded as follows:<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:&quot;Courier New&quot;">&lt;<span style="color:red">text</span>
<span style="color:rgb(56,118,29)">id</span>=&quot;CCN-F2-02_D_StB.ortografica.txt&quot; <span style="color:rgb(56,118,29)">
corpus</span>=&quot;test&quot; <span style="color:rgb(56,118,29)">tagger</span>=&quot;freeling-xml&quot; <span style="color:rgb(56,118,29)">
language</span>=&quot;spanish&quot; <span style="color:rgb(56,118,29)">location</span>=&quot;concepcion&quot;
<span style="color:rgb(56,118,29)">sex</span>=&quot;f&quot;&gt;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:&quot;Courier New&quot;">...</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:&quot;Courier New&quot;">&lt;/text&gt;</span><u></u><u></u></p>
</div>
<p class="MsoNormal"><br>
I&#39;m now at the CQPweb &quot;Design and insert a text-metadata table for the corpus&quot; page, but it tells me that &quot;No XML annotations found for this corpus&quot;. Is there something wrong with how I did the encoding above? I can use all of these XML elements in cqp searches
 directly, but here they aren&#39;t recognized.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">(I&#39;ve checked chapter 6 of the manual, to no avail).<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Best wishes,<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Scott<u></u><u></u></p>
<div>
<div>
<p class="MsoNormal"><u></u> </p></div></div></div></div></div></div></div></div></div></div></div></blockquote></div>
</div></div>