<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Mon, Jul 25, 2016 at 5:48 AM, Hardie, Andrew <span dir="ltr">&lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt;</span> wrote:</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">





<div lang="EN-GB" link="blue" vlink="purple">
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">Try running<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">          select * from xml_metadata;<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">in the MySQL command line client, and see what you get.</span></p></div></div></blockquote><div><br></div><div>This is what I get:</div><div><br></div><div><div><font face="monospace, monospace" size="1">$ mysql -u root -p cqpweb</font></div><div><font face="monospace, monospace" size="1">Enter password: </font></div><div><font face="monospace, monospace" size="1">Reading table information for completion of table and column names</font></div><div><font face="monospace, monospace" size="1">[...]</font></div><div><font face="monospace, monospace" size="1">mysql&gt; select * from xml_metadata;</font></div><div><font face="monospace, monospace" size="1">+----+------------+---------+------------+-------------+----------+</font></div><div><font face="monospace, monospace" size="1">| id | corpus     | handle  | att_family | description | datatype |</font></div><div><font face="monospace, monospace" size="1">+----+------------+---------+------------+-------------+----------+</font></div><div><font face="monospace, monospace" size="1">|  1 | bncsampler | s       | s          | s           |        0 |</font></div><div><font face="monospace, monospace" size="1">|  2 | bncsampler | text    | text       | text        |        0 |</font></div><div><font face="monospace, monospace" size="1">|  3 | bncsampler | text_id | text       | text_id     |        3 |</font></div><div><font face="monospace, monospace" size="1">|  4 | lcmc       | s       | s          | s           |        0 |</font></div><div><font face="monospace, monospace" size="1">|  5 | lcmc       | text    | text       | text        |        0 |</font></div><div><font face="monospace, monospace" size="1">|  6 | lcmc       | text_id | text       | text_id     |        3 |</font></div><div><font face="monospace, monospace" size="1">+----+------------+---------+------------+-------------+----------+</font></div><div><font face="monospace, monospace" size="1">6 rows in set (0.00 sec)</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">mysql&gt; </font></div></div><div><br></div><div><br></div><div>I have noted something anomalous on another front which may be relevant. When I go to the &quot;Manage Metadata&quot; page of the corpus I&#39;m trying to get set up, and hit the &quot;Create minimalist metadata table&quot; button, I get an error which has nothing to do with my current corpus:</div><div><br></div><div><font face="monospace, monospace" size="1">The data source you specified for the text metadata contains badly-formatted text ID codes, as follows: &lt;strong&gt; &#39;&lt;no annotation&gt;&#39;; &#39;CCN-F2-01_Ca_St.ortografica.txt&#39;; &#39;CCN-F2-02_D_StB.ortografica.txt&#39;; &#39;CCN-F2-03_Ca_St.ortografica.txt&#39;; &#39;CCN-F2-04_Cb_St.ortografica.txt&#39;;[...]&lt;/strong&gt; (text ids can only contain unaccented letters, numbers, and underscore).<br></font></div><div><br></div><div>None of these values are present in my current corpus, though they <i>were</i> in an earlier version, However, I removed them from the tagged texts after you explained that these values had to be handles. Here&#39;s what my metadata currently looks like:</div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">&lt;text id=&quot;CCN_F2_27_B&quot; corpus=&quot;coscach&quot; tagger=&quot;freeling_xml&quot; language=&quot;spanish&quot; channel=&quot;oral&quot; instrument=&quot;interview&quot; lingualism=&quot;monolingual&quot; location=&quot;concepcion&quot; sex=&quot;f&quot; generation=&quot;G2&quot; sel=&quot;B&quot;&gt;</font><br></div><div><br></div><div>So values like <span style="font-family:monospace,monospace;font-size:x-small">&#39;CCN-F2-01_Ca_St.ortografica.txt&#39;</span> are not in my corpus any more (and I recompiled it from these files, of course), but they seem to be cached somewhere by CQPweb, and they are not getting updated by newer corpora I try to import. (Note that I&#39;ve used different names, e.g. test_corpus, test_corpus_two, in order to try to get around this, but it hasn&#39;t worked).</div><div><br></div><div>Cheers,<br>Scott</div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div lang="EN-GB" link="blue" vlink="purple"><div><p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">best<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">Andrew.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif">From:</span></b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif"> <a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">cwb-bounces@liste.sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">cwb-bounces@liste.sslmit.unibo.it</a>]
<b>On Behalf Of </b>Scott Sadowsky<br>
<b>Sent:</b> 24 July 2016 17:17<span class=""><br>
<b>To:</b> Open source development of the Corpus WorkBench<br>
</span><b>Cc:</b> Open source development of the Corpus WorkBench<br>
<b>Subject:</b> Re: [CWB] WebInABox: Can&#39;t import existing corpora from host<u></u><u></u></span></p><div><div class="h5">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<div>
<p class="MsoNormal">On Sun, Jul 24, 2016 at 11:29 AM, Hardie, Andrew &lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt; wrote:<u></u><u></u></p>
</div>
<div>
<blockquote style="border-style:none none none solid;border-left-width:1pt;border-left-color:rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">First point – your text ID codes won’t work, they need to be
<b>handles</b>, i.e. just ASCII letters, numbers, and underscore – no hyphens/full stops.</span><u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Now corrected!<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-style:none none none solid;border-left-width:1pt;border-left-color:rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">Second point – the various s-attributes text_corpus , text_tagger etc. need (a) to exist in the registry
 – did your correction fix this? (b) CQPweb needs to have logged their existence – if it’s saying “No XML annotations found” that suggests it hasn’t, which could be a consequence of (a), or could be a bug.</span><u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Unless I&#39;m mistaken about what attributes are what, they are indeed in the registry. I&#39;ve pasted it at the end of this e-mail, along with a single tagged source text sentence.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-style:none none none solid;border-left-width:1pt;border-left-color:rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">There was in fact a bug with s-attributes in the registry failing to be detected which I fixed a
 few months back: I cannot recall if that was before or after the version of the code in the VM image. If you want to rule this out, connect the VM’s networking, upgrade CQPweb to the latest version from SVN (don’t forget to do the database upgrade!), and try
 again: if that fixes it, it was the old bug.</span><u></u><u></u></p>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">I&#39;ve been using revision 879 (3.2.20) the whole time, so it shouldn&#39;t be the old bug. <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-style:none none none solid;border-left-width:1pt;border-left-color:rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">Once CQPweb is aware of your XML attributes you should be able to use them to derive text metadata. </span><u></u><u></u></p>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks for your patience!<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Cheers,<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Scott<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">&lt;text id=&quot;CCN_F2_25_Ca&quot; corpus=&quot;test_two&quot; tagger=&quot;freeling_xml&quot; language=&quot;spanish&quot; channel=&quot;oral&quot; instrument=&quot;interview&quot; lingualism=&quot;monolingual&quot; location=&quot;concepcion&quot; sex=&quot;f&quot; generation=&quot;G2&quot;
 sel=&quot;Ca&quot;&gt;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">&lt;s&gt;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">¿       ¿       Fia     Fia     punctuation     questionmark</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">todavía todavía RG      RG      adverb  general</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">está    estar   VAIP3S0 VAI     verb    auxiliary</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">grabando        grabar  VMG0000 VMG     verb    main</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">?       ?       Fit     Fit     punctuation     questionmark</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">&lt;/s&gt;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">&lt;/text&gt;</span><u></u><u></u></p>
</div>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">## registry entry for corpus TEST_TWO</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># long descriptive name for the corpus</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">NAME &quot;&quot;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># corpus ID (must be lowercase in registry!)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">ID   test_two</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># path to binary data files</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">HOME /var/cqpweb/index/test_two</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># optional info file (displayed by &quot;info;&quot; command in CQP)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">INFO /var/cqpweb/index/test_two/.info</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># corpus properties provide additional information about the corpus:</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##:: charset  = &quot;utf8&quot; # character encoding of corpus data</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##:: language = &quot;es&quot;     # insert ISO code for language (de, en, fr, ...)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">## p-attributes (token annotations)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">ATTRIBUTE word</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">ATTRIBUTE lemma</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">ATTRIBUTE tag</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">ATTRIBUTE ctag</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">ATTRIBUTE pos</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">ATTRIBUTE type</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">## s-attributes (structural markup)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">##</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># &lt;s&gt; ... &lt;/s&gt;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># (no recursive embedding allowed)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE s</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># &lt;text id=&quot;..&quot; corpus=&quot;..&quot; tagger=&quot;..&quot; file=&quot;..&quot; language=&quot;..&quot; channel=&quot;..&quot; instrument=&quot;..&quot; lingualism=&quot;..&quot; location=&quot;..&quot; sex=&quot;..&quot; generation=&quot;..&quot; sel=&quot;..&quot;&gt; ... &lt;/text&gt;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># (no recursive embedding allowed)</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_id              # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_corpus          # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_tagger          # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_file            # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_language        # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_channel         # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_instrument      # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_lingualism      # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:&quot;Courier New&quot;">STRUCTURE text_location        # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_sex             # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_generation      # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;">STRUCTURE text_sel             # [annotations]</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:7.5pt;font-family:&quot;Courier New&quot;"># Yours sincerely, the Encode tool.</span><u></u><u></u></p>
</div>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-style:none none none solid;border-left-width:1pt;border-left-color:rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif">From:</span></b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif">
<a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">cwb-bounces@liste.sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">cwb-bounces@liste.sslmit.unibo.it</a>]
<b>On Behalf Of </b>Scott Sadowsky<br>
<b>Sent:</b> 24 July 2016 15:52<br>
<b>To:</b> CWBdev Mailing List</span><u></u><u></u></p>
<div>
<div>
<p class="MsoNormal"><br>
<b>Subject:</b> [CWB] WebInABox: Can&#39;t import existing corpora from host<u></u><u></u></p>
</div>
</div>
<div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal">On Sun, Jul 24, 2016 at 10:19 AM, Hardie, Andrew &lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt; wrote:<u></u><u></u></p>
</div>
<div>
<blockquote style="border-style:none none none solid;border-left-width:1pt;border-left-color:rgb(204,204,204);padding:0cm 0cm 0cm 6pt;margin:5pt 0cm 5pt 4.8pt">
<p class="MsoNormal"> <u></u><u></u></p>
<div>
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">CQPweb requires all corpora to have at least one &lt;text&gt; element, and every text element has to have
 an id i.e. everything within the corpus has to be contained within a sequence of one or more</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"> </span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">&lt;text id=”somethinghere”&gt;</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">…</span><u></u><u></u></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">&lt;/text&gt;</span><u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks, Andrew. It turns out the problem was that I had been using the name &quot;id&quot; instead of &quot;text&quot; for the element. Now that I&#39;ve changed that, I was able to successfully create
 the corpus in CQPweb.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">My source files have quite a bit of metadata, which I&#39;ve encoded as follows:<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:&quot;Courier New&quot;">&lt;<span style="color:red">text</span>
<span style="color:rgb(56,118,29)">id</span>=&quot;CCN-F2-02_D_StB.ortografica.txt&quot; <span style="color:rgb(56,118,29)">
corpus</span>=&quot;test&quot; <span style="color:rgb(56,118,29)">tagger</span>=&quot;freeling-xml&quot; <span style="color:rgb(56,118,29)">
language</span>=&quot;spanish&quot; <span style="color:rgb(56,118,29)">location</span>=&quot;concepcion&quot;
<span style="color:rgb(56,118,29)">sex</span>=&quot;f&quot;&gt;</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:&quot;Courier New&quot;">...</span><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><span style="font-family:&quot;Courier New&quot;">&lt;/text&gt;</span><u></u><u></u></p>
</div>
<p class="MsoNormal"><br>
I&#39;m now at the CQPweb &quot;Design and insert a text-metadata table for the corpus&quot; page, but it tells me that &quot;No XML annotations found for this corpus&quot;. Is there something wrong with how I did the encoding above? I can use all of these XML elements in cqp searches
 directly, but here they aren&#39;t recognized.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">(I&#39;ve checked chapter 6 of the manual, to no avail).<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Best wishes,<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Scott<u></u><u></u></p>
<div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</blockquote>
</div>
</div>
</div>
</div></div></div>
</div>

<br>_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@liste.sslmit.unibo.it">CWB@liste.sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" rel="noreferrer" target="_blank">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div style="font-size:12.7273px">Dr. Scott Sadowsky<br>Profesor Asistente de Lingüística</div><div dir="ltr" style="font-size:12.7273px">Pontificia Universidad Católica de Chile<br></div><div dir="ltr" style="font-size:12.7273px"><br></div><div dir="ltr" style="font-size:12.7273px">ssadowsky gmail com</div><div dir="ltr" style="font-size:12.7273px">scsadowsky uc cl<br><a href="http://sadowsky.cl/" target="_blank">http://sadowsky.cl/</a></div><div dir="ltr" style="font-size:12.7273px"> </div></div></div></div></div></div></div></div></div></div></div>
</div></div>