<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Sat, Jul 23, 2016 at 3:19 PM, Hardie, Andrew <span dir="ltr">&lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt;</span> wrote:</div><div class="gmail_quote"><br></div><div class="gmail_quote">Hi Andrew,</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">





<div lang="EN-GB" link="blue" vlink="purple">
<div>
<p class="MsoNormal"><span style="color:rgb(31,73,125);font-family:Verdana,sans-serif;font-size:10pt">Might it be a permissions issue? Depending on how you mounted it, the Vbox shared folder containing the index data may not be accessible to the http daemon.
 Check with ls –l.</span><br></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)">Please check this, if it’s not this, then please post the HOME line of the registry in your reply, and I’ll use that to check the code<u></u><u></u></span><span style="font-size:10pt;font-family:Verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p></div></div></blockquote><div><br></div><div>Thanks, Andrew. It was indeed a permissions issue. In order to troubleshoot this (as symlinks can be tricky), I copied the index files and registry into the CQPWiaB VM and placed them into the same directories as the BNC sampler and Mandarin corpora. The problems persisted, so I changed permissions and ownership as follows (replace <font face="monospace, monospace" size="1">test_flxml_corpus</font> with the name of your corpus):</div><div><br></div><div>cd /var/cqpweb/index</div><div>sudo chown www-data:www-data <span style="font-family:monospace,monospace;font-size:x-small">test_flxml_corpus</span><br></div><div>sudo chmod 755 <span style="font-family:monospace,monospace;font-size:x-small">test_flxml_corpus</span><span style="font-family:monospace,monospace;font-size:x-small"><br></span></div><div><br></div><div>cd <span style="font-family:monospace,monospace;font-size:x-small">test_flxml_corpus</span></div><div>sudo chown www-data:www-data *<br></div><div>sudo chmod 644 *<br></div><div><br></div><div>cd ../../registry/</div><div>sudo chown www-data:www-data <span style="font-family:monospace,monospace;font-size:x-small">test_flxml_corpus</span><br></div><div>sudo chmod 664 <span style="font-family:monospace,monospace;font-size:x-small">test_flxml_corpus</span><br></div><div><br></div><div><br></div><div>So now I can attempt to import the corpus, but I run into a new error: &quot;Pre-indexed corpora require s-attributes text and text_id!!&quot;.  I&#39;ve searched the manual included in CQPWiaB but there&#39;s no mention of &quot;text_id&quot;. What am I doing wrong?</div><div><br></div><div>Below is the content of my registry file, in case that helps.</div><div><br></div><div>Thanks!</div><div>Scott</div><div><br></div><div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1">## registry entry for corpus TEST_FLXML_CORPUS</font></div><div><font face="monospace, monospace" size="1">## </font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># long descriptive name for the corpus</font></div><div><font face="monospace, monospace" size="1">NAME &quot;Test corpus using FreeLing XML tagger&quot;</font></div><div><font face="monospace, monospace" size="1"># corpus ID (must be lowercase in registry!)</font></div><div><font face="monospace, monospace" size="1">ID test_flxml_corpus</font></div><div><font face="monospace, monospace" size="1"># path to binary data files</font></div><div><font face="monospace, monospace" size="1">HOME /var/cqpweb/index/test_flxml_corpus</font></div><div><font face="monospace, monospace" size="1"># optional info file (displayed by &quot;info;&quot; command in CQP)</font></div><div><font face="monospace, monospace" size="1">INFO /var/cqpweb/index/test_flxml_corpus/.info</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># corpus properties provide additional information about the corpus:</font></div><div><font face="monospace, monospace" size="1">##:: charset  = &quot;utf8&quot; <span class="" style="white-space:pre">        </span># character encoding of corpus data</font></div><div><font face="monospace, monospace" size="1">##:: language = &quot;es-CL&quot; # insert ISO code for language (de, en, fr, ...)</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1">## p-attributes (token annotations)</font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE word</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE lemma</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE tag</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE ctag</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE pos</font></div><div><font face="monospace, monospace" size="1">ATTRIBUTE type</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1">## s-attributes (structural markup)</font></div><div><font face="monospace, monospace" size="1">##</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># &lt;s&gt; ... &lt;/s&gt;</font></div><div><font face="monospace, monospace" size="1"># (no recursive embedding allowed)</font></div><div><font face="monospace, monospace" size="1">STRUCTURE s</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># &lt;id corpus=&quot;..&quot; tagger=&quot;..&quot; file=&quot;..&quot; label=&quot;..&quot; channel=&quot;..&quot; audience=&quot;..&quot; purpose=&quot;..&quot; genre=&quot;..&quot; field=&quot;..&quot; area=&quot;..&quot; source=&quot;..&quot;&gt; ... &lt;/id&gt;</font></div><div><font face="monospace, monospace" size="1"># (no recursive embedding allowed)</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_corpus            # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_tagger            # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_file              # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_label             # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_channel           # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_audience          # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_purpose           # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_genre             # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_field             # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_area              # [annotations]</font></div><div><font face="monospace, monospace" size="1">STRUCTURE id_source            # [annotations]</font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"><br></font></div><div><font face="monospace, monospace" size="1"># Yours sincerely, the Encode tool.</font></div></div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div lang="EN-GB" link="blue" vlink="purple"><div>

<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif">From:</span></b><span lang="EN-US" style="font-size:10pt;font-family:Tahoma,sans-serif">
<a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">cwb-bounces@liste.sslmit.unibo.it</a> [<a href="mailto:cwb-bounces@liste.sslmit.unibo.it" target="_blank">mailto:cwb-bounces@liste.sslmit.unibo.it</a>]
<b>On Behalf Of </b>Scott Sadowsky<br>
<b>Sent:</b> 23 July 2016 20:07<br>
<b>To:</b> Open source development of the Corpus WorkBench<br>
<b>Subject:</b> [CWB] WebInABox: Can&#39;t import existing corpora from host<u></u><u></u></span></p><div><div class="h5">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">Hi all!</span><u></u><u></u></p>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">I&#39;m using the brilliant CQP Web in a Box to try and install an already-indexed corpus. This corpus is located on my host machine, and I&#39;m using VirtualBox&#39;s virtual folders to access it from within CQPWiaB.
 I&#39;ve made a local copy of the registry file, placed it inside VirtualBox, and edited it to reflect the difference in paths between the host machine and the virtual machine, and everything seems to be where it should be (or point to where it should point).
 But when I go to CQPWiaB&#39;s &quot;Install a corpus you have already indexed in CWB&quot;, enter the corpus&#39;s name and try to install it, I get one of two errors:<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">1. If I choose the option to look for the registry file in CQPweb&#39;s usual directory (which is where I&#39;ve placed the modified registry file), it says: &quot;A data-directory path could not be found in the registry
 file for the CWB corpus you specified. Either the data-directory is unspecified, or it is specified with a relative path (an absolute path is needed)&quot;.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">I&#39;m using an absolute path in the registry file (/var/cqpweb/index/test_flxml_corpus), and all the files appear there in my file manager.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">2. If I choose the option to specify the location of the registry and enter the exact same directory that CQPweb uses as its default, but manually, I get this error: &quot;A corpus by that name already exists in
 the CQPweb registry!&quot;.<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">I also get error 2 if I put in &quot;/dev/null/&quot; or garbage text (&quot;asdfasdfas&quot;).<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">Any idea what&#39;s going on?<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt"><u></u> <u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9.5pt">Thanks,<br>
Scott</span></p></div></div></div></div></div></div></blockquote></div>
</div></div>