<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:SimSun;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
@font-face
        {font-family:"\@SimSun";
        panose-1:2 1 6 0 3 1 1 1 1 1;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0cm;
        font-size:10.0pt;
        font-family:"Courier New";}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:"Consolas",serif;}
span.EmailStyle23
        {mso-style-type:personal-reply;
        font-family:"Verdana",sans-serif;
        color:#1F497D;
        font-weight:normal;
        font-style:normal;
        text-decoration:none none;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;
        mso-ligatures:none;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">I mean it cannot be done
<i>at all</i>. You need to start over. As you indicate … because this…<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">&gt;&gt;
</span><span style="font-size:10.5pt;font-family:&quot;Arial&quot;,sans-serif;color:black">we can instead only run cwb-encode command to re-index and overwrite the existing corpora index</span><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">=starting over. So it’s starting over whether you do it via the web UI or the CLI.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">But overwriting the existing index is a bad idea, because any saved queries that referenced the index will still point there – but
 now they are no longer pointing at the same data.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">Better to have parallel names with a changeable suffix:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">mycorpus-01<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">mycorpus-02<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">…<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">or<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">mycorpus-20231015<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">mycorpus-20231016<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">…<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">So that there will not be confusion regarding what corpus any given saved query is associated with. (whether or not you opt to delete
 older indexes).<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">best<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US">Andrew.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p>&nbsp;</o:p></span></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US">From:</span></b><span lang="EN-US"> cwb-bounces@sslmit.unibo.it &lt;cwb-bounces@sslmit.unibo.it&gt;
<b>On Behalf Of </b>???<br>
<b>Sent:</b> Monday, October 16, 2023 12:46 PM<br>
<b>To:</b> cwb@sslmit.unibo.it<br>
<b>Subject:</b> Re: [CWB] CWB Digest, Vol 199, Issue 5<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
<div>
<div>
<p class="MsoNormal" style="margin-bottom:12.0pt"><span style="font-size:10.5pt;font-family:&quot;Arial&quot;,sans-serif;color:black">Thank you, Andrew! Do you mean we cannot make it on the admin-ui webpage, we can instead only run cwb-encode command to re-index and
 overwrite the existing corpora index? If so, it really sucks.It cannot be done by adding more files via the web-ui.<br>
<br>
<br>
<br>
<o:p></o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-size:10.5pt;font-family:&quot;Arial&quot;,sans-serif;color:black"><br>
</span><span style="font-size:8.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:black">Vincent Zhang</span><span style="font-size:10.5pt;font-family:&quot;Arial&quot;,sans-serif;color:black"><o:p></o:p></span></p>
</div>
<pre><span style="color:black"><br>From: <a href="mailto:cwb-request@sslmit.unibo.it">cwb-request@sslmit.unibo.it</a><o:p></o:p></span></pre>
<pre><span style="color:black">Date: 2023-10-16 18:00:01<o:p></o:p></span></pre>
<pre><span style="color:black">To:&nbsp; <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><o:p></o:p></span></pre>
<pre><span style="color:black">Subject: CWB Digest, Vol 199, Issue 5&gt;Send CWB mailing list submissions to<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a><o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;To subscribe or unsubscribe via the World Wide Web, visit<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><o:p></o:p></span></pre>
<pre><span style="color:black">&gt;or, via email, send a message with subject or body 'help' to<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="mailto:cwb-request@sslmit.unibo.it">cwb-request@sslmit.unibo.it</a><o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;You can reach the person managing the list at<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="mailto:cwb-owner@sslmit.unibo.it">cwb-owner@sslmit.unibo.it</a><o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;When replying, please edit your Subject line so it is more specific<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;than &quot;Re: Contents of CWB digest...&quot;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Today's Topics:<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp; 1. How to append corpus data into an existing corpora?<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; (<a href="mailto:wzzhang@shisu.edu.cn">wzzhang@shisu.edu.cn</a>)<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp; 2. Re: How to append corpus data into an existing corpora?<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;(Hardie, Andrew)<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;----------------------------------------------------------------------<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Message: 1<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Date: Mon, 16 Oct 2023 13:59:39 +0800<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;From: &quot;<a href="mailto:wzzhang@shisu.edu.cn">wzzhang@shisu.edu.cn</a>&quot; &lt;<a href="mailto:wzzhang@shisu.edu.cn">wzzhang@shisu.edu.cn</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;To: cwb &lt;<a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Subject: [CWB] How to append corpus data into an existing corpora?<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Message-ID: &lt;<a href="mailto:202310161358581732745@shisu.edu.cn">202310161358581732745@shisu.edu.cn</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Content-Type: text/plain; charset=&quot;gb2312&quot;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Hello everyone,<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;I found nowhere to append a new VRT file into an existing corpora. If it lack this feature, how to sustainably improve a corpora?<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Vincent Zhang<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Institute of Corpus Studies and Applications, Shanghai International Studies University<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;-------------- next part --------------<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;An HTML attachment was scrubbed...<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;URL: &lt;<a href="http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20231016/ef192825/attachment-0001.html">http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20231016/ef192825/attachment-0001.html</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;------------------------------<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Message: 2<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Date: Mon, 16 Oct 2023 06:19:46 +0000<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;From: &quot;Hardie, Andrew&quot; &lt;<a href="mailto:a.hardie@lancaster.ac.uk">a.hardie@lancaster.ac.uk</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;To: Open source development of the Corpus WorkBench<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;<a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Subject: Re: [CWB] How to append corpus data into an existing corpora?<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Message-ID:<o:p></o:p></span></pre>
<pre><span style="color:black">&gt; &lt;<a href="mailto:LO4P265MB3485AD0D1262A6549EBA62EECBD7A@LO4P265MB3485.GBRP265.PROD.OUTLOOK.COM">LO4P265MB3485AD0D1262A6549EBA62EECBD7A@LO4P265MB3485.GBRP265.PROD.OUTLOOK.COM</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Content-Type: text/plain; charset=&quot;us-ascii&quot;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;That's because you can't do it.<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;You have to create a new corpus index from your original files with your new files appended to them.<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Each CWB index then corresponds to the state of your corpus at some particular moment in time. (This is actually desirable from the point of view of replicability of results.)<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;best<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Andrew.<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;From: <a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a> &lt;<a href="mailto:cwb-bounces@sslmit.unibo.it">cwb-bounces@sslmit.unibo.it</a>&gt; On Behalf Of <a href="mailto:wzzhang@shisu.edu.cn">wzzhang@shisu.edu.cn</a><o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Sent: Monday, October 16, 2023 7:00 AM<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;To: cwb &lt;<a href="mailto:cwb@sslmit.unibo.it">cwb@sslmit.unibo.it</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Subject: [CWB] How to append corpus data into an existing corpora?<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;Hello everyone,<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;I found nowhere to append a new VRT file into an existing corpora. If it lack this feature, how to sustainably improve a corpora?<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;________________________________<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Vincent Zhang<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;Institute of Corpus Studies and Applications, Shanghai International Studies University<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;-------------- next part --------------<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;An HTML attachment was scrubbed...<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;URL: &lt;<a href="http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20231016/38eb1612/attachment-0001.html">http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20231016/38eb1612/attachment-0001.html</a>&gt;<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;------------------------------<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;_______________________________________________<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;CWB mailing list<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><o:p></o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;<o:p>&nbsp;</o:p></span></pre>
<pre><span style="color:black">&gt;End of CWB Digest, Vol 199, Issue 5<o:p></o:p></span></pre>
<pre><span style="color:black">&gt;***********************************<o:p></o:p></span></pre>
</div>
<p class="MsoNormal"><o:p>&nbsp;</o:p></p>
</div>
</div>
</body>
</html>