<div dir="ltr"><div class="gmail_default" style="color:#0b5394">Thanks Stephanie, we will definitely have to do it via shell, the process from the web never ends with a big corpus... and thanks for the advice on XML tags, one of the corpus we were trying to export is XML tagged...</div><div class="gmail_default" style="color:#0b5394"><br clear="all"></div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><span style="color:rgb(0,0,255)"><i><span style="font-family:trebuchet ms,sans-serif">... Andrés Chandía</span></i></span><br></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Missatge de Stephanie Evert &lt;<a href="mailto:stefanML@collocations.de">stefanML@collocations.de</a>&gt; del dia dg., 23 d’abr. 2023 a les 9:29:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">If you do it on the command-line rather than via CQPweb, make sure you have CWB v3.5 and read Sec. 8 of the Corpus Encoding Manual carefully to see how you can reconstruct nested XML tags and attribute-value pairs in the start tags (if they have been split up by cwb-encode).<br>
<br>
Best,<br>
Stephanie<br>
<br>
&gt; On 23 Apr 2023, at 01:26, Josep M. Fontana &lt;<a href="mailto:josepm.fontana@upf.edu" target="_blank">josepm.fontana@upf.edu</a>&gt; wrote:<br>
&gt; <br>
&gt; Thanks. We&#39;ll try that. <br>
&gt; <br>
&gt; JM<br>
&gt; <br>
&gt; On 22/4/23 23:48, Hardie, Andrew wrote:<br>
&gt;&gt; With cwb-decode.<br>
&gt;&gt;  <br>
&gt;&gt; best<br>
&gt;&gt;  <br>
&gt;&gt; Andrew<br>
&gt;&gt;  <br>
&gt;&gt; From: <a href="mailto:cwb-bounces@sslmit.unibo.it" target="_blank">cwb-bounces@sslmit.unibo.it</a> &lt;<a href="mailto:cwb-bounces@sslmit.unibo.it" target="_blank">cwb-bounces@sslmit.unibo.it</a>&gt; On Behalf Of Andrés Chandía<br>
&gt;&gt; Sent: Thursday, April 20, 2023 6:23 PM<br>
&gt;&gt; To: Open source development of the Corpus WorkBench &lt;<a href="mailto:cwb@sslmit.unibo.it" target="_blank">cwb@sslmit.unibo.it</a>&gt;<br>
&gt;&gt; Subject: [CWB] export corpus<br>
&gt;&gt;  <br>
&gt;&gt; How do I export big corpus not compromising the machine resources?<br>
&gt;&gt; No data available in manuals...<br>
<br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it" target="_blank">CWB@sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" rel="noreferrer" target="_blank">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
</blockquote></div>