<div dir="ltr"><div>Thank you, Andrew, and also Ciarán.</div><div>If I proceed with this I will let you know.</div><div>Diana</div></div><br><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">Hardie, Andrew <<a href="mailto:a.hardie@lancaster.ac.uk">a.hardie@lancaster.ac.uk</a>> escreveu (sexta, 27/06/2025 à(s) 20:16):<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="msg-8095418311430323397">





<div lang="EN-GB" style="overflow-wrap: break-word;">
<div class="m_-8095418311430323397WordSection1">
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)">Yes it is, but you need to tokenise the text first.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)">There aren’t really any technical details specific to any given language. The whole system makes no assumptions about the language,
 except that the data is divided into words. <u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)">best<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)">Andrew.<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:"Verdana",sans-serif;color:rgb(21,96,130)"><u></u> <u></u></span></p>
<div>
<div style="border-width:1pt medium medium;border-style:solid none none;border-color:rgb(225,225,225) currentcolor currentcolor;padding:3pt 0cm 0cm">
<p class="MsoNormal"><b><span style="font-family:"Calibri",sans-serif">From:</span></b><span style="font-family:"Calibri",sans-serif"> CWB <<a href="mailto:cwb-bounces@sslmit.unibo.it" target="_blank">cwb-bounces@sslmit.unibo.it</a>>
<b>On Behalf Of </b>Diana Santos<br>
<b>Sent:</b> 27 June 2025 15:18<br>
<b>To:</b> Open source development of the Corpus WorkBench <<a href="mailto:cwb@sslmit.unibo.it" target="_blank">cwb@sslmit.unibo.it</a>><br>
<b>Subject:</b> [CWB] Is it possible to use CWB with Chinese?<u></u><u></u></span></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<div>
<p class="MsoNormal">Dear all, <u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">I wonder if it is possible to use CWB with Chinese, and of so, if anyone could point me to information where technical details can be found (for those who read/process Chinese).<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks a lot in advance,<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Diana<u></u><u></u></p>
</div>
</div>
</div>
</div>
</div>

_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it" target="_blank">CWB@sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" rel="noreferrer" target="_blank">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
</div></blockquote></div>