<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Verdana",sans-serif;
        color:#1F497D;
        font-weight:normal;
        font-style:normal;
        text-decoration:none none;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US">The key bit of the error message is this:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal">Error # 1300: Invalid utf8 character string: ''<o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US">(unfortunate that the actual bad string can’t be identified from this.)<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US">This suggests that there is a bad string in the CWB index, and it is caught by the MySql db on freq list setup. Recent versions of
CWB however should not permit the indexing of badly-encoded strings (recent meaning, last several years). You should have had an error at the encoding stage if there was an encoding error in your data.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US">What’s your CWB version? (also your CQPweb version) Also, is the underlying data UTF-8 or Latin-1?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US">best<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US">Andrew.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:10.0pt;font-family:"Verdana",sans-serif;color:#1F497D;mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">From:</span></b><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif"> cwb-bounces@sslmit.unibo.it <cwb-bounces@sslmit.unibo.it>
<b>On Behalf Of </b>José Manuel Martínez Martínez<br>
<b>Sent:</b> 06 August 2018 08:18<br>
<b>To:</b> Open source development of the Corpus WorkBench <cwb@sslmit.unibo.it><br>
<b>Subject:</b> [CWB] Error #1300 generating word frequency lists<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">Good morning!<o:p></o:p></p>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">Trying to run collocations on a corpus in Spanish, I've got an error.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Somehow, the word frequency list wasn't generated.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I tried to generate it again but the process fails and I get the traceback that I copy/paste below.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Is this a CQPweb issue or should I check some settings of the MySQL database?<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Cheers,<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">jmm<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">--- TRACEBACK ---<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<div>
<p class="MsoNormal">CQPweb encountered an error and could not continue.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">A MySQL query did not run successfully!<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Original query: LOAD DATA LOCAL INFILE '/data/cqpweb/tmp/______tempfreq_spanish.tbl' INTO TABLE `__tempfreq_spanish` FIELDS ESCAPED BY '' /* from User: datamaran | Function: corpus_make_freqtables() | 2018-Aug-03 12:41:27 */<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Error # 1300: Invalid utf8 character string: ''<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">PHP debugging backtrace<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">array(6) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [1]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(4) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["file"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(40) "/var/www/html/cqpweb/lib/library.inc.php"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["line"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> int(286)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["function"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(20) "exiterror_mysqlquery"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["args"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(3) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [0]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> int(1300)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [1]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(33) "Invalid utf8 character string: ''"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [2]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(210) "LOAD DATA LOCAL INFILE '/data/cqpweb/tmp/______tempfreq_spanish.tbl' INTO TABLE `__tempfreq_spanish` FIELDS ESCAPED BY '' <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> /* from User: datamaran | Function: corpus_make_freqtables() | 2018-Aug-03 12:41:27 */"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [2]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(4) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["file"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(40) "/var/www/html/cqpweb/lib/library.inc.php"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["line"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> int(410)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["function"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(14) "do_mysql_query"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["args"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(1) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [0]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> &string(210) "LOAD DATA LOCAL INFILE '/data/cqpweb/tmp/______tempfreq_spanish.tbl' INTO TABLE `__tempfreq_spanish` FIELDS ESCAPED BY '' <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> /* from User: datamaran | Function: corpus_make_freqtables() | 2018-Aug-03 12:41:27 */"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [3]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(4) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["file"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(42) "/var/www/html/cqpweb/lib/freqtable.inc.php"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["line"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> int(124)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["function"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(21) "do_mysql_infile_query"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["args"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(3) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [0]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(18) "__tempfreq_spanish"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [1]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(43) "/data/cqpweb/tmp/______tempfreq_spanish.tbl"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [2]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> bool(true)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [4]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(4) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["file"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(42) "/var/www/html/cqpweb/lib/admin-lib.inc.php"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["line"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> int(838)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["function"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(22) "corpus_make_freqtables"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["args"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(1) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [0]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(7) "spanish"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [5]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(4) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["file"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(47) "/var/www/html/cqpweb/lib/metadata-admin.inc.php"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["line"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> int(179)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["function"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(40) "create_text_metadata_auto_freqlist_calls"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["args"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(1) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [0]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(7) "spanish"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [6]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(4) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["file"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(43) "/var/www/html/cqpweb/exe/metadata-admin.php"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["line"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> int(3)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["args"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> array(1) {<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> [0]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(47) "/var/www/html/cqpweb/lib/metadata-admin.inc.php"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> ["function"]=><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> string(7) "require"<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> }<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">}<o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal">--<o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal">José Manuel Martínez Martínez<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><a href="https://chozelinek.github.io" target="_blank">https://chozelinek.github.io</a><o:p></o:p></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>