<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Sat, Sep 24, 2016 at 3:07 AM, Hardie, Andrew <span dir="ltr">&lt;<a href="mailto:a.hardie@lancaster.ac.uk" target="_blank">a.hardie@lancaster.ac.uk</a>&gt;</span> wrote:</div><div class="gmail_quote"><br></div><div class="gmail_quote">Hi Andrew,</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">





<div lang="EN-GB">
<div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:verdana,sans-serif;color:rgb(31,73,125)">Try a CQP query for
<u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:verdana,sans-serif;color:rgb(31,73,125)">&lt;whichever_att=&quot;.*[^a-zA-Z0-9_<wbr>].*&quot;&gt;[]</span></p></div></div></blockquote><div><br></div><div>The s-attribute in question is <b>text_source</b>, so I ran the following in CQP:</div><div><br></div><div>&lt;text_source=&quot;.*[^a-zA-Z0-9_].*&quot;&gt;[]<br></div><div><br></div><div>And it produced 0 hits. Same happens with this:</div><div><br></div><div>&lt;text_source=&quot;.*[^a-z0-9_].*&quot;&gt;[]</div><div><br></div><div>This would seem to indicate that all the values of <b>text_source</b> are licit, but CQPweb disagrees. </div><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div lang="EN-GB"><div>
<p class="MsoNormal"><span style="font-size:10pt;font-family:verdana,sans-serif;color:rgb(31,73,125)">and then  tabulate
<b>match whichever_att</b> ?</span></p></div></div></blockquote><div><br></div><div>This just gives me an error:</div><div><br></div><div><div>tabulate match source_text ?;</div><div>CQP Error:</div><div><span class="gmail-Apple-tab-span" style="white-space:pre">        </span>CQP Syntax Error: syntax error, unexpected FIELD, expecting ID or NQRID</div><div><span class="gmail-Apple-tab-span" style="white-space:pre">        </span>tabulate match  &lt;--</div><div>Synchronizing to end of line ...</div></div><div><br></div><div>Cheers,</div><div>Scott</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div lang="EN-GB"><div><p class="MsoNormal"><span style="font-size:10pt;font-family:verdana,sans-serif;color:rgb(31,73,125)"><u></u><u></u></span></p>
<p class="MsoNormal"><span style="font-size:10pt;font-family:verdana,sans-serif;color:rgb(31,73,125)"><u></u> <u></u></span></p>
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10pt;font-family:tahoma,sans-serif">From:</span></b><span lang="EN-US" style="font-size:10pt;font-family:tahoma,sans-serif"> <a href="mailto:cwb-bounces@sslmit.unibo.it" target="_blank">cwb-bounces@sslmit.unibo.it</a> [mailto:<a href="mailto:cwb-bounces@sslmit.unibo.it" target="_blank">cwb-bounces@sslmit.<wbr>unibo.it</a>]
<b>On Behalf Of </b>Scott Sadowsky<br>
<b>Sent:</b> 24 September 2016 04:10<br>
<b>To:</b> Open source development of the Corpus WorkBench<br>
<b>Cc:</b> Open source development of the Corpus WorkBench<br>
<b>Subject:</b> [CWB] Finding bad non-category-handle values<u></u><u></u></span></p><div><div class="gmail-h5">
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">I&#39;m attempting to import a corpus into CQPweb, and when I try to change one of the s-attributes from &quot;free text&quot; to &quot;classification&quot;, I get the following error:<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal"><i>The datatype of text_source cannot be changed to [classification], because there are non-category-handle values in the CWB index.</i><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">I understand this to mean that in one or more values of text_source, there&#39;s a character that&#39;s not a-z or _. My question is simply how do I get a list of these values in order to figure out which one is causing the problem and then fix
 it?<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Thanks in advance!<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal">Scott<u></u><u></u></p>
</div>
</div>
</div></div></div>
</div>

<br>______________________________<wbr>_________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it">CWB@sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" rel="noreferrer" target="_blank">http://liste.sslmit.unibo.it/<wbr>mailman/listinfo/cwb</a><br>
<br></blockquote></div><br>
</div></div>