<div class="markdown_content"><ul>
<li><strong>status</strong>: open --&gt; closed</li>
<li><strong>assigned_to</strong>: Andrew Hardie</li>
<li><strong>Comment</strong>:</li>
</ul>
<p>You don't have to tag the text, but you <em>do</em> have to tokenise it (i.e. split it so there is one token per line) in order to index it in CWB. Tagging is the most convenient way to do this as most POS taggers also tokenise. But if you have access to a non-tagging tokeniser you can use that instead.</p>
<hr/>
<p><strong> <a class="alink strikethrough" href="https://sourceforge.net/p/cwb/support-requests/4/">[support-requests:#4]</a> raw un-tagged text corpus</strong></p>
<p><strong>Status:</strong> closed<br/>
<strong>Group:</strong> v1.0_(example)<br/>
<strong>Created:</strong> Thu Apr 04, 2019 09:17 PM UTC by will lowder<br/>
<strong>Last Updated:</strong> Thu Apr 04, 2019 09:17 PM UTC<br/>
<strong>Owner:</strong> Andrew Hardie</p>
<p>Is it possible to input a raw text as a corpus into the CQP? I see that, according to the documentation, the standard input format is "vertical text" with each word tagged individually, but I only wish to directly process raw text (such as a news article) in CQP to view things like word frequency, n-grams, etc. Is it possible to use this text as a corpus in CWP without individually tagging each word?</p>
<hr/>
<p>Sent from sourceforge.net because cwb@sslmit.unibo.it is subscribed to <a href="https://sourceforge.net/p/cwb/support-requests/">https://sourceforge.net/p/cwb/support-requests/</a></p>
<p>To unsubscribe from further messages, a project admin can change settings at <a href="https://sourceforge.net/p/cwb/admin/support-requests/options.">https://sourceforge.net/p/cwb/admin/support-requests/options.</a>  Or, if this is a mailing list, you can unsubscribe from the mailing list.</p></div>