<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Hi Elif,<div class=""><br class=""></div><div class="">I’d agree that for Step 3, it’ll be much easier to read in a separate overall corpus frequency list and use join.freqs() to merge them - the function has an argument that allows you to specify that you only want the items that are in your list of step 2 (i.e. verbs that occur in the cxn). If the corpus frequency list is too large, I’d use the list.txt and do some sort of a setdiff/awk magic outside CWB/{collostructions}, although I never had to do that with any CWB corpus (of the size hosted at the FU).</div><div class=""><br class=""></div><div class="">Even if it was possible with cwb-lexdecode via an inclusion list (list.txt), it would not give you an advantage, as far as I see. Fwiw, I keep frequency lists for every corpus and/or word class so I can load them into R when I need them for exactly that purpose.</div><div class=""><br class=""></div><div class="">Feel free to contact me offlist if you have further questions about {collostructions} (<a href="mailto:susanne.flach@es.uzh.ch" class="">susanne.flach@es.uzh.ch</a>).</div><div class=""><br class=""></div><div class="">Best,</div><div class="">Susanne</div><div class=""><br class=""><div class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">—<br class="">Dr. Susanne Flach<br class="">Arbeitsbereich Linguistik<br class="">Institut für Englische Philologie<br class="">Freie Universität Berlin<br class="">Habelschwerdter Allee 45<br class="">14195 Berlin</div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><a href="http://sfla.ch" class="">sfla.ch</a><br class=""><br class=""></div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">** Ich bin seit Februar 2020 an der</div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Universität Zürich</div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">(<a href="mailto:susanne.flach@es.uzh.ch" class="">susanne.flach@es.uzh.ch</a>) **</div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><br class=""></div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><a href="http://userpage.fu-berlin.de/~flach/corpling/" class="">Korpustutorium mit CQP</a><br class=""></div></div></div></div></div></div></div></div></div>
</div>
<div><br class=""><blockquote type="cite" class=""><div class="">On 18 Mar 2022, at 12:05, Kara, Elif &lt;<a href="mailto:elif.kara@fu-berlin.de" class="">elif.kara@fu-berlin.de</a>&gt; wrote:</div><br class="Apple-interchange-newline"><div class=""><meta charset="UTF-8" class=""><div id="divtagdefaultwrapper" dir="ltr" style="font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; font-size: 11pt; font-family: Helvetica, Arial, sans-serif;" class=""><p style="margin-top: 0px; margin-bottom: 0px;" class=""></p><div style="margin-top: 0px; margin-bottom: 0px;" class="">Dear all,</div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div style="margin-top: 0px; margin-bottom: 0px;" class="">I would like to create&nbsp;an input file for collostructional&nbsp;analysis. Is there an efficient way of exporting a file containing three columns:<span class="">1) collocates occurring in a particular construction (complex query) 2) their frequencies within said construction 3) their corpus frequencies overall?&nbsp;</span></div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><span class=""><br class=""></span></div><div style="margin-top: 0px; margin-bottom: 0px;" class="">If this isn’t possible in a single step: I already have a list containing 1) and 2) — is there a way of querying the corpus frequencies of the words using a word list?</div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div style="margin-top: 0px; margin-bottom: 0px;" class="">I have tried:</div><pre class=""><code class="language-bash">cwb-lexdecode -r &lt;REGISTRY&gt; -F list.txt -f0 -P word &lt;MYCORPUS&gt;
</code></pre><div style="margin-top: 0px; margin-bottom: 0px;" class="">but this computes&nbsp;no matches which can't be right (my list contains one word per line).I’m using my university's&nbsp;v3.0.0 CWB installation&nbsp;from the command line.</div><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div style="margin-top: 0px; margin-bottom: 0px;" class="">Apologies if the question is basic but I am new to corpus linguistics and I am at a loss! Any help is greatly appreciated!</div><p style="margin-top: 0px; margin-bottom: 0px;" class=""></p><div style="margin-top: 0px; margin-bottom: 0px;" class=""><br class=""></div><div style="margin-top: 0px; margin-bottom: 0px;" class="">Best</div><div style="margin-top: 0px; margin-bottom: 0px;" class="">Elif</div><div id="Signature" class=""><div id="divtagdefaultwrapper" dir="ltr" style="font-size: 12pt; font-family: Calibri, Helvetica, sans-serif, EmojiFont, &quot;Apple Color Emoji&quot;, &quot;Segoe UI Emoji&quot;, NotoColorEmoji, &quot;Segoe UI Symbol&quot;, &quot;Android Emoji&quot;, EmojiSymbols;" class=""><div style="margin: 0px;" class=""><span style="font-size: 8pt; font-family: &quot;Lucida Console&quot;, Monaco, monospace; color: rgb(117, 123, 128);" class=""></span></div><p style="margin-top: 0px; margin-bottom: 0px;" class=""></p></div></div></div><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">_______________________________________________</span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">CWB mailing list</span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><a href="mailto:CWB@sslmit.unibo.it" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">CWB@sslmit.unibo.it</a><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a></div></blockquote></div><br class=""></div></body></html>