<div dir="ltr">Hi Eva,<div><br></div><div>For my historical (and spoken) Spanish corpora I also have 4 columns: paleographic form (or spoken form), PoS, lemma, and normalized form. The first column should be the one you want to be able to search for it without any CEQL shortcut. In order to show by default <span style="font-size:12.8px">&quot;what was actually said&quot; you should define t</span><span style="font-size:12.8px">he 4th column (cGAT-Transcript) as your first one. If you do not want to do that, you could also define the </span><span style="font-size:12.8px">cGAT-Transcript as the alternate view in extended context (and as a gloss in the KWIC results).</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Although we can </span><span style="font-size:12.8px">definitively</span><span style="font-size:12.8px"> </span><span style="font-size:12.8px">use </span> the CQP syntax to search for the normalized forms: [normalized=&quot;<span style="font-size:12.8px">haben</span>&quot;]<span style="font-size:12.8px">, in order to be able to use a fourth column shortcut within the CEQL syntax</span><span style="font-size:12.8px"> ---normally limited to 3 + 2 shortcuts: word (word) / PoS (_POS) / Lemma {LEMMA} + SimplePoS _{SimplePOS} / Lemma/SimplPOS Combined (_{LEMMA/SimplePOS} --- I came up with a really &quot;dirty trick&quot;: I created an additional entry in my &quot;Simplified PoS mapping table&quot;, like this:</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="color:rgb(0,0,0);font-family:sans-serif;font-size:13.12px">&quot;*&quot; =&gt; &quot;*&quot;</span><span style="font-size:12.8px"><br></span></div><div><span style="color:rgb(0,0,0);font-family:sans-serif;font-size:13.12px"><br></span></div><div><span style="color:rgb(0,0,0);font-family:sans-serif;font-size:13.12px">and then, I declared the &quot;normalized&quot; column to be used within the &quot;</span><font color="#000000" face="sans-serif"><span style="font-size:13.12px">Combination annotation&quot;. So now, I can use the Combination annoation shortcut {haben/*} </span></font><span style="color:rgb(0,0,0);font-family:sans-serif;font-size:13.12px">to search for </span><span style="font-size:13.12px;color:rgb(0,0,0);font-family:sans-serif">&quot;normalized form &#39;haben&#39; having ANY Simplified PoS&quot;. I said it was a &quot;dirty trick&quot;, and I mean it: it will impact the CEQL performance if you have a really big corpus. Also, since my corpora are only in Spanish, I do not need the original {Lemma / SimplifiedPOS} shortcut (but you might). However I do really need my normalized columns to be accesible within the CEQL. </span></div><div><span style="font-size:13.12px;color:rgb(0,0,0);font-family:sans-serif"><br></span></div><div><span style="font-size:13.12px;color:rgb(0,0,0);font-family:sans-serif">Regards,</span></div><div><span style="font-size:13.12px;color:rgb(0,0,0);font-family:sans-serif"><br></span></div><div><span style="font-size:13.12px;color:rgb(0,0,0);font-family:sans-serif">Javier</span></div><div class="gmail_extra"><br></div><div class="gmail_extra"><br></div><div class="gmail_extra"><br></div><div class="gmail_extra"><br><div class="gmail_quote">2018-06-04 7:26 GMT-04:00 Eva Bretschneider <span dir="ltr">&lt;<a href="mailto:eva.bretschneider@uni-leipzig.de" target="_blank">eva.bretschneider@uni-leipzig.de</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Dear everybody,<br>
<br>
I have a question regarding my corpora:<br>
<br>
The texts are transcriptions of spoken German written with cGAT. They are edited so the first column in the data is &quot;normalized&quot;, meaning the transcription was adjusted to &quot;normal&quot; writing. The second column is the POS-tag, third the lemma and the fourth is the cGAT-Transcript.<br>
<br>
My question is: Is there a way to display this fourth column when accessing the corpus? E.g. searching for {haben} and displaying &quot;what was actually said&quot;, meaning the transcript in the fourth column?<br>
<br>
Thanks a lot for any help,<br>
best regards<br>
Eva<br>
<br>
______________________________<wbr>_________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it" target="_blank">CWB@sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" rel="noreferrer" target="_blank">http://liste.sslmit.unibo.it/m<wbr>ailman/listinfo/cwb</a><br>
</blockquote></div><br></div></div>