<!-- begin sanitized html -->
<div>I have aligned the corpus this way:</div>
<div><br /></div>
<div>cwb-align -r registry/ <strong>-V s_id</strong> -o txtgmmdes_es.align txtgmmdes_es
txtgmmdes_md s</div>
<div><br /></div>
<div>And the other way around for its parallel corpus.<br /></div>
<div><br /></div>
<div>Adding the <strong>-V s_id</strong> did the trick</div>
<div><br /></div>
<div>Reading this part, helped me:</div>
<blockquote>If we specify pre-alignment with -S, then the aligner assumes that the source and
target corpora have<br />the same number of paragraphs, and that the first paragraph in the
source (HOLMES-EN) corresponds<br />to the first paragraph in the target (HOLMES-DE), the
second to the second, and so on. This would be<br />done as follows:<br />$ cwb-align -S p -o
holmes.align HOLMES-EN HOLMES-DE s<br />Alternatively we can use -V. In this case, paragraphs
will not be matched up by order - they are<br />matched up by the value of the s-attribute.
Since the Holmes corpora input data have num as an<br />annotation, there is an s-attribute p
num which has values and can be used in this way. This would be<br />done as follows:<br />$
cwb-align -V p_num -o holmes.align HOLMES-EN HOLMES-DE s<br /></blockquote>
<div><br /></div>
<div>Thanks a lot!!!!</div>
<div><br /></div>
<div><br /></div>
El Jue, 27 de Diciembre de 2018, 13:58, Hardie, Andrew escribi&oacute;:<br /> <style
type="text/css">-></style>
<div class="bodyclass">
<div class="WordSection1">
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">The
.align file is read as described in <strong>man cwb-align</strong>. </span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">In
brief, cols 1-4 are two pairs of cpos, where the first cpos pair = region in source and the
second cpos pair = aligned region in  target: so what I&rsquo;m asking is, are the example
sentences you sent with id=73 correctly represented by a line of cpos pairs in the
a-attribute?</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">(You
can also use cwb-align-decode to check that what is encoded is the same as what is in  your
.align file.)</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">If
the cpos pairs are <em>not</em> correct for that sentence alignment, then the problem is in
the generation of the .align file. One point to note is that if you used
<strong>cwb-align</strong> to generate the alignments (??), errors are to be expected for
language pairs which share little or no vocab.</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">Best</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">Andrew.</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
</span></p>
<p class="MsoNormal"><span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
</span></p>
<p class="MsoNormal"><strong><span lang="EN-US">From:</span></strong><span lang="EN-US">
&quot;Andr&eacute;s Chand&iacute;a&quot;  <br /> <strong>Sent:</strong> 27<br />December 2018
11:47<br /> <strong>To:</strong> Hardie, Andrew <br /> <strong>Cc:</strong> Open source
development of the Corpus WorkBench <br /> <strong>Subject:</strong> RE: [CWB] Short sentences
inconsistent alignment</span></p>
<p class="MsoNormal"> </p>
<div>
<p class="MsoNormal">Thanks for the answer, but how do I check that <span
style="font-size:10.0pt;font-family:&quot;Verdana&quot;,sans-serif;color:#4472C4;mso-fareast-language:EN-US">
these s elements are really aligned with one another in the underlying a-attribute?</span></p>
</div>
<p class="MsoNormal"> </p>
<div>
<p class="MsoNormal">If you mean to check the align files, how should they be read?, anyway,
here they are (just in case):</p>
</div>
<div>
<table class="MsoNormalTable" cellpadding="0" border="0">
    <tbody>
        <tr>
            <td style="padding:.75pt .75pt .75pt .75pt" valign="top">
            <p class="MsoNormal"><span style="border:solid windowtext
1.0pt;padding:0cm">[IMAGE REMOVED]</span><br /> <a
href="http://chandia.net/content/dungupeyem" title="Este enlace externo se abrirá
en una nueva ventana" target="_blank">Dungupeyem</a> | <a
href="http://chandia.net/content/iecmap" title="Este enlace externo se abrirá en
una nueva ventana" target="_blank"> IECMap</a> | <a
href="http://chandia.net/content/isecmap" title="Este enlace externo se abrirá en
una nueva ventana" target="_blank"> ISECMap</a> | <a
href="http://chandia.net/content/nmt" title="Este enlace externo se abrirá en una
nueva ventana" target="_blank"> NMT</a> | <a href="http://corlexim.cl" title="Este
enlace externo se abrirá en una nueva ventana" target="_blank"> Corlexim</a><br />
<br /> administrador de:<br /> <a href="http://parles.upf.edu" title="Este enlace
externo se abrirá en una nueva ventana" target="_blank">Parles.upf</a> | <a
href="https://iwch.upf.edu" title="Este enlace externo se abrirá en una nueva
ventana" target="_blank"> IWCH</a> | <a href="http://amindterapia.com" title="Este
enlace externo se abrirá en una nueva ventana" target="_blank">Amind terapia</a> |
<a href="http://koyaktumapuche.net" title="Este enlace externo se abrirá en una
nueva ventana" target="_blank"> ONG Mapuche koyaktu</a> | <a
href="http://parles.upf.edu/llocs/nocando" title="Este enlace externo se abrirá en
una nueva ventana" target="_blank">Nocando</a> | <a href="https://iac.upf.edu"
title="Este enlace externo se abrirá en una nueva ventana" target="_blank">IAC</a>
| <a href="https://iac.upf.edu/cddz" title="Este enlace externo se abrirá en una
nueva ventana" target="_blank">CddZ</a> | <a href="https://iac.upf.edu/isac"
title="Este enlace externo se abrirá en una nueva ventana"
target="_blank">ISAC</a> | <a href="http://catcg.upf.edu" title="Este enlace
externo se abrirá en una nueva ventana" target="_blank">CatCg</a><br /> <span
style="font-size:18.0pt;font-family:Webdings">P</span> <span
style="font-size:10.0pt"> No imprima innecesariamente. &iexcl;Cuide el medio
ambiente!</span></p>
            <br /><br /><br />_______________________<br />             andr&eacute;s
chand&iacute;a<br /><a href="http://www.chandia.net" target="_blank" title="Este
enlace externo se abrirá en una nueva ventana"><img src="../images/spacer.png"
alt="chandia.net" border="0" /></a> <a href="https://twitter.com/chandianet"
target="_blank" title="Este enlace externo se abrirá en una nueva ventana"><img
src="../images/spacer.png" alt="" width="20" height="20" /></a><br /><a
href="http://chandia.net/content/dungupeyem" title="Este enlace externo se abrirá
en una nueva ventana" target="_blank">Dungupeyem</a> | <a
href="http://chandia.net/content/iecmap" title="Este enlace externo se abrirá en
una nueva ventana" target="_blank">IECMap</a> | <a
href="http://chandia.net/content/isecmap" title="Este enlace externo se abrirá en
una nueva ventana" target="_blank">ISECMap</a> | <a
href="http://chandia.net/content/nmt" title="Este enlace externo se abrirá en una
nueva ventana" target="_blank">NMT</a> | <a href="http://corlexim.cl" title="Este
enlace externo se abrirá en una nueva ventana" target="_blank">Corlexim</a><br
/><br />administrador de:<br /><a href="http://parles.upf.edu" target="_blank"
title="Este enlace externo se abrirá en una nueva ventana">Parles.upf</a> | <a
href="https://iwch.upf.edu" title="Este enlace externo se abrirá en una nueva
ventana" target="_blank">IWCH</a> | <a href="http://amindterapia.com"
target="_blank" title="Este enlace externo se abrirá en una nueva ventana">Amind
terapia</a> | <a href="http://koyaktumapuche.net" target="_blank" title="Este
enlace externo se abrirá en una nueva ventana">ONG Mapuche koyaktu</a> | <a
href="http://parles.upf.edu/llocs/nocando" target="_blank" title="Este enlace
externo se abrirá en una nueva ventana">Nocando</a> | <a
href="https://iac.upf.edu" target="_blank" title="Este enlace externo se abrirá en
una nueva ventana">IAC</a> | <a href="https://iac.upf.edu/cddz" target="_blank"
title="Este enlace externo se abrirá en una nueva ventana">CddZ</a> | <a
href="https://iac.upf.edu/isac" target="_blank" title="Este enlace externo se
abrirá en una nueva ventana">ISAC</a> | <a href="http://catcg.upf.edu"
target="_blank" title="Este enlace externo se abrirá en una nueva
ventana">CatCg</a><br /><span style="font-size: 18pt; color: rgb(79, 98, 40);
font-family: Webdings;">P</span> <span style="font-size: 10pt; color: rgb(79, 98,
40);">No imprima innecesariamente. &iexcl;Cuide el medio ambiente!</span></td>
        </tr>
    </tbody>
</table>
<!-- end sanitized html --> </div>
</div>
</div>