[CWB] Escape "<" and ">" symbols

mansur 6688000 at gmail.com
Tue Feb 20 17:57:48 CET 2018


Hello!

Could you explain how to escape "<" and ">" symbols in morphological tags,
that produces Apertium's analyser? For example:

<s>
2008    <num>   2008
елда    <n><sg><loc>    ел
нефть   <n><sg><nom>    нефть
табу    <v><tv><ger><nom>       тап
эшләре  <n><pl><px3sp><nom>     эш
өчен    <post>  өчен
авыл    <n><sg><attr>   авыл
хуҗалыгы        <n><sg><px3sp><nom>     хуҗалык
җирләреннән     <n><pl><px3sp><abl>     җир
якынча  <adv>   якынча
500     <num>   500
гектарда        <n><sg><loc>    гектар
950     <num>   950
җир     <n><sg><attr>   җир
участогын       <n><sg><px3sp><acc>     участок
<g/>
,       <cm>    ,
2009    <num>   2009
<g/>
-       <guio>  -
<g/>
2010    <num>   2010
елларда <n><pl><loc>    ел
100     <num>   100
гектарда        <n><sg><loc>    гектар
400     <num>   400
участокны       <n><sg><acc>    участок
күчерергә       <v><tv><inf>    күчер
...

cwb-encode tries to parse them as structural tags along with <s> and <text>.

Thank you!
Mansur
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://liste.sslmit.unibo.it/pipermail/cwb/attachments/20180220/34f35227/attachment.html>


More information about the CWB mailing list