<div dir="ltr"><div dir="ltr">Thank you Stefan and Andrew!<div>And will it also work if &lt;pause&gt; has an attribute?</div><div><div>&lt;pause dur=&quot;short&quot;&gt;&lt;/pause&gt;</div><div><br></div><div>Best,</div><div>Stefania</div><div><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div><br></div><div>---</div><div><b>Prof. Stefania Spina</b><br>Università per Stranieri di Perugia<br>Delegata alla Ricerca </div><div><a href="mailto:stefania.spina@unistrapg.it" target="_blank">stefania.spina@unistrapg.it</a><br><a href="https://unistrapg.academia.edu/StefaniaSpina" target="_blank">https://www.researchgate.net/profile/Stefania_Spina2</a><br><br></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Il giorno lun 11 mag 2020 alle ore 20:19 Hardie, Andrew &lt;<a href="mailto:a.hardie@lancaster.ac.uk">a.hardie@lancaster.ac.uk</a>&gt; ha scritto:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">The alternative solution is just to represent empty tags as opening tags. There will then be an implicit closing tag before the next tag of the same sort - which you can ignore. Then, you can search for for instance<br>
<br>
    &lt;pause&gt; []<br>
<br>
to get words after a pause (after a &quot;begin-pause&quot; literally, but you know the begin-pause actually represents the point-position of the pause).<br>
<br>
Andrew<br>
<br>
-----Original Message-----<br>
From: <a href="mailto:cwb-bounces@sslmit.unibo.it" target="_blank">cwb-bounces@sslmit.unibo.it</a> &lt;<a href="mailto:cwb-bounces@sslmit.unibo.it" target="_blank">cwb-bounces@sslmit.unibo.it</a>&gt; On Behalf Of Stefan Evert<br>
Sent: 11 May 2020 16:15<br>
To: CWBdev Mailing List &lt;<a href="mailto:cwb@sslmit.unibo.it" target="_blank">cwb@sslmit.unibo.it</a>&gt;<br>
Subject: Re: [CWB] empty element<br>
<br>
<br>
&gt; I have problems with a &lt;pause&gt;&lt;/pause&gt; xml tag in a spoken corpus.<br>
&gt; If I run a query, for example to look at all the words following or preceding a pause, I get no results, both in CWB and in CQPweb. I guess that the problem is that it is an empty element, without any text inside the xml tags.<br>
<br>
Exactly: CWB doesn&#39;t support empty XML elements, all s-attribute regions must enclose one or more tokens.  And for good reason, as empty elements are a major pain in the corpus.<br>
<br>
&gt; How do you suggest to solve this problem?<br>
<br>
BNCweb solves this problem by encoding such empty tags before the current token as a p-attribute, either in XML notation, e.g.<br>
<br>
        &lt;pause/&gt;&lt;noise/&gt;<br>
<br>
or as a feature set<br>
<br>
        |noise|pause|<br>
<br>
so it is easier to query for a specific tag, e.g with<br>
<br>
        [tags_before contains &quot;pause&quot;]<br>
<br>
In fact, BNCweb stores _all_ XML tags (not just empty ones) before and after the current position in two separate p-attributes, which makes it a lot easier to reconstruct the original XML markup in the context display.<br>
<br>
Best,<br>
Stefan<br>
<br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it" target="_blank">CWB@sslmit.unibo.it</a><br>
<a href="https://eur02.safelinks.protection.outlook.com/?url=http%3A%2F%2Fliste.sslmit.unibo.it%2Fmailman%2Flistinfo%2Fcwb&amp;amp;data=02%7C01%7Ca.hardie%40lancaster.ac.uk%7Cd20290b175144e4d3fa808d7f5be2337%7C9c9bcd11977a4e9ca9a0bc734090164a%7C0%7C1%7C637248069312816540&amp;amp;sdata=WjxvmA%2FlEVU8JMv5o9w56cc6htpGLg4dIo%2FDbGT6p6E%3D&amp;amp;reserved=0" rel="noreferrer" target="_blank">https://eur02.safelinks.protection.outlook.com/?url=http%3A%2F%2Fliste.sslmit.unibo.it%2Fmailman%2Flistinfo%2Fcwb&amp;amp;data=02%7C01%7Ca.hardie%40lancaster.ac.uk%7Cd20290b175144e4d3fa808d7f5be2337%7C9c9bcd11977a4e9ca9a0bc734090164a%7C0%7C1%7C637248069312816540&amp;amp;sdata=WjxvmA%2FlEVU8JMv5o9w56cc6htpGLg4dIo%2FDbGT6p6E%3D&amp;amp;reserved=0</a><br>
_______________________________________________<br>
CWB mailing list<br>
<a href="mailto:CWB@sslmit.unibo.it" target="_blank">CWB@sslmit.unibo.it</a><br>
<a href="http://liste.sslmit.unibo.it/mailman/listinfo/cwb" rel="noreferrer" target="_blank">http://liste.sslmit.unibo.it/mailman/listinfo/cwb</a><br>
</blockquote></div>