<div dir="ltr">The reason of doing the update of the corpus like this, instead of creating a new one, is that I want users to keep their query history associated to this corpus, and avoid most of the configuration steps. But if in the end this is going to introduce inconsistencies or problems, I will try to find a different way of updating corpora.<div><br></div><div>Cheers,</div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div>--</div><div><div>José Manuel Martínez Martínez</div><div><a href="https://chozelinek.github.io" target="_blank">https://chozelinek.github.io</a></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">On Fri, May 25, 2018 at 12:50 PM, José Manuel Martínez Martínez <span dir="ltr">&lt;<a href="mailto:chozelinek@gmail.com" target="_blank">chozelinek@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi there,<div><br></div><div>I&#39;m reindexing a corpus several times. Instead of going through the process of installing a new corpus for each new version, what I do is to remove the files in the data folder for that corpus and add the new indices. Next, I go to manage frequency lists and recreate all frequency lists.</div><div><br></div><div>Then I see that the total number of tokens is updated, but not the number of texts.</div><div><br></div><div>Question 1: is what I do a bad practice?</div><div>Question 2: is the problem with the number of texts a bug?</div><div>Question 3: if the answer to 2 is no, how can I fix it?</div><div>Question 4: if the answer to 2 is yes, how would you avoid it?</div><div>Question 5: has the number of texts an impact somewhere else (distributions, other measures?)</div><div><br></div><div>Thanks in advance!</div><div><br></div><div>Cheers</div><div><br></div><div><br><div><div class="m_-2430816331468130323gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div><div>José Manuel Martínez Martínez</div><div><a href="https://chozelinek.github.io" target="_blank">https://chozelinek.github.io</a></div></div></div></div></div></div></div>
</div></div>
</blockquote></div><br></div>