<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">On another issue (that most likely has nothing to do with my previous mail):<div class=""><br class=""></div><div class="">I am using a utf-coded corpus that contains german characters such as ä, ö, ü, ß. While this does not cause trouble, e.g. in standard queries, there seems to be an issue in frequency lists. Just one example: in a newspaper corpus, the term "sägte" (as in he "sawed") is listed way up with a frequency of 90,000. Actually clicking on the word gives the correct occurence of the term – which is only one.&nbsp;</div><div class=""><br class=""></div><div class="">What the calculation is confusing is the term "sagte" (said) with "sägte" ("a" instead of the "ä"). Similar examples occur as frequency list somehow seems to like awkward but rare spellings – so that a football transcription <i class="">Ri - "bé" - ry </i>links the search result for&nbsp;"be" ;-).</div><div class=""><br class=""></div><div class="">Best wishes,</div><div class="">Thilo</div><div class=""><div class=""><br class=""></div></div></body></html>