<div class="markdown_content"><p>Some old Mac software might also produce files with CR-only linebreaks, but these probably can't be fixed.</p>
<hr/>
<p><strong> <a class="alink" href="https://sourceforge.net/p/cwb/feature-requests/47/">[feature-requests:#47]</a> Make cwb-encode handle non-POSIX (win32) linebreaks</strong></p>
<p><strong>Status:</strong> open<br/>
<strong>Group:</strong> TODO-3.5<br/>
<strong>Labels:</strong> CWB engine <br/>
<strong>Created:</strong> Thu Nov 08, 2012 02:52 AM UTC by Andrew Hardie<br/>
<strong>Last Updated:</strong> Wed Dec 12, 2012 05:26 AM UTC<br/>
<strong>Owner:</strong> Andrew Hardie</p>
<p>Moving CWB input text files between Win and *nix can result in CRLF (0x0d, 0x0a) linebreaks being input: if this happens, the CR is encoded as part of the final p-attribute on each line. cwb-encode should be able to spot this and work round it (likewise, in the Win build, be able to cope with POSIX line-breaks; this may already work, but needs checking).</p>
<p>Suggestions for fixing it by Stefan:</p>
<p>- We could extend -B to remove all whitespace characters around tokens, not just blanks.</p>
<p>- We should probably change line #46 of cwb-encode.c to </p>
<div class="codehilite"><pre>\#define FIELDSEPS  "\t\n\r"
</pre></div>


<p>These solutions need evaluating and one or both implementing for v 3.5.</p>
<hr/>
<p>Sent from sourceforge.net because cwb@sslmit.unibo.it is subscribed to <a href="https://sourceforge.net/p/cwb/feature-requests/">https://sourceforge.net/p/cwb/feature-requests/</a></p>
<p>To unsubscribe from further messages, a project admin can change settings at <a href="https://sourceforge.net/p/cwb/admin/feature-requests/options.">https://sourceforge.net/p/cwb/admin/feature-requests/options.</a>  Or, if this is a mailing list, you can unsubscribe from the mailing list.</p></div>