<div dir="ltr"><div>I humbly bestow upon myself an F in reading comprehension.  I completely breezed over the wiki link.  This looks awesome.<div><br></div><div>Could you snap a photo of the entire setup as it currently exists?</div></div><div><br></div><div>My brain is too small to comprehend or comment on much of the technical aspects, but I see mention of the outdatedness of Spreads.  Is Miloh's fork (<a href="https://github.com/miloh/spreads">https://github.com/miloh/spreads</a>) any better?  I thought I had located a more recent build than these a little while back, but I can't seem to find it now, if one even exists.  Maybe Jonathon Duerig has some code to contribute?</div><div><br></div><div>-Danny</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, May 31, 2017 at 5:09 PM, kprichard <span dir="ltr"><<a href="mailto:kprichard@gmail.com" target="_blank">kprichard@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><a href="https://noisebridge.net/wiki/30_May_2017:_Test_a_copy_of_PDFScanner" target="_blank">https://noisebridge.net/wiki/<wbr>30_May_2017:_Test_a_copy_of_<wbr>PDFScanner</a><div><br></div><div>linked from a page with previous documented work-</div><div><br></div><div><a href="https://noisebridge.net/wiki/Book_Scanner_Software" target="_blank">https://noisebridge.net/wiki/<wbr>Book_Scanner_Software</a><br></div></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Wed, May 31, 2017 at 7:39 AM, <a href="mailto:newmy51@gmail.com" target="_blank">newmy51@gmail.com</a> <span dir="ltr"><<a href="mailto:newmy51@gmail.com" target="_blank">newmy51@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="auto">Super cool!  Would love to see some photos or screenshots.  Any of this excellent progress added to the wiki?<div dir="auto"><br></div><div dir="auto">Best from Syracuse,</div><div dir="auto"><br></div><div dir="auto">-Danny</div></div><div class="gmail_extra"><br><div class="gmail_quote"><div><div class="m_1054750537165767128h5">On May 31, 2017 7:08 AM, "kprichard" <<a href="mailto:kprichard@gmail.com" target="_blank">kprichard@gmail.com</a>> wrote:<br type="attribution"></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="m_1054750537165767128h5"><div dir="ltr"><div>Tonight I finished rebuilding the dorkroom mac mini by reinstalling macOS Sierra. Previously I replaced the crashed HD with a donated SSD. Specs are: 8GB RAM, Core2Duo 2.4 GHz, 128GB SSD.  It boots quickly and is faster overall.  I renamed it to 'BookScannerMacMini'.</div><div><br></div><div>Since my last emails I have continued looking for image-to-pdf softwares, and recently found another one which looks promising: PDFScanner (macOS)</div><div><br></div><div>I put it through the same test as ABBYY FineReader Pro, writing up a report and producing a PDF (linked on the wiki)-</div><div><br></div><div><a href="https://noisebridge.net/wiki/30_May_2017:_Test_a_copy_of_PDFScanner" target="_blank">https://noisebridge.net/wiki/3<wbr>0_May_2017:_Test_a_copy_of_PDF<wbr>Scanner</a><br></div><div><br></div><div>Results are acceptable. Not nearly so accurate as ABBYY FineReader, but substantially better than Tesseract from cli.  Sorry there are no exact quantitative results, just my sense from having looked at this problem for more than five minutes.<br></div><div><br></div><div>Cost is $16, which I've spent.  Appears to be faster than FineReader.</div><div><br></div><div>Next steps:</div><div>- Hooking the mini up to the twin Canons and getting scan.py working again</div><div>- Add a post-process pipeline with as filesystem watcher, and a script to pump the image files thru imagemagick or GIMP: autocrop, align, deskew, autolevels, contrast</div><div>- Run some books through and get PDFs<br></div><div><br></div><div>PDFScanner is as close to user-friendly as anything I've seen, certainly more so than ABBYY FineReader.  A set of files can be drag-dropped onto it, and it automatically starts OCRing them.  If they're all oriented and cropped ahead of time, then the only remaining step is to press Cmd-S to export as PDF.</div><div><br></div><div>We are getting close to having a fully functional book scanner.</div><div><br></div></div>
<br></div></div>______________________________<wbr>_________________<br>
Digitalarchivists mailing list<br>
<a href="mailto:Digitalarchivists@lists.noisebridge.net" target="_blank">Digitalarchivists@lists.noiseb<wbr>ridge.net</a><br>
<a href="http://www.noisebridge.net/mailman/listinfo/digitalarchivists" rel="noreferrer" target="_blank">http://www.noisebridge.net/mai<wbr>lman/listinfo/digitalarchivist<wbr>s</a><br>
<br></blockquote></div></div>
</blockquote></div><br></div>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div><div><div><span style="font-family:tahoma,sans-serif">Danny Newman<u><br><br>Parataxonomist</u><br></span></div><span style="font-family:tahoma,sans-serif"><font size="-1"><span style="color:rgb(0,0,0);font-size:12px">College of Environmental Science and Forestry</span><br style="color:rgb(0,0,0);font-size:12px"><span style="color:rgb(0,0,0);font-size:12px">State University of New York</span></font></span><div><span style="font-family:tahoma,sans-serif"><a href="http://mushroomobserver.org/observer/show_user/181" target="_blank">MushroomObserver</a> : <a href="https://www.researchgate.net/profile/Daniel_Newman10" target="_blank">ResearchGate</a></span><br></div></div></div></div></div></div></div></div></div></div></div></div></div></div>
</div>