需求:
1、從PDF中,自動識別出版面圖的每一個文本塊,并分別提取每一個文本區(qū)域的標題、文字和圖片并組成完整的且沒有錯誤的文章,同時還要有該文本塊相應的坐標和尺寸大小,坐標會在map area coords中來使用的;
2、要有相應的api接口,方便其它系統(tǒng)和程序進行調用處理;
3、最終效果可以查看:68747470733a2f2f6462736478622e696877726d2e636f6d/;
4、PDF另行提供;
歡迎有這方面經驗的開發(fā)者,無這種開發(fā)經難的勿擾!
途傲科技為中小企業(yè)提供網站制作、網站建設、微信H5、微信小程序,多商戶平臺,多級分銷系統(tǒng),APP開發(fā),手機網站,HTML5多端自適應網站,營銷型企業(yè)站建設,及對技術人才的培養(yǎng)等都積累與沉淀了豐富的心得和實戰(zhàn)經驗。
如果您想定制同款軟件,可以將需求提交給我們【免費提交需求,獲取解決方案】
免責聲明:文章部分內容收集于互聯(lián)網,不代表本站的觀點和立場,如有侵權請聯(lián)系刪除。