譯馬網完成架構升級,PDF解析取得突破進展


為給用戶提供更加極致的體驗以及優質的服務,譯馬網團隊經過1個多月的奮戰,已於2月26日順利完成架構優化升級,同時PDF解析取得重大突破併成功上線(含不可編輯的PDF)。

首先,譯馬網全新的架構設計著重優化性能,提升用戶體驗,不僅在文件解析、去重和導出方面都有較大的改善,平臺訪問速度、流暢性也有顯著的提升,還滿足了用戶的個性化需求,為快速打造企業專屬系統拓寬了道路。

其次,PDF是翻譯行業的一大難題,譯馬網團隊經過無數個日夜的努力,終於在PDF文件的解析上也取得了重大的突破,尤其是對不可編輯PDF文件的處理,文字識別更加精準可靠,通過AI智能算法對文檔進行分析,實現智能斷句處理,文檔識別效果大幅改善,實用性更高。目前PDF已上線進行公測。

下面,我們分別用ABBYY FineReader、Adobe Acrobat和譯馬網對同一個不可編輯的PDF文件進行識別,如下所示:

PDF原文件截圖:

譯馬網完成架構升級,PDF解析取得突破進展


ABBYY FineReader識別結果截圖:

譯馬網完成架構升級,PDF解析取得突破進展

ABBYY FineReader識別結果中個別文字識別錯誤,部分斷句與原文不符


Adobe Acrobat識別結果截圖:

譯馬網完成架構升級,PDF解析取得突破進展

Adobe Acrobat識別結果相對較好,但也存在個別文字識別錯誤,部分斷句與原文不符的情況


譯馬網識別結果截圖:

譯馬網完成架構升級,PDF解析取得突破進展

譯馬網識別結果效果最為理想,文字識別精準,僅一句斷句出現錯誤。

本篇僅個人測試結果,歡迎大家吐槽拍磚。


分享到:


相關文章: