近期,第五届长沙·中国1024程序员节在湖南长沙举行。会上,合合信息面向广大开发者,开放智能文档处理“百宝箱”系列产品免费体验。“百宝箱”覆盖文档处理流程多节点,支持批量、高效、准确解析多种版式的文档材料,助力技术人员实现个性化、高效率的文档类应用开发工作。
文档处理包含解析界面可视化、提取关键信息、解析效果测评等多个流程,每一节点都影响着数据解析的精度。合合信息智能创新事业部研发总监常扬介绍了“百宝箱”三大产品,用维护稳定、持续更新、可用性强的AI工具帮助开发者解决难题。
据常扬介绍,对于广大技术人员而言,一款能够“开箱即用”的工具能够让开发事半功倍。为解决个人及中小型企业技术人员在开发过程中遇到的“水土不服”问题,发布了一组文档解析界面前端可视化组件,开发者可使用相关界面对解析效果进行交互,包括提取各类解析元素,定位解析元素在文档中的位置,还原展示各级目录树等。此外,相关组件还支持对结果进行编辑修正,方便使用者实现更高精度的解析效果,进行个性化开发。
此外,“百宝箱”还为文档解析工具的筛选配备了“游标卡尺”。当前市面上的文档解析产品效果缺乏统一标准,为选择一款合适的工具,开发者们要花费较长的时间进行对比测试。“文档解析测评工具”从表格、段落、标题、阅读顺序、公式等多维度,为文档解析工具筛选提供定量测评依据及服务,并提供雷达图等可视化形式,方便开发者直观地看到文本识别、解析和翻译的结果,节省筛选时间。