讨论 使用交流 OCR引擎自动抽取文档文字信息, 全存储主表,这个比较严重问题啊

OCR引擎自动抽取文档文字信息, 全存储主表,这个比较严重问题啊

fkenuiabcd 发表于    阅读:98    回复:3


OCR引擎自动抽取文档文字信息,所有都存在了 这个主表里面  wenku_doc   这样设置不太合理呀。 数据很小没问题,文库数据量大了。就会超级慢了。

OCR引擎自动抽取文档文字信息 这个功能刚更新的,用的人也不多,做为 文本预览   个人建议增加一个新表用来存放这个信息。





评论

海量数据后期会开启es等专用搜索引擎。

 

@ModStart: 前期做好计划不好吗?现在图片这么多了,还把内容全部放在一起,

 

@fkenuiabcd: 不会影响的,参考题库,不同阶段有每个阶段的任务,会做成插件方式同步的,用户是可选的,启用会为用户造成成本,不启动可以让用户以最小成本启动

 
1
我来评论
QQ
微信