投稿指南
一、本刊要求作者有严谨的学风和朴实的文风,提倡互相尊重和自由讨论。凡采用他人学说,必须加注说明。 二、不要超过10000字为宜,精粹的短篇,尤为欢迎。 三、请作者将稿件(用WORD格式)发送到下面给出的征文信箱中。 四、凡来稿请作者自留底稿,恕不退稿。 五、为规范排版,请作者在上传修改稿时严格按以下要求: 1.论文要求有题名、摘要、关键词、作者姓名、作者工作单位(名称,省市邮编)等内容一份。 2.基金项目和作者简介按下列格式: 基金项目:项目名称(编号) 作者简介:姓名(出生年-),性别,民族(汉族可省略),籍贯,职称,学位,研究方向。 3.文章一般有引言部分和正文部分,正文部分用阿拉伯数字分级编号法,一般用两级。插图下方应注明图序和图名。表格应采用三线表,表格上方应注明表序和表名。 4.参考文献列出的一般应限于作者直接阅读过的、最主要的、发表在正式出版物上的文献。其他相关注释可用脚注在当页标注。参考文献的著录应执行国家标准GB7714-87的规定,采用顺序编码制。

浅谈题库试题录入之Word自动识别

来源:试题与研究 【在线投稿】 栏目:综合新闻 时间:2021-09-07 11:36
作者:网站采编
关键词:
摘要:编者按:题库的入口对题库的质量和数量具有重要意义。 Word 文件导入是一种更高效的输入方法。本文将重点介绍自动Word文件识别的具体实现方法。一起来学习吧~ 1.前言 说是核心功能

编者按:题库的入口对题库的质量和数量具有重要意义。 Word 文件导入是一种更高效的输入方法。本文将重点介绍自动Word文件识别的具体实现方法。一起来学习吧~

1.前言

说是核心功能,直接关系到题库的质量和数量。录入功能是否有效直接影响题库中题的数量,也决定了题的质量。

目前主要的录入方式是手工录入和文件导入,文件导入格式主要是Word和Excel。手工录入和Excel文件导入这两种录入方式,效率低下,用公式处理试题很麻烦。 Word文件导入的录入方式在效率上胜过前两种,而且对公式也有很好的兼容性。

本文将重点介绍自动识别Word文件的具体实现方法。

二、文档转换工具的选择

word解析首先需要将其转换成题库要求的格式,然后选择的转换工具将是整个过程的关键文件识别。

在比较了 Word2LaTeX、Pandoc 以及各种语言自带的模块和库之后,我选择 Pandoc 作为 Word 文件分析的工具。选择的原因是它是开源的,支持多种格式。

Pandoc 被称为转换领域的“瑞士军刀”。可以支持大量标记语言之间的格式转换,如Markdown、Microsoft Word、PowerPoint、Jupyter Notebook、HTML、PDF、LaTeX、Wiki、EPUB格式之间的互转,感兴趣的朋友可以去官网了解。

识别效果展示

六.总结

在整个项目中,从一开始的技术选择、工具选择、迭代优化,到实现录题效率的大幅度提升,经历了很多困难。项目之初,一头雾水,找不到突破方向。包括后期的效率提升,时间和业绩的压力让内部人员动摇。每个人都在怀疑它是否能够实现。但我知道,这个功能一旦实现,将为教研教师节省很大一部分时间,所以它的价值不言而喻。

为了让Word自动识别达到良好的排版效果,接近Word原有的排版风格,需要对细节有严格的要求。中间的难点就是要有耐心,稍微冷静一下。发现和征服,借用曾国藩的话就是“强村,打发呆”。的确,没有这种强硬的态度,创新是不可能实现的。

这里和大家分享一下这个功能的实现。希望能给对Word自动识别感兴趣的朋友一些帮助,也希望大家一起讨论。

本文最初由@一诉酸奶发表在大家都是产品经理,未经许可,禁止转载

标题图片来自Unsplash,基于CC0协议

文章来源:《试题与研究》 网址: http://www.styyjzz.cn/zonghexinwen/2021/0907/1876.html



上一篇:淘宝、天猫客服考试试题和答案
下一篇:六年级语文上册第一单元卷,试题多样,与期末

试题与研究投稿 | 试题与研究编辑部| 试题与研究版面费 | 试题与研究论文发表 | 试题与研究最新目录
Copyright © 20019-2020 试题与研究 版权所有
投稿电话: 投稿邮箱: