怎么按照一定的规则把word转成exacl?



如图:把“word中的标题样式文本”转入“excel中的A列”,把“word中隶属于标题的内容”转入“excel中的该行B列”‘
主要是为了好做词典,用exceltotxt直接转成作mdxbuilder所需的格式。当然,如果有其他的方法能把word(能用来区分不同的词条的只有是否是标题)自动转成了mdxbuilder所需的格式也可以。

可以把word另存为html,再用文本编辑器打开改改标签,就可以

这个方法文本量比较大不会特别卡吧。这个有好几百万字,而且分页的话也不是很好办。

你不是做成mdx吗,怎么还要分页。emeditor这个文本编辑器,多大的文件都不会卡

我想成epub了,epub是有“分页”的,会想卡不卡主要是word处理这个文件特别卡。

噢,我看你问的是转成mdx,epub不太懂

因为epub也是hmtl,我就觉得这两可能会有一样的问题。

我有点被你搞晕了,你手头上有什么,看你主题描述好像你是有word
版本的内容,你不都已经在word里打开了,那还有什么问题,转成html之后就更不会有什么问题了

没什么问题,就是想吐槽一下,抱歉 :joy:

我第一次作文字词典,很多地方不懂,可能问出了些蠢问题,这里就先道个歉。

那倒不用,你的需求不明确,新手倒也正常,你可以描述更详细点,


请问该如何转成可用emeditor编辑的html?
word自带的这三个我都试了,转出来的html直接放到emeditor里都不行。

应该都可以吧,怎么个不行,或者你转完之后把后缀改成.txt,再打开


原本的html直接放emeditor里打开会这样

可以用浏览器打开,没有问题。

改成txt后缀后是这样的,和emeditor打开一样。

而且不知道为什么连我个人的一些word账户信息也跑出来了。

就是这样的,word转出来的网页文件是会带很多信息的,无关的都可以删掉,保留你需要的标题,内容,以及相应的标签,就可以了

1 个赞

没问题,大部分其实都是字体信息你仔细观察就能发现,如果你会点正则表达式很容易处理

1 个赞

那我去学一下正则表达式吧,以前只用替换处理过epub,效果不是很好,因为之后几乎不多也就没想起来学正则表达式,现在去学一下吧。

excel的单元格不是无限的,有字符限制的啦。

直接折腾代码的话,看说的东西,也没啥编程基础。这么着吧,你自己查查啥叫格式刷,自己定义好格式刷,给标题台头啥的,中间多塞几个回车,或者干脆就给标题台头啥的回车变成tab,总之是一切你自己能接受还能区分开来的东西,你所需要的东西,界定符设定好了的话,直接在Excel里导入。应该现在的excel里文本导入的话,可以指定分隔符。注意在导入之前,给excel的单元格格式人为手动先设置成文本格式的,免得一些噶咕字符在默认的公式状态下生成的东西,闹眼睛。

1 个赞