魔域私服001my辅助6.6版Mdict词典DIY工具系列之三:MDX文本内容提取解析工具

本帖最后由 qiuhao1112 于 2016-8-9 21:35 编辑 8 [; z8 W& v9 M( j7 v

) q+ t" B) W- rMdict词典DIY工具系列之三:MDX文本内容提取解析工具
. Z9 E8 }8 b2 u5 m: l9 O% g6 e8 w! t) {6 H+ K* T$ ~/ ^0 e0 u
0 [4 N) n5 ^/ h" u+ z8 x: d
* H) l$ H9 T; V
基于html网页解析,魔域私服001my辅助6.6版专用于MDX文本解析并自动生成MDX格式文本,生成的文件可直接压缩打包成词典;0 U) V  y8 D% {1 y$ s1 \" H$ h
此工具可用来提取词典内容中的特定内容并,比如短语提取,音标提取等一切你想提取的内容。4 T+ ^' \1 R! Y" [, F, A9 V8 e

- q- M8 H; C% @) x/ }& P
/ X! q+ z, R3 v7 N/ M) q4 U用法:9 u5 }8 _1 Q7 [& G% T

# B/ _, T0 f! L' U比如下面这个网页标签:
) D$ ~1 o7 m( |3 ^* E: b" u% ]4 a3 I% S- k9 v
<div class="explanation_item" id="d1234">
9 y+ V7 g+ M4 b7 S/ d- u4 d2 d7 T  D) F7 p5 o. \2 |5 G  R
) S. T5 A2 ]0 q+ p
标签名为  div6 A- Y5 L% o+ u2 z, A7 D
属性 有 class 和 id (还可能有别的属性)( C8 n* ]6 X* l4 E3 G+ }( X
其属性对应的值:class的是explanation_item ,  id 的是d1234;
0 p( ]3 a- B4 D  s5 e. R$ N' p6 _# J" u
) i% ^" K5 i  l6 O6 @, Y
若想提取这个标签的内容:
; k0 Z: }7 }8 h4 N5 b( ~2 P& J5 G7 p9 {  R5 N, e6 ^
需要输入三个值:div,class,explanation_item
- N- a4 g! c* C9 W8 E* `4 w/ _  Q          或者:div,id,d1234 : R) P) P$ e; a  t7 g0 o- j
7 c: s# M3 r. K. X
还有可能只有标签名,比如<body>这个标签,那么在(tag_name)输入框输入:body,其余不两项不用输入,直接回车即可
( e* e/ i1 _/ ^; Q! H6 z
* U5 I" o6 V+ K4 d5 F
& O) c/ s: S; L# g5 P: Z
0 Y' N3 E% \' l  R; g输入方法:$ v6 i: _( z0 u

) U* R( ~2 }" Q* }        Input source file name:(你的MDX文本文件名)! W7 ~% b: I% I7 z/ k2 d, j5 ~
        Input tag-name:div8 _& P4 q: g+ c+ j1 r% ]
        Input tag-attribute:class, T( E2 N" ~& x$ X* A8 Z7 J! r
        Input attribute-value:explanation_item1 R; R/ m2 F+ m- ?
# H7 f1 ?* Z8 g

7 j& A  {0 s2 C& V7 q        Input source file name:(你的MDX文本文件名)
+ T1 ^* l7 q  b: ], {& ~3 N& v        Input tag-name:div
$ }; {1 @! g1 q* A. f0 @        Input tag-attribute:id- ]5 o: {; c" m& J) s, k
        Input attribute-value:d1234  b5 W3 R; W, f- X: K9 [

- B# J. k4 [% b1 d0 C如果没有属性,比如body
. L" A3 b  }* m" v9 R. j" z& S  P: S2 F
        Input source file name:(你的MDX文本文件名)
7 g% w9 o' \7 e1 p$ t4 `        Input tag-name:body
( G4 H# q- g3 _9 ^. U( D        Input tag-attribute:(不输入,回车跳过)
; s. e' ]7 A# q' F) U9 x        Input attribute-value:(不输入,回车跳过)
1 V1 e" q- A' ?& e. \" Y! t7 Y& ]2 W
        OK。。。。
3 A6 {% m# `9 s1 L1 D' O
1 p- V. H2 x  f! X4 x% p! W; X5 m1 P- H# M- \; Z
7 z, U- ~9 A) [4 C' y  R1 `

8 ?( B  H3 ]! {/ f1 ^. Z由于是逐个解析html, 所以速度不是那么快,但使用足够简便,很方便。/ u8 A0 g* ^& a/ x9 _6 F
! V) q, i# D& S2 d
 

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?免费注册

2025-07-05 15:59 点击量:3