用於從原始維琪百科資料庫備份轉儲創建和處理 XML 語料庫(用於語言目的的大量文本集合)的 python 文本集合。它包括 MediaWiki 標籤語言的基於正則表達式的解析器。
版本歷史記錄
- 版本 0.1 發佈於 2008-04-01
若干修復和更新 - 版本 0.1 發佈於 2008-04-01
軟體細節
- 軟體分類: 教育 > 其他
- 發佈者: wikipedia2xml.sf.net
- 軟體性質: 免費
- 價格: N/A
- 版本: 0.1
- 作業系統: windows
用於從原始維琪百科資料庫備份轉儲創建和處理 XML 語料庫(用於語言目的的大量文本集合)的 python 文本集合。它包括 MediaWiki 標籤語言的基於正則表達式的解析器。