開發者 wikipedia2xml.sf.net

  • wikipedia2XML 免費

    用於從原始維琪百科資料庫備份轉儲創建和處理 XML 語料庫(用於語言目的的大量文本集合)的 python 文本集合。它包括 MediaWiki 標籤語言的基於正則表達式的解析器。