159 lines
15 KiB
Plaintext
159 lines
15 KiB
Plaintext
[1;34m<mediawiki[0m[1;30m [0m[1;33mxmlns=[0m[1;32m"http://www.mediawiki.org/xml/export-0.8/"[0m[1;30m [0m[1;33mxmlns[0m[1;30m:[0m[1;33mxsi=[0m[1;32m"http://www.w3.org/2001/XMLSchema-instance"[0m[1;30m [0m[1;33mxsi[0m[1;30m:[0m[1;33mschemaLocation=[0m[1;32m"http://www.mediawiki.org/xml/export-0.8/ http://www.mediawiki.org/xml/export-0.8.xsd"[0m[1;30m [0m[1;33mversion=[0m[1;32m"0.8"[0m[1;30m [0m[1;33mxml[0m[1;30m:[0m[1;33mlang=[0m[1;32m"en"[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Optional global configuration info -->[0m[1;37m
|
||
[0m[1;34m<siteinfo[0m[1;34m>[0m[1;37m
|
||
[0m[1;30m<!-- Site name, as set in $wgSitename -->[0m[1;37m
|
||
[0m[1;34m<sitename[0m[1;34m>[0m[1;37mDemoWiki[0m[1;34m</sitename[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Forgot where you got this set? -->[0m[1;37m
|
||
[0m[1;34m<base[0m[1;34m>[0m[1;37mhttp://example.com/wiki/Main_Page[0m[1;34m</base[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Source software version -->[0m[1;37m
|
||
[0m[1;34m<generator[0m[1;34m>[0m[1;37mMediaWiki 1.20[0m[1;34m</generator[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Title case sensitivity options of the wiki this data came from -->[0m[1;37m
|
||
[0m[1;30m<!-- May be 'first-letter', 'case-sensitive', or 'case-insensitive' -->[0m[1;37m
|
||
[0m[1;34m<case[0m[1;34m>[0m[1;37mfirst-letter[0m[1;34m</case[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Defined namespace keys on the source wiki. -->[0m[1;37m
|
||
[0m[1;34m<namespaces[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"-2"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mMedia[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"-1"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mSpecial[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"0"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;30m [0m[1;34m/[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"1"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mTalk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"2"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mUser[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"3"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mUser talk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"4"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mDemoWiki[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"5"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mDemoWIki talk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"6"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mFile[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"7"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mFile talk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"8"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mMediaWiki[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"9"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mMediaWiki talk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"10"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mTemplate[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"11"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mTemplate talk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"12"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mHelp[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"13"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mHelp talk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"14"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mCategory[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<namespace[0m[1;30m [0m[1;33mkey=[0m[1;32m"15"[0m[1;30m [0m[1;33mcase=[0m[1;32m"first-letter"[0m[1;34m>[0m[1;37mCategory talk[0m[1;34m</namespace[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</namespaces[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</siteinfo[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- The rest of the data will be a series of page records -->[0m[1;37m
|
||
[0m[1;34m<page[0m[1;34m>[0m[1;37m
|
||
[0m[1;30m<!-- Titles are listed here in text form, with namespace prefix -->[0m[1;37m
|
||
[0m[1;30m<!-- if any, and spaces rather than the underscores used in URLs. -->[0m[1;37m
|
||
[0m[1;34m<title[0m[1;34m>[0m[1;37mPage title[0m[1;34m</title[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Namespace in canonical form -->[0m[1;37m
|
||
[0m[1;34m<ns[0m[1;34m>[0m[1;37m0[0m[1;34m</ns[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- The page's immutable page_id number in the source database. -->[0m[1;37m
|
||
[0m[1;30m<!-- Page ID numbers are kept across page moves, but may change -->[0m[1;37m
|
||
[0m[1;30m<!-- if a page is deleted and recreated. -->[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m1[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Tag wether this article is a redirect and its target -->[0m[1;37m
|
||
[0m[1;30m<!-- This corresponds to the page_is_redirect in the page table -->[0m[1;37m
|
||
[0m[1;34m<redirect[0m[1;30m [0m[1;33mtitle=[0m[1;32m"Target"[0m[1;30m [0m[1;34m/[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- If restricted, the ACL is listed here raw. -->[0m[1;37m
|
||
[0m[1;34m<restrictions[0m[1;34m>[0m[1;37medit=sysop:move=sysop[0m[1;34m</restrictions[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- With a series of revision records... -->[0m[1;37m
|
||
|
||
[0m[1;30m<!-- Remember this is XML; if you must use a regex-based extractor -->[0m[1;37m
|
||
[0m[1;30m<!-- in place of a standard XML parser, be very careful. -->[0m[1;37m
|
||
[0m[1;30m<!-- * Don't forget to decode character entities! -->[0m[1;37m
|
||
[0m[1;30m<!-- * If using a 'loose' XML parser, ensure that whitespace is -->[0m[1;37m
|
||
[0m[1;30m<!-- preserved in the <text> elements. -->[0m[1;37m
|
||
[0m[1;34m<revision[0m[1;34m>[0m[1;37m
|
||
[0m[1;30m<!-- Unique revision ID number (rev_id) in the source database. -->[0m[1;37m
|
||
[0m[1;30m<!-- This number uniquely identifies the revision on that wiki. -->[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m100[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;30m<!-- revision id of the parent revision -->[0m[1;37m
|
||
[0m[1;34m<parentid[0m[1;34m>[0m[1;37m99[0m[1;34m</parentid[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<timestamp[0m[1;34m>[0m[1;37m2001-01-15T13:15:00Z[0m[1;34m</timestamp[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<username[0m[1;34m>[0m[1;37mFoobar[0m[1;34m</username[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m42[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<minor[0m[1;30m [0m[1;34m/[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<comment[0m[1;34m>[0m[1;37mI have just one thing to say![0m[1;34m</comment[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<text[0m[1;30m [0m[1;33mxml[0m[1;30m:[0m[1;33mspace=[0m[1;32m"preserve"[0m[1;30m [0m[1;33mbytes=[0m[1;32m"25"[0m[1;34m>[0m[1;37mA bunch of [[text]] here.[0m[1;34m</text[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<sha1[0m[1;34m>[0m[1;37m5x0ux8iwjrbmfzgv6pkketxgkcnpr7h[0m[1;34m</sha1[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<model[0m[1;34m>[0m[1;37mwikitext[0m[1;34m</model[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<format[0m[1;34m>[0m[1;37mtext/x-wiki[0m[1;34m</format[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</revision[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;34m<revision[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m99[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<timestamp[0m[1;34m>[0m[1;37m2001-01-15T13:10:27Z[0m[1;34m</timestamp[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<ip[0m[1;34m>[0m[1;37m10.0.0.2[0m[1;34m</ip[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<comment[0m[1;34m>[0m[1;37mnew![0m[1;34m</comment[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<text[0m[1;30m [0m[1;33mxml[0m[1;30m:[0m[1;33mspace=[0m[1;32m"preserve"[0m[1;30m [0m[1;33mbytes=[0m[1;32m"24"[0m[1;34m>[0m[1;37mAn earlier [[revision]].[0m[1;34m</text[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<sha1[0m[1;34m>[0m[1;37metaxt3shcge6igz1biwy3d4um2pnle4[0m[1;34m</sha1[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<model[0m[1;34m>[0m[1;37mwikitext[0m[1;34m</model[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<format[0m[1;34m>[0m[1;37mtext/x-wiki[0m[1;34m</format[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</revision[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</page[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;34m<page[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<title[0m[1;34m>[0m[1;37mTalk:Page title[0m[1;34m</title[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<ns[0m[1;34m>[0m[1;37m1[0m[1;34m</ns[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m2[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<revision[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m101[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<timestamp[0m[1;34m>[0m[1;37m2001-01-15T14:03:00Z[0m[1;34m</timestamp[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<contributor[0m[1;34m>[0m[1;34m<ip[0m[1;34m>[0m[1;37m10.0.0.2[0m[1;34m</ip[0m[1;34m>[0m[1;34m</contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<comment[0m[1;34m>[0m[1;37mhey[0m[1;34m</comment[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<text[0m[1;30m [0m[1;33mxml[0m[1;30m:[0m[1;33mspace=[0m[1;32m"preserve"[0m[1;30m [0m[1;33mbytes=[0m[1;32m"47"[0m[1;34m>[0m[1;37mWHYD YOU LOCK PAGE??!!! i was editing that jerk[0m[1;34m</text[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<sha1[0m[1;34m>[0m[1;37mml80vmyjlixdstnywwihx003exfzq9j[0m[1;34m</sha1[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<model[0m[1;34m>[0m[1;37mwikitext[0m[1;34m</model[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<format[0m[1;34m>[0m[1;37mtext/x-wiki[0m[1;34m</format[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</revision[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</page[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;34m<page[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<title[0m[1;34m>[0m[1;37mFile:Some image.jpg[0m[1;34m</title[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<ns[0m[1;34m>[0m[1;37m6[0m[1;34m</ns[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m3[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<revision[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m102[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<timestamp[0m[1;34m>[0m[1;37m2001-01-15T20:34:12Z[0m[1;34m</timestamp[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<contributor[0m[1;34m>[0m[1;34m<username[0m[1;34m>[0m[1;37mFoobar[0m[1;34m</username[0m[1;34m>[0m[1;34m<id[0m[1;34m>[0m[1;37m42[0m[1;34m</id[0m[1;34m>[0m[1;34m</contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<comment[0m[1;34m>[0m[1;37mMy awesomeest image![0m[1;34m</comment[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<text[0m[1;30m [0m[1;33mxml[0m[1;30m:[0m[1;33mspace=[0m[1;32m"preserve"[0m[1;30m [0m[1;33mbytes=[0m[1;32m"52"[0m[1;34m>[0m[1;37mThis is an awesome little imgae. I lurves it. {{PD}}[0m[1;34m</text[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<sha1[0m[1;34m>[0m[1;37mmehom37npwkpzhaiwu3wyr0egalumki[0m[1;34m</sha1[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<model[0m[1;34m>[0m[1;37mwikitext[0m[1;34m</model[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<format[0m[1;34m>[0m[1;37mtext/x-wiki[0m[1;34m</format[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</revision[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<upload[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<timestamp[0m[1;34m>[0m[1;37m2001-01-15T20:34:12Z[0m[1;34m</timestamp[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<contributor[0m[1;34m>[0m[1;34m<username[0m[1;34m>[0m[1;37mFoobar[0m[1;34m</username[0m[1;34m>[0m[1;34m<id[0m[1;34m>[0m[1;37m42[0m[1;34m</id[0m[1;34m>[0m[1;34m</contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<comment[0m[1;34m>[0m[1;37mMy awesomeest image![0m[1;34m</comment[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<filename[0m[1;34m>[0m[1;37mSome_image.jpg[0m[1;34m</filename[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<src[0m[1;34m>[0m[1;37mhttp://upload.wikimedia.org/commons/2/22/Some_image.jpg[0m[1;34m</src[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<size[0m[1;34m>[0m[1;37m12345[0m[1;34m</size[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</upload[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</page[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;30m<!-- or a series of logitem records, but normaly page and logitem never exist both in one file -->[0m[1;37m
|
||
[0m[1;34m<logitem[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m15[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<timestamp[0m[1;34m>[0m[1;37m2008-10-23T03:20:32Z[0m[1;34m</timestamp[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<username[0m[1;34m>[0m[1;37mWikimedian[0m[1;34m</username[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<id[0m[1;34m>[0m[1;37m12345[0m[1;34m</id[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</contributor[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<comment[0m[1;34m>[0m[1;37mcontent was: 'I think this was a silly edit'[0m[1;34m</comment[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<type[0m[1;34m>[0m[1;37mdelete[0m[1;34m</type[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<action[0m[1;34m>[0m[1;37mdelete[0m[1;34m</action[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<logtitle[0m[1;34m>[0m[1;37mSilly page name[0m[1;34m</logtitle[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m<params[0m[1;30m [0m[1;33mxml[0m[1;30m:[0m[1;33mspace=[0m[1;32m"preserve"[0m[1;30m [0m[1;34m/[0m[1;34m>[0m[1;37m
|
||
[0m[1;34m</logitem[0m[1;34m>[0m[1;37m
|
||
|
||
[0m[1;34m</mediawiki[0m[1;34m>[0m[1;37m
|
||
[0m
|