도움말:내보내기

Help:Export

Wiki 페이지는 특수한 XML 형식으로 내보내 다른 MediaWiki 설치로 가져오거나 콘텐츠 분석에 다른 방법으로 사용할 수 있다.참고 항목 m:페이지를 제외한 다른 모든 정보를 내보내기 위한 Syndication 피드(신디케이션 피드) 및 도움말:페이지 가져오기 시 가져오기.

수출방법

페이지를 내보내는 방법에는 최소한 6가지가 있다.

  • 특수: 상자의 상자에 기사 이름 붙여넣기:https://en.wikipedia.org/wiki/Special:Export/FULLPAGENAME을 내보내거나 사용하십시오.
  • 사용하다action=raw. (이러한 내용은 아래에 설명된 XML 형식이 아닌 페이지의 Wikitext만 가져옵니다).예: https://en.wikipedia.org/w/index.php?title=Wikipedia&action=raw ..사용하는 것이 중요하다./w/index.php?title=PAGENAME&action=raw아닌 것 같다/wiki/PAGENAME?action=raw(Phab T126183 참조)
  • API를 사용하여 XML 또는 JSON 패키징으로 데이터 가져오기
  • 백업 스크립트Dumpbackup.php는 모든 위키 페이지를 XML 파일에 덤프한다.dumpBackup.php는 MediaWiki 1.5 이상에서만 작동한다.이 스크립트를 실행하려면 서버에 직접 액세스할 수 있어야 한다.미디어위키 프로젝트 덤프는 http://download.wikipedia.org에서 정기적으로 제공된다.자세한 내용은 http://www.mediawiki.org/wiki/Manual:DumpBackup.php을 참조하십시오.
  • 특정 시간 이후 수정된 페이지를 정기적으로 가져오는 OAI-PMH 인터페이스가 있다.Wikimedia 프로젝트의 경우 이 인터페이스는 공개적으로 사용할 수 없다.OAI-PMH에는 실제 수출된 물품에 대한 포장지 형식이 포함되어 있다.
  • Python Wikipedia 로봇 프레임워크를 사용하십시오.이것은 여기서 설명되지 않을 것이다.

기본적으로 페이지의 현재 버전만 포함된다.선택적으로 날짜, 시간, 사용자 이름 및 편집 요약을 포함한 모든 버전을 가져올 수 있다.

또한 SQL 데이터베이스를 복사할 수 있다.이것이 미디어위키 1.5 이전에 데이터베이스 덤프가 사용 가능하게 된 방법이며 여기서 더 이상 설명되지 않을 것이다.

'Special(특수 사용:수출'

를 들어 네임스페이스의 모든 페이지를 내보내려면 다음과 같이 하십시오.

1. 내보낼 페이지 이름 가져오기

  • 스페셜로 이동:모든 페이지를 선택하고 원하는 네임스페이스를 선택하십시오.
  • 페이지 이름 목록을 텍스트 편집기로 복사
  • 모든 페이지 이름을 별도의 줄에 표시
  • 네임스페이스에 페이지 이름을 접두사 지정(예: '도움말:선택한 네임스페이스가 기본 네임스페이스가 아닌 경우 '내용')

2. 내보내기 수행

  • 스페셜로 이동:모든 페이지 이름을 내보내고 텍스트 상자에 붙여넣어 빈 줄이 없는지 확인하십시오.
  • '쿼리 제출' 클릭
  • 브라우저의 저장 기능을 사용하여 결과 XML을 파일에 저장하십시오.

그리고 마침내...

  • 텍스트 편집기에서 XML 파일을 여십시오.오류 메시지를 확인하려면 아래쪽으로 스크롤하십시오.

이제 이 XML 파일을 사용하여 가져오기를 수행할 수 있다.

전체 기록 내보내기

Special:의 확인란:내보내기 인터페이스는 전체 기록(기사의 모든 버전)을 내보낼지 또는 최신 버전의 기사를 내보낼지를 선택한다.최대 1000개의 리비전이 반환되며 MW:Parameters to Special:수출하다.

내보내기 형식

당신이 받는 XML 파일의 형식은 모든 면에서 동일하다.이 형식은 http://www.mediawiki.org/xml/export-0.6.xsd에서 XML 스키마로 코드화된다.일부 브라우저에서는 선택된 부품을 보거나 숨기기 위해 "+" 및 "-" 링크가 있는 예쁜 인쇄 XML을 볼 수 있지만 이 형식은 웹 브라우저에서 보기 위한 것이 아니다.또는 브라우저의 "보기 소스" 기능을 사용하거나 XML 파일을 로컬로 저장한 후 원하는 프로그램을 사용하여 XML 소스를 볼 수 있다.XML 원본을 직접 읽으면 실제 위키텍스트를 찾기가 어렵지 않을 것이다.특수 XML 편집기 "<"와 ">"가 &lt; 및 &gt;로 나타나 XML 태그와의 충돌을 피하고 모호성을 피하기 위해 "&amp;"가 "&amp;"로 코드화된다.

현재 버전에서 내보내기 형식은 위키 마크업을 대체하는 XML을 포함하지 않는다(이전 제안서는 위키백과 DTD, 또는 위키 마크업 언어 참조).기사를 편집할 때 얻은 Wikitext만 얻을 수 있다. (내보낸 후 대체 파서를 사용하여 Wikitext를 다른 형식으로 변환할 수 있음)

<>mediawiki xml:lang="en">, <, page>,<>title>.페이지 title<, /title>,>!--페이지 네임 스페이스 코드가--><>ns>, 0<, /ns>,<>id>, 2<, /id>,>!만약 페이지는 리디렉션--, 소자"전용하다"을에 페이지 리다이렉트의 제목 포함하는<>title="Redirect페이지 제목"/&gt를 리디렉션 하고,<>restrictions>, edit=sysop:move=sysop<, /restrictions>, < 수정 번호><>timestamp>2.001-01-15T13:15:00Z<, /timestamp>.<<contributor>> <username>Foobar</username> 65536 </d> <코멘트>딱 한 가지 할 말이 있어!</comment> <텍스트> 여기 [[텍스트] 한 뭉치.</text> <minor /> </revision> <timestamp>2001-01-15T13:10:27Z <timestamp> <10.0.2</ip> </commention> new!</본문>좀 더 이른[개정].</텍스트> <<!>-- 삭제된 개정 예시 --> 4557485 </id> <parentid> 1243372 </parentid> 2010-06-24T02:40:22Z </timestamp> <논문 삭제="삭제" /><모델>위키텍스트</model><format>text/x-wiki</format><text 삭제="text 삭제" /><sha1/</revision></페이지 <제목토크:페이지 제목</제목>2001-01-15T14:00Z</timestamp><10.0.0.2</ip></comment> <텍스트>페이지 잠근 이유!!!!! 그 얼간이를 편집하고 있었어. </페이지> </미디어위키>./페이지> </미디어위키>

DTD

다음은 비공식적이고 짧은 문서 유형 정의 버전의 형식이다.DTD가 뭔지 모른다면 그냥 무시해버려.

<!Element mediawiki (siteinfo?, 페이지*)> <!--버전에는 형식(현재 0.3) -->의 버전 번호가 포함되어 있다. <!ATTLIST 미디어위키 버전 CDATA #필수 사항 xmlns CDATA #FIXED "http://www.mediawiki.org/xml/export-0.3/" xmlns:xsi CDATA #FIXED "http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation CDATA #FIXED "http://www.mediawiki.org/xml/export-0.3/ http://www.mediawiki.org/xml/export-0.3.xsd" > <!Element siteinfo (sitename, base, generator, case, namespaces)> <!Element sitename (#PCDATA)>      <!--위키의 이름 --> <!Element base (#PCDATA)>          <!-- 메인 페이지의 url --> <!Element generator (#PCDATA)>     <!-- MediaWiki 버전 문자열 --> <!Element case (#PCDATA)>          <!-- 페이지 이름의 케이스 처리 방법 ->    <!- 가능한 값: '첫 글자' '대소문자 구분' 'case-contraction' 옵션은 미래를 위해 예약되어 있음 -> <!Element 네임스페이스(namesspace+)> <!-- 네임스페이스와 접두사 리스트 -->   <!Element 네임스페이스(#PCDATA)>     <!-- 네임스페이스 접두사를 포함함 -->   <!ATTLIST 네임스페이스 키 CDATA #필수 > <!-- 내부 네임스페이스 번호 --> <!Element 페이지(제목,id?,제한?,(개정 업로드)*)>   <!Element 제목(#PCDATA)>         <!-- 네임스페이스 접두사가 있는 제목 -->   <!Element ID (#PCDATA)>    <!Element Restrictions (#PCDATA)>  <!-- 선택적 페이지 제한 --> <!Element revision (id?, timestamp, contractor, minor?, comment, text)>   <!Element 타임스탬프(#PCDATA)>     <!-- ISO8601 -->에 따르면   <!Element 마이너 비우기>             <!-- 마이너 플래그 -->   <!Element comment (#PCDATA)>    <!Element 텍스트(#PCDATA)>          <!-- Wikisyntax -->   <!ATTLIST 텍스트 xml:space CDATA #FIXED "보존" > <!Element 기여자((username,id) ip)>   <!Element 사용자 이름(#PCDATA)>   <!Element ip (#PCDATA)> <!Element 업로드(timestamp, contractor, comment?,filename,src,size)>   <!Element 파일 이름(#PCDATA)>   <!Element src (#PCDATA)>   <!Element size(#PCDATA)> 

XML 내보내기 처리 중

많은 도구들이 내보낸 XML을 처리할 수 있다. 만약 당신이 많은 페이지(예를 들어 전체 덤프)를 처리한다면, 당신은 아마도 문서를 메인 메모리에 저장하지 못할 것이다. 그래서 당신은 색스나 다른 이벤트 중심적인 방법에 기초한 파서가 필요할 것이다.

정규식을 사용하여 XML 코드의 일부를 직접 처리할 수도 있다.이것들은 빨리 달렸지만 유지하기가 어렵다.

XML 내보내기를 처리하는 방법 및 도구를 여기에 나열하십시오.

세부사항 및 실제 조언

  • 페이지의 네임스페이스를 확인하려면 페이지의 제목을 에 정의된 접두사와 일치시켜야 함

/mediawiki/siteinfo/namespaces/messages

  • 가능한 제한사항은
    • sysop(보호된 페이지)

참고 항목

위키백과별 도움말