분산된 교정자

Distributed Proofreaders
분산된 교정자
Distributed Proofreaders (logo).png
Screenshot of the proofreading interface on Distributed Proofreaders.
분산된 교정자의 교정 인터페이스 스크린샷.
사이트 유형
비영리
다음에서 사용 가능2개 언어
언어 목록
원산지미국
소유자분산된 교정자 재단
설립자찰스 프랭크스
총지배인린다 해밀턴
부모DPF(Distributed Profreaders Foundation)
URLwww.pgdp.net
상업적아니요.
등록선택적
시작됨2000; 22년 전(2000년)
현재 상태활동적인
콘텐츠 라이선스
공용 도메인
기록 위치PHP[1]
OCLC 번호1087497129

분산 교정자(일반적으로 DP 또는 PGDP로 약칭)는 많은 사람들이 오류에 대한 전자교과서의 교정초안에서 함께 작업할 수 있도록 하여 프로젝트 구텐베르크전자교과 개발을 지원하는 웹 기반 프로젝트다.2021년 3월 현재 이 사이트는 4만1000개의 타이틀을 디지털화했다.[2][3]

역사

분산된 교정자는 찰스 프랑크스가 프로젝트 구텐베르크의 지원을 위해 독립된 사이트로 2000년에 설립했다.[4]배포된 교정자들은 2002년에 프로젝트 구텐베르크 공식 사이트가 되었다.

2002년 11월 8일, 분산형 교정자가 슬래시 도트 처리되었고,[5][6] 하루 만에 4,000명 이상의 새로운 회원이 가입하여 새로운 교정자와 소프트웨어 개발자가 유입되어 전자 텍스트 생산의 양과 품질을 높이는 데 도움이 되었다.Distributed Proofreaders posted their 5,000th text to Project Gutenberg in October 2004, in March 2007, the 10,000th DP-produced e-text was posted to Project Gutenberg, in May 2009, the 15,000th DP-produced e-text was posted to Project Gutenberg, in April 2011, the 20,000th DP-produced e-text was posted to Project Gutenberg, and in July 2015, the3만번째 DP가 제작한 e-텍스트가 프로젝트 구텐베르크에 게시되었다.2015년 7월 현재, DP가 제공하는 전자 텍스트는 프로젝트 구텐베르크에서 절반 이상의 작품을 구성했다.

2006년 7월 31일, 분산형 교정자 재단은 분산형 교정자에게 자체의 법적 실체와 비영리적인 지위를 제공하기 위해 설립되었다.섹션 501(c)(3) 상태의 IRS 승인은 2006년 4월 7일로 소급되었다.

교정 프로세스

일반적으로 저작권이 만료된 책인 공공 도메인 작품은 자원 봉사자에 의해 스캔되거나 디지털화 프로젝트에서 소싱되며 이미지는 광학 문자 인식(OCR) 소프트웨어를 통해 실행된다.OCR 소프트웨어는 완벽과는 거리가 멀기 때문에 결과 텍스트에 많은 오류가 나타나는 경우가 많다.이를 바로잡기 위해 인터넷을 통해 자원봉사자들이 페이지를 이용할 수 있도록 하고 원본 페이지 이미지와 인식된 텍스트가 나란히 뜬다.[7]따라서 이 프로세스는 분산 컴퓨팅과 유사하게 시간이 많이 소요되는 오류 수정 프로세스를 분산시킨다.

각 페이지는 여러 번 교정되고 포맷된 다음, 포스트 프로세서가 페이지를 결합하여 프로젝트 구텐베르크에 업로드할 수 있도록 텍스트를 준비한다.

이 프로젝트를 지원하기 위해 만들어진 맞춤형 소프트웨어 외에도, DP는 프로젝트 코디네이터와 참가자들을 위한 포럼과 위키도 운영하고 있다.

관련 프로젝트

DP 유럽

2004년 1월 세르비아 라스트코 프로젝트 주최로 분산형 교정기 유럽이 시작되었다.[8]이 사이트는 유니코드 UTF-8 인코딩으로 텍스트를 처리할 수 있는 기능을 가지고 있다.히브리어, 아랍어, 우르두어 등 영어 이외의 문헌이 상당 부분 포함된 유럽 문화를 중심으로 책이 교정된다.2013년 10월 현재, DP 유럽은 787개의 e-텍스트를 생산하고 있으며, 2011년 11월 이 중 마지막 텍스트가 생산되었다.

원래의 DP는 때때로 DP 유럽 회원들에 의해 "DP International"이라고 불린다.그러나, DP 서버는 미국에 위치하고 있으므로, Project Gutenberg에 의해 미국 저작권법에 따라 공공영역에 있는 것으로 정리되어야만 비로소 저작물이 교정되고 결국 DP에서 출판될 수 있다.

DP 캐나다

2007년 12월, 캐나다 분산 교정자는 캐나다 프로젝트 구텐베르크의 전자책 제작을 지원하고, 캐나다 저작권 약관의 단축을 활용하기 위해 출범하였다.원래 분산형 교정자 사이트의 회원들에 의해 설립되었지만, 그것은 별개의 실체다.모든 프로젝트는 도서 보관 사이트인 빛바랜 페이지에 게시된다.또한, 프로젝트 구텐베르크 캐나다(2007년 캐나다 데이에서 개시)와 (저작권법이 호환되는) 원본 구텐베르크에 도서를 공급한다.

Canadiana 보존 외에도, DP Canada는 더 많은 작품들이 보존될 수 있는 캐나다의 저작권법을 이용하려는 첫 번째 주요 노력이기 때문에 주목할 만하다.다른 나라들의 저작권법과 달리, 캐나다는 "라이프 플러스 50" 저작권 용어를 가지고 있다.이것은 50년 이상 전에 죽은 작가들의 작품이 캐나다에서 보존될 수도 있다는 것을 의미하지만, 세계의 다른 지역에서는 여전히 저작권이 있기 때문에 그 작품들이 배포되지 않을 수도 있다는 것을 의미한다.

캐나다에서는 보존되지만 다른 지역에서는 보존되지 않는 유명한 작가로는 클라크 애슈턴 스미스, 데쉬엘 해멧, 어니스트 헤밍웨이, 칼 , A. A. 밀른, 도로시 세이어스, 네빌 슈트, 월터 드 라 마레, 쉴라 케이 스미스, 에이미 카마이클 등이 있다.

이정표

이정표 날짜 전자 텍스트 프로젝트 구텐베르크 연결 출처
먼저 2000년 10월 1일 오딧세이, 호머, 랭 tr. (교정을 위한 첫 페이지) etext 3059 [9]
천일천번째 2003년 2월 19일 테일즈 오브 세인트오스틴즈, P. G. 워드하우스 etext 6980
2,000번째 2003년 9월 3일 햄릿 — '나쁜 쿼터', 윌리엄 셰익스피어 etext 9077
3000번째 2004년 1월 14일 우울의 해부학, 로버트 버튼 etext 10800
사천일 2004년 4월 6일 아벤투스 뒤 카피테인 하테라스, 쥘 베른 etext 11927
5,000번째 2004년 8월 24일 영문학의 단편 인명사전, 존 윌리엄 사촌 etext 13240
6000번째 2005년 2월 2일 월터 스콧 경의 일지, 월터 스콧 etext 14860
칠천일 2005년 6월 23일 오푸스쿨로스 por 알렉산드르 헤르쿨라노(Vol.나), 알렉산드르 헤르쿨라노;
비아지 알 파르나소, 미겔세르반테스,
리아브라이앵 안 아이리스레아브헤어 III, Various.
etext 16111
etext 16110
etext 16122
8000번째 2006년 2월 8일 미국으로의 아프리카 노예 무역의 억압, 1638-1870, W. E. B. 두보이스 etext 17700
9천일 2006년 9월 8일 세계 인권 전쟁의 역사, 켈리 밀러;
시, 크리스티나 로세티;
Hey Diddle Diddle and Baby Bunting, 랜돌프 칼데콧
etext 19179
etext 19188
etext 19177
만번째 2007년 3월 9일 (아래 10,000번째 전자책 참조) 다양한
1만1000일 2007년 9월 12일 북부너트 재배자 협회 제34회 연차보고서 1943, 북부너트 재배자 협회 etext 22587
만 이천번째 2008년 1월 26일 지그문트 프로이드, 알타그슬레벤스 주르 사이코패스롤로지 데스 올타그슬레벤스 etext 24429
1만3천일 2008년 6월 24일 A World of Girls, L. T. Meade etext 25870
만사천일 2008년 12월 1일 무대 춤의 예술, 네드 웨이번 etext 27367
만오천일 2009년 5월 12일 왕립사회의 철학적 거래 - 제1권 - 1666, 다양함헨리 올덴버그 (편집자) etext 28758
만육천일 2009년 10월 1일 ABC 쁘띠 콩테스, 줄 르메르트르 etext 30117
만 칠천일 2010년 3월 4일 C. 가스콰인 하틀리 원시사회 여성의 지위 etext 31500
18,000일 2010년 6월 15일 루마니아 지역 안내서, 유진 K.키프, 기타 etext 32700
만구천일길 2010년 11월 10일 반덴 보스 레이너드 우이트게벤 엥 토겔리히트(익명) etext 34261
2만분의 1 2011년 4월 10일 (아래 20,000번째 전자책 참조)
2만2천번째 2012년 1월 2일 "니벨룽게니" 윌리엄 낸슨 레톰의 번역본 etext 38468
2만 5천번째 2013년 4월 10일 Silver Printing의 예술과 실천, H. P. Robinson캡틴. 애브니 etext 42547
3만번째 2015년 7월 7일 등급이 매겨진 문학 독자:제4권 etext 49339
3만 5천번째 2018년 1월 26일 북극해 연안, 1875-1876년 북극 탐험에 관한 이야기 etext 56424
3만 6천번째 2018년 9월 7일 미국 선교사 etext 57859
삼만 칠천일 2019년 4월 16일 국립미술관에 소장된 19세기 프랑스 그림 etext 59288
38,000번째 2019년 11월 8일 오스트레일리아의 새 (7권 3편) etext 60646
삼만 삼천일 2020년 4월 27일 빌헬름 하프스 셈틀리히 베르케 젝스 반덴.Bd. 6 etext 61957
사만일 2020년 10월 10일 런던 노동과 런던 빈민 4권 전권 etext 55998,55998,1980,63415
4만1000일 2021년 3월 5일 나의 어린 시절 이야기 etext 64704
4만2천번째 2021년 8월 3일 캐어 온, 지브스 etext 65974
4만3천일 2022년 1월 31일 즈웨이터 밴드[10] 디 시텐 데르 뵐커 etext 67289

전자책 1만권

2007년 3월 9일, 분산 교정자들은 10,000개 이상의 타이틀의 완성을 발표했다.기념으로, 15개의 제목이 출판되었다.

전자책 2만권

2011년 4월 10일, 2만권의 책 이정표는 2개 국어로 된 책의 집단 발매로 기념되었다.[11]

  • 이탈리아-이탈리아 문학 르네상스, 제1권, 존 애딩턴 시몬드(이탈리아어와 함께 영어)
  • Mérchen und Erzahlungen für Anfancer; Erster Teil, H. A. Guerber(영어를 사용하는 독일어)
  • Gedichte und Sprüche, 발터 데르 보겔바이데(독일어 포함, 1050-1500)
  • Studien und Plaudeerien im Vaterland, Sigmon Martin Stern(독일어 포함)
  • 카오스델트리페루노, 테오필로폴렝고(이탈리아어 라틴어)
  • 니데를렌디스체 폴크스피어, 호프만팔러슬레벤(독일어, 네덜란드어)
  • A "샌프란시스코" 살바토레지아코모(이탈리아인, 네폴리탄)
  • 오 보토, 살바토레 디 지아코모(나폴리탄과 함께 이탈리아어)
  • De Latino sine Flexione & Principio de Permanentia, 주세페 페아노(1858-1932) (Latino sine Flexione이 있는 라틴)
  • 카피다추 파가 투투—니노 마르톨리오, 루이지 피란델로(시칠리아어 포함)
  • 국제 보조 언어 에스페란토, 조지 콕스(에스페란토와 함께 영어)
  • 루시타니아: 칸티 포폴라리 포르토게시, 에토레 토시(프랑스어를 사용하는 이탈리아어)

전자책 3만권

2015년 7월 7일, 30개의 텍스트로 구성된 그룹과 함께 3만권의 책 이정표가 기념되었다.한 명은 3만 명이었다.[12]

  • 등급이 매겨진 문학 독자 - 네 번째 책, 편집자: 해리 프랫 저드슨과 아이다 C.벤더, 1900년

전자책 4만권

2020년 10월 10일, 4만권의 책 이정표가 4권의 책 한 권의 그룹으로 기념되었다.한 명은 4만 명이었다.[13]

참고 항목

참조

  1. ^ "Distributed Proofreaders". github.com. Retrieved 2022-02-01.
  2. ^ "Celebrating 30,000 Titles Hot off the Press". Blog.pgdp.net. 2015-07-07. Archived from the original on 2016-12-20. Retrieved 2016-09-15.
  3. ^ "Celebrating 39,000 Titles". Blog.pgdp.net. 2020-11-08. Archived from the original on 2020-06-03. Retrieved 2020-04-27.
  4. ^ Lessig, Lawrence (2009). Remix: Making Art and Commerce Thrive in the Hybrid Economy. Penguin. p. 109. ISBN 978-0-14-311613-4.
  5. ^ "Gutenberg:Volunteers' Voices". Project Gutenberg. Archived from the original on 2008-09-18. Retrieved 2008-07-12.
  6. ^ "Distributed Proofreading's slashdotting". Boing Boing. Archived from the original on 2007-11-09. Retrieved 2008-07-12.
  7. ^ Gentry, Craig; Ramzan, Zulfikar; Stuart Stubblebine (February 28 – March 3, 2005). "Secure Distributed Human Computation". In Andrew S. Patrick; Moti Yung (eds.). Financial cryptography and data security: 9th International Conference. Lecture Notes in Computer Science. Vol. 3570. Roseau, The Commonwealth of Dominica: Springer. p. 329. doi:10.1145/1064009.1064026. ISBN 3-540-26656-9.
  8. ^ Lebert, Marie (November 4, 2010). "Distributed Proofreaders, producteur des livres du Projet Gutenberg, a 10 ans". Actualitté (in French). Archived from the original on October 5, 2011. Retrieved 2011-06-30.
  9. ^ "DP Timeline - DPWiki". www.pgdp.net. Retrieved 2020-08-13.
  10. ^ "Celebrating 43,000 Titles". blog.pgdp.net. February 1, 2022. Retrieved February 1, 2022.
  11. ^ 2011년 4월 10일, 분산된 교정자 웨이백 머신에서 2011-06-19게시된 20,000권의 책을 기념하는 분산 교정자
  12. ^ "Distributed Proofreaders • View topic - 30,000 Unique Titles Preserved!". Pgdp.net. Retrieved 2016-09-15.
  13. ^ "Distributed Proofreaders • View topic - 40,000 Unique Titles Preserved!". Pgdp.net. Retrieved 2021-03-07.

외부 링크