고대 문자 말뭉치
Ancient text corpora고대 텍스트 말뭉치는 고대 역사 시대의 전체 텍스트 모음으로, 이 기사에서 서기 300년까지 쓰기 시작한 기간으로 정의됩니다.이 말뭉치들은 문학, 역사, 언어학, 그리고 다른 분야의 연구에 중요하고 세계 문화 유산의 기본적인 구성 요소입니다.
중국어, 라틴어, 그리스어는 중요한 텍스트 말뭉치를 가진 고대 언어의 예이지만, 이러한 말뭉치의 대부분은 원래 형태가 아닌 전송(종종 중세 사본을 통해)을 통해 우리에게 알려져 있습니다.이 문서들은 전해지는 것과 원래의 것 모두 – 세계의 다른 지역의 역사와 문화에 대한 귀중한 통찰력을 제공하며, 학자들과 연구원들에 의해 수 세기 동안 연구되어 왔습니다.
기술과 디지털화의 발전을 통해, 고대 문자 말뭉치는 그 어느 때보다 더 쉽게 접근할 수 있습니다.페르세우스 디지털 도서관과 산스크리트어의 디지털[1] 코퍼스와 같은 도구들은 연구자들이 이러한 텍스트에 접근하고 분석하는 것을 더 쉽게 만들었습니다.
말뭉치 정량화
현대 학자들은 두 가지 유형의 고대 문헌을 알고 있는데, 그것들은 더 젊은 필사본에서만 살아남았지만, 그들의 위대한 시대는 논쟁의 여지가 없습니다(이것은 중국, 브라흐미, 그리스, 라틴, 히브리어 및 아베스탄 전통에 대부분 적용됩니다). 그리고 원본 비문, 파피리 및 다른 [2]필사본에서 알려진 것들입니다.
각 말뭉치에서 단어를 세는 것은 중요한 방법론적 과제를 제시합니다. 원칙적으로 텍스트에서 단어가 발생하는 모든 것은 개별적으로 계산되지만 문학 텍스트의 병렬 전송의 경우 단일 전송만 고려됩니다.죽은 자의 책과 관본이 이집트인에게 주어진 숫자에 딱 한 번 포함되듯이 그리스어와 라틴어 문학 작품도 한 권의 원고에 의해서만 집계되어야 합니다.반면에, 특정 고대 언어의 무덤, 왕실 비문 또는 경제 문서가 종종 다소 동일한 형태를 보인다면, 이것은 순수하게 "병렬 전통"으로 평가되지 않습니다.첨부된 전치사는 대부분의 언어에서 동등한 것이 없기 때문에 히브리어, 아람어 및 그리스어의 정관사의 경우를 제외하고는 별도의 단어로 계산됩니다. 그래서 그 빈도는 [2]숫자의 비교 가능성에 상당한 영향을 미칠 것입니다.
알려진 크기 추정치가 있는 언어
| 대본 | 언어 | 사용 날짜 | 텍스트 수 | 단어 수 | 참조. | ||
|---|---|---|---|---|---|---|---|
| 고고학 | 변속기 | 총 | |||||
| 이집트 상형문자 / 상형문자 | 이집트의 | 5,000,000 | 없음. | 5,000,000 | [3][4] | ||
| 데모틱 | 1,000,000 | 없음. | 1,000,000 | [5] | |||
| 그리스어(고대 그리스 문학, 신약, 교회 교부 등) | 57,000,000 | [6][7] | |||||
| 라틴어 | 10,000,000 | [8][7] | |||||
| 설형문자 | 아카드인 | 144,000[9] | 9,900,000[9] | 없음. | 9,900,000 | [10] | |
| 수메르의 | 102,300[11] | 3,076,000[11] | 없음. | 3,076,000 | [12] | ||
| 후리안 | 12,500 | 없음. | 12,500 | [13] | |||
| 유라시아어 | 400 | 10,000 | 없음. | 10,000 | |||
| 히타이트 | 700,000 | 없음. | 700,000 | [14] | |||
| 해틱 | 500 | 없음. | 500 | [15] | |||
| 쿠네폼루위안 | 3000 | 없음. | 3000 | [16] | |||
| 엘람석 | 2,087 | 100,000 | 없음. | 100,000 | [17] | ||
| 프로토라믹 | 1,435 | 20,000 | 없음. | 20,000 | [18] | ||
| 에블라이트 | 16,000 | 300,000 | 없음. | 300,000 | [19] | ||
| 아모리인 | 7,000 | 11,600 | 없음. | 11,600 | [20] | ||
| 우가리트어 | 40,000 | 없음. | 40,000 | [21] | |||
| 고대 페르시아어 | 7,000 | 100,000 | 107,000 | [22] | |||
| 가나안인과 아람인 | 고대 히브리어(inc.히브리어 성경) | 35,000 | 265,000 | 300,000 | [23][24] | ||
| 아람어 (고대, 제국, 성서, 하스모네어, 나바테아어, 팔미레네어) | 100,000 | [25] | |||||
| 페니키아/푸니어 | 10,000 | 68[26] | [27][28] [29] | ||||
| 고대 남아라비아 | 10,500 | 112,500 | 없음. | 112,500 | [30][31] | ||
| 에트루리아인 | 25,000 | 25,000 | [32][33] | ||||
남아시아인
메소아메리카의
동아시아인
중앙 이란어군
- 서기 300년 이전에, 중앙 이란어는 주로 중페르시아어(팔라비 문자와 비문 파르티아어)[37]와 밀접하게 관련된 두 관용구에 있는 사산어 돌 비문의 형태이며, 중페르시아어 말뭉치(대부분 3세기이지만 4/5세기도 있음)와 파르티아어 단어 말뭉치(3세기)에 대한 5000개가 있습니다.마니교의 중세 페르시아 문학 문헌 중 일부는 3세기로 거슬러 올라가며, 마니교는 개인적으로 샤부라간을[38] 총 5,000개의 단어를 쓴 것으로 알려져 있습니다.어쨌든, 우리가 중세 페르시아어와 파르티아어를 합하면, 우리는 10,000개 이상의 [39]단어에 도달합니다.
중국조어
- 중국조어 문자는 약 400자를 넘지 않습니다(문자가 완전히 [40]해석되지 않았기 때문에 단어의 수는 알 수 없습니다).비슷한 정도로, 거의 동시대의 가나안조어 비문(ibid.)[41]이 있을 것입니다.
아나톨리아어
- 루위안 설형문자,[42] 대략.삼천[43] 단어
- 팔레아어의[44] [43]몇 백 단어
- 상형문자 루위안[45][43]
- 약 5[43],000개의 단어가 있는 리키아 문자(알파벳 [46]문자로 쓰여진 가장 잘 증명된 아나톨리아어 후계 언어)
- 약 1500개의[43] 단어로 구성된 리디아[47] 알파벳 109개의 비문
- 기원후 2세기와 3세기의[48] 무덤 내 비문(약 1000단어)과 300단어[43] 미만의 소위 "오래된 비문"에[49] 새겨진 프리기아 알파벳.
- 주로 이집트에서 온 텍스트가 약 600개의 [43]단어를 포함하는 카리아 문자[50].
고대 이탈리아어
- 기본적으로 5000단어의[52] 이귀비니안 표의 희생적 지시에 의하여 증명된 움브리아어[51].
- 2천[52] 단어의 오스칸어.
- 아마도 좋은 1000개의 단어가 있는 메사픽 언어[53] (이 이해하기 어려운 언어의 대부분의 텍스트는 [52]단어 구분자를 사용하지 않기 때문에 추정이 어렵습니다)
- 베네딕트의[54] 몇백 단어[52].
- 팔리스카어족의[55] 몇백[52] 단어.
- 키살피나 켈트족의 비문은 약 2000개의 단어에 달하며, 고전[56][52] 작가들에 의해 많은 광택이 추가되었습니다.
이베리아
- 그리스어나 라틴어로 쓰여진 이베리아 문자는 더 드물게 약 2500단어입니다[52][57].
- 켈티베리아 문자, 이베리아어로 켈트어로 된 기록을 가리키지만 스페인어로 된 라틴 문자(약 1000단어)[52][57]
- 남서 팔레오 히스패닉 문자, 78개의 비문, 수백 개의[52][57] 단어
- 루시타니아어, 라틴 문자로 된 세 개의 기념물, 약 60단어[52][57]
게르만계 북유럽
아프리카
- Geʽez 스크립트: [60]서기 300년 이전에 총 약 1,000개의 단어가 있는 비교적 적은 수의 비문.4세기의 기독교화 이후,[59] 더 광범위한 문헌들이 알려져 있습니다.
- 리비아-베르베르 알파벳: 로마 시대에 만들어진 [61]마그레브의 1,000개 이상의 비문.대부분의 텍스트는 단어 구분 기호를 사용하지 않습니다. Pust는 총 단어 수가 약 5,000개일[59] 수 있다고 추정합니다.
- 메로이트 문자 (고대 누비아어): 약 900개의 텍스트가 알려져 있으며, Pust는 구분자라는 단어가 메로이트 [62][59]문자에서 일관되게 사용되지 않는다는 사실에 대한 불확실성에도 불구하고 약 10,000개의 단어를 포함할 수 있다고 추정합니다.
에게 해
- 아직 해독되지[63] 않은 크레타 선형 A 비문은 약 2,500개의 텍스트로 제공되며, 총 약 20,000개의 문자가 포함되어 있습니다.전체 단어의 수는 거의 결정할 수 없습니다. Pust는 잠정적으로 [59]메로이트어와 같은 크기의 순서로 그것을 배치했습니다.
- 선형 A 텍스트 외에도, 수백 개의[64] 문자로 된 크레타 상형문자와 그리스 알파벳으로 쓰여진 텍스트가 있지만, 그리스어가 아닌 수십 개의[65][59] 단어로 된 텍스트도 있습니다.
- 기원전 제1천년기의 키프로스어 음절은 대부분 그리스어 문헌이 [66]기록된 것입니다.관련 텍스트는 [59]약 100에서 200개의 단어로 구성됩니다.
초소형 말뭉치
상당한 수의 고대 마이크로 말뭉치 언어들이 있습니다.검증된 고대 언어의 총 수를 추정하는 것은 말뭉치 크기를 추정하는 것만큼 어려울 수 있습니다.예를 들어, 그리스어와 라틴어 자료는 엄청난 양의 외국어 용어를 전하는데, 그 심각성이 항상 [59]확실한 것은 아닙니다.
보존 및 치료
역사적 보존 및 고대 텍스트 말뭉치 유지는 보존, 번역 및 디지털화 문제를 포함하여 몇 가지 과제를 제시합니다.많은 고대 문헌들은 시간이 지남에 따라 소실되었고, 살아남은 것들은 손상되거나 조각날 수 있습니다.고대 언어와 스크립트를 번역하려면 전문적인 전문 지식이 필요하며 텍스트를 디지털화하는 것은 시간이 많이 걸리고 자원 집약적일 수 있습니다.
코퍼스 언어학
코퍼스 언어학 분야는 텍스트 말뭉치로 표현된 언어를 연구합니다.여기에는 단어 빈도, 위치, 문법 및 의미 분석이 포함됩니다.고대 텍스트 말뭉치는 말뭉치 언어학 연구를 위한 귀중한 자원을 제공하여 학자들이 시간이 지남에 따라 언어와 문화의 진화를 탐구할 수 있도록 합니다.
참고 항목
레퍼런스
- ^ "Digital Corpus of Sanskrit (DCS) - Online Sanskrit dictionary and annotated corpus". www.sanskrit-linguistics.org. Archived from the original on 2023-06-03. Retrieved 2023-06-03.
- ^ a b Pust 2000, 페이지 252-253.
- ^ 카르스텐 퓨스트, "위베르 애굽티슈 렉시코그래피. 1: 줌 프톨레마이크 렉시콘 폰 페넬로페 윌슨, 2: 버수친 정량적 베르글리치스 데어 텍스트코르포라 안티커 스프라헨, 링구아 이집트 7, 2000: 245-260: "Nacheiner von W. F. Reineke in S. Grunert & HaannHaffeme (1999, Textbuelg), 14, Gyunderbu.veröffentlichten Shätzung W. Schenkels betträt die Zahlder in allen heute bkanntägyptischen (d.h. hieroglyphischen und hieratischen) Textenenthalten Wortformen annäherd 500만 und tendentden deltender, W. W. W. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D. D게겐 천만엔; 다스 베를리너 제텔라키브 데 뵈르터부흐스 데르집티셴 스프라체 폰 A.Erman & H. Graphow (Wb), das seenerzeit Volständigkeit antstrebte, umfast "nur" 1,700만 엔 (nachanderen Angaben: 150만 엔) 제텔. (p.246)
- ^ W. Schenkel (1995). "Die Lexikographie des Altägyptisch-Koptischen". The lexicography of the Ancient Near Eastern languages (PDF). Verona: Essedue. p. 197. ISBN 88-85697-43-7. OCLC 34816015. Archived (PDF) from the original on 2023-04-30. Retrieved 2023-05-05.
- ^ 1955년과 1979년 사이에 민주주의 텍스트가 출판된 시카고 데모틱 사전은, 명확하고 무한한 기사와 접미사 대명사(S. Grunert & L Hafemann의 J.H. Johnson, Textcorpus and L Handbuch, Leiden 1999, p. 243)를 제외하고 200,000장 이상의 전표를 작성했습니다(S. K. R. Ritner S. S. S. S. P.Vleeming, Aspects of Democotic Licocography, Leuven 1987, 페이지 145).Pust는 이것이 알려진 전체 인구 통계 텍스트 수의 일부에 불과하며, 백만 단어의 영역에 있을 수 있다고 말합니다.
- ^ 그리스어의 어휘는 캘리포니아 대학교 어바인에 의해 이전에 CDRom에 출판된 시소러스 링구아에 그라이카에 완전히 기록되어 있습니다.서기 600년까지의 모든 텍스트와 다음 시대의 비잔틴 텍스트 선택이 전체에 포함된 현재 사용 가능한 버전 E는 총 약 7600만 개의 텍스트 단어가 있습니다.서기 400년까지의 저자들이 대부분 흩어진 1985년(2700명의 저자들), 400년 이후의 기간의 저자들만 200명에 불과했을 때, 데이터베이스에는 여전히 5700만 개의 단어가 포함되어 있었습니다(L. Berkowitz & KA Squitier, Thesaurus Linguae Grae Can, New York 1986, p. xii f.).서기 300년까지의 본문의 어휘가 여전히 다소 적어야 하고 우리는 또한 그리스어 정관사의 수많은 예들을 공제하기를 원하더라도, 우리는 여전히 그리스어가 우리의 명세서의 틀 안에서 가장 잘 보존된 고대 언어라고 분명히 선언할 수 있습니다.이 말뭉치에는 그리스어로 쓰여진 교회 교부들의 글도 포함되어 있습니다.
- ^ a b Dee, James H. (2002). "The First Downloadable Word-Frequency Database for Classical and Medieval Latin". The Classical Journal. The Classical Association of the Middle West and South. 98 (1): 59–67. ISSN 0009-8353. JSTOR 3298278. Archived from the original on 2023-05-05. Retrieved 2023-05-05.
All those frequency counts are drawn from a much wider variety of subjects and styles than exist for classical or medieval Latin, and because the volume of printed and spoken matter in any modern language is staggeringly huge, their authors take great pains to select "representative" corpora, seeking statistically meaningful data. Things are quite different in Latin, where there is, for the classical period, a surviving mass of literature estimated at no more than 9,000,000 words, whereas the corpus of classical Greek literature is usually estimated at "only" ten times that much.'
- ^ 퓨스트는 테사우루스 링구아 라틴어가 9백만에서 1천만 개의 단어를 가지고 있다고 말합니다.Linguae Latinae는 AD 150년까지의 모든 텍스트와 AD 600년까지의 후기 텍스트를 선택적으로 9개의 (다른 출처에 따르면: 천만) 전표와 함께 가지고 있습니다(고대 및 옥시던트 14, 1968년, 172ff.서기 300년까지의 라틴어의 어휘가 아직 정확하게 결정되지 않았다고 하더라도 이집트어의 어휘를 능가하지만 그리스어의 어휘에 미치지 못한다는 것은 분명해야 합니다.하지만, 고전 문헌학자들 사이에서 종종 듣는 경험의 법칙은, 적어도 서기 300년이라는 우리의 시간 제한을 근거로 삼는다면, 라틴어 텍스트보다 10배나 많은 그리스어 텍스트가 있다는 것은 과장된 것입니다.
- ^ a b Strek 2010, 54페이지
- ^ Pust는 이 언어의 불균형적으로 출판된 말뭉치를 추정하는 것이 매우 어렵다고 언급하면서, 1,000,000 이상으로 추정했습니다.시카고 아시리아 사전("아시리아어"는 아시리아어 방언뿐만 아니라 아카드어 전체를 의미함)은 텍스트의 체계적인 단편화로 시작되었습니다.1948년에 1,249,000장의 슬립에 도달했을 때, 체계적인 조작은 중단되었고 지수는 선택된 슬립만 포함하도록 확장되었습니다. 1964년까지 약 1500,000에서 1750,000개의 엔트리가 함께 모였습니다(CAD Vol. I.J. Gelb).A 7, 시카고 1964, 페이지 16).하지만 제가 생각하기에 이것은 전체 아카디아 자료의 일부에 불과해야 합니다.아시리아 학자 S.N. Kramer는 500,000개의 설형문자가 있다고 추정했다고 합니다 (대부분의 설형문자는 아카드어로 되어 있습니다).또한 관심사는 A.L.의 견적입니다.오펜하임, 고대 메소포타미아, 시카고 21977, 페이지 17f. 아수르바니팔스가 니네베에서 발견한 개인 도서관은 1200에서 1500개의 태블릿을 포함하고 있으며, 그 중 행의 수는 "대량을 초과하지는 않더라도 아마도 190,000개의 시로 마하바라타의 크기에 이를 것입니다."이 도서관의 절반 미만이 살아남아 출판되었지만, 다른 한편으로는 물론 아슈르바니팔의 도서관에 있는 것보다 더 많은 문헌들이 있습니다.특정 숫자 대신에, 저는 아카디아어의 말뭉치가 라틴어의 순서일 수 있다고 추측함으로써 결론을 내리고 싶습니다.
- ^ a b Strek 2010, 53페이지
- ^ 수메르 말뭉치는 추정하기 어렵습니다.W. Salaberger & A에 따르면.메소포타미아의 웨스턴홀츠:Akade 기간 및 Ur III 기간, 대략 3, Freiburg/Schw. 1999 (OBO 160/3), 페이지 128, 현재까지 출판된 Ur III 기간의 행정 및 법률 문서 40,000개 바로 아래에 있으며, 각 문서에는 평균 20~30개의 단어가 포함될 수 있으며, 이는 100만 단어 형태에 해당합니다.그러나, 총 부피는 아마도 이집트 문헌의 그것보다 낮게 유지될 것입니다.
- ^ "이 언어들 중에서 가장 많이 증명된 것은 히타이트어와 관련이 없는 후르리어입니다.V가 출판한 후르리어 기념물 코퍼스의 이전에 출판된 책 (1, 2, 4, 5, 7, 9).하스는 10,000개의 후르리어 단어를 포함하고 있습니다; 미타니쾨니히스 투스라타나 아메노피스.ITI(ed.J.Friedrich, 아시아 언어 기념물, 베를린 1932, 페이지 8 ff.), 대략적인 체 (ed. G.A. Melicisvili, Urartskijeklinoobraznyje nadpisi, Moskva 1960, 약 10,000 단어)와 함께 후르어의 계승 언어로 간주할 수 있습니다.
- ^ "1980,600,000단어 = 텍스트 자료의 90%가 chD에서 낭비되었습니다.설형문자 중에서는 히타이트 제국의 옛 수도였던 보가스코이의 문헌을 통해 대부분 알려진 히타이트어가 3위를 차지하고 있습니다.시카고 히타이트 사전의 색인 상자에는 1980년에 600,000장 이상의 색인 카드가 들어 있었습니다. 그 당시까지 출판된 텍스트의 90% 이상이 완전히 막혀 있었습니다. (H.G. Guterbock & H.A.)Hoffner, The Hittite Dictionary, Vol. 3/1 [L], Chicago 1980, p. xv).보가스코이의 텍스트 자료에서 히타이트 영향권의 여러 지역 언어들도 증명되는데, 대부분 종교적 내용의 히타이트 외국어 이중언어 또는 히타이트 의식 텍스트에 산재된 외국어 구절의 형태로 나타납니다.
- ^ "지금까지 거의 이해되지 않았던 또 다른 보가스코이어는 하티어입니다.알려진 해틱 텍스트 자료의 총 질량은 수천 단어를 초과해서는 안 됩니다(J. Klinger, Studienzur Reconstruction of the Hatic Culture Layer, Wiesbaden 1996에서 편집된 텍스트는 약 500 단어를 포함합니다). H에 의한 해틱 언어로 된 텍스트의 편집이 발표되는 즉시 그 수를 결정하기가 더 쉬울 것입니다.Otten & Ch. Rüster (StBo 37)가 출판되었습니다.
- ^ 히타이트 문서에는 수백 개의 "광택적인 쐐기 단어"가 산재해 있습니다.
- ^ 페르세폴리스정 2,087개 + 왕실 비문 등이 숫자는 리처드 할록이 페르세폴리스 요새화 태블릿을 출판하면서 나눈 숫자입니다.다른 수많은 패널은 아직 게시되지 않았습니다.Wayback Machine에서 Matthew Stollper Archived 2007-02-14를 참조하십시오. "15,000개에서 30,000개 이상의 태블릿 및 조각이 있었습니다.대부분(수천 개의 태블릿과 수만 개의 조각)은 설형문자로 엘람어로 되어 있었습니다."이것은 페르시아에서 사용된 덜 알려져 있지만 비교적 잘 증명된 설형문자 엘람어입니다.가장 중요한 출판물 중 다수는 다음을 제공합니다: R.T. 헤일록, 페르세폴리스 요새화 태블릿, 시카고 1969, 2087년 점토판 약 50,000 단어 (그 외에도 많은 태블릿이 미발표 상태로 남아 있습니다); F.W. 킹, [sc. 아케메니딕 이전] 엘람이트 왕실 비문, 그라츠 1965, 약 10000 단어; F.H. 바이스바흐,Die Keilinschriften der Achaemeniden, 라이프치히 1911, 대략.5000단어; GC 카메론, 페르세폴리스 재무부 태블릿, 시카고 1948, 약 5000단어.지금까지 출판된 모든 엘람 자료로, 한 단어는 거의 10만 단어에 가까워질 것입니다.
- ^ "c 영국 1998년 이후, 22노트.8: 수사의 1,450개의 발표된 텍스트와 146개의 미발표된 텍스트.여기에는 제3천년기(ed.P.)부터 부분적으로만 베넨 패널을 해독한 엘람조어 문자에 기록된 것으로 알려진 1435개의 문서는 포함되지 않습니다.Meriggi, Lascritura proto-elamica, 3권, Roma 1971/4)는 약 20,000개의 문자를 포함하고 있으며, 대부분은 지리적으로 읽을 수 있습니다.
- ^ 2,436개의 완전한 패널, 13947개의 다른 크기의 조각들.제가 먼저.사미르, 시리아 국립 박물관의 아래 부록 1, 크기별 파편의 분류는 이들립을 참조하십시오.Pust는 1,800정과 15,000조각을 추정했습니다.가장 오래된 것으로 알려진 셈어는 1970년대에 발견된 3천년기의 에블레이어이며, 그 중 1800개의 온전한 점토판과 약 15,000개의 조각(G)이 발견되었습니다.Pettinato, Catalogo dei suneiformid i did Tell Mardikh-Ebla, Napoli 1979, p. 16 f. (ASIN B004HZDL5K)).현재까지 출판된 3,000여 개의 작품(G. Conti, 출판되거나 인용된 에블레이틱 텍스트 색인, 피렌체 1992)에는 약 300,000개의 단어가 포함되어야 합니다.
- ^ 7,000명의 개인 이름 + 90개의 안전한 차용어에 따르면
- ^ "M에서 수집된 우가리트 설형문자 알파벳 텍스트.Dietrich et al., The Suneiform Alphabet Texts, Munster 21995는 약 4만 개의 단어로 구성되어 있습니다.또한 음절로 된 설형문자에 우가리트어 용어가 거의 없습니다.
- ^ 고대 페르시아 설형문자 비문(ed. R.G. Kent, Old Persian, New Haven 1953)은 약 7000개의 단어를 포함하고 있으며, 언어학적으로 밀접하게 관련된 아베스타 텍스트(ed. K.F. Geldner, Avesta, 3권, 슈투트가르트 1896)는 최근의 필사본에서만 살아남아 약 100,000개의 단어를 포함하고 있습니다.
- ^ Poust는 Clines (아래 참조 참조)의 추정에 따라 고대 히브리어 단어의 총 수는 히브리어 성경의 305,500 단어, 사해 두루마리의 38,349 단어, 시라크 외설의 7,020 단어, 비문의 2,528 단어의 합계에서 353,396개입니다.그런 다음 Peust는 정관사 ־הha-에 대한 34,622개의 사례를 빼고, 히브리어로 특별한 방식으로 문법화된 62,760개의 "그리고"에 대해서도 논쟁할 수 있다고 언급하며, 이러한 수치를 조정하면 고대 히브리어의 코퍼스는 30만 단어의 순서라고 결론짓습니다.
- ^ Clines, D.J.A. (1993). The Dictionary of Classical Hebrew: Aleph. The Dictionary of Classical Hebrew. Sheffield Academic Press. p. 28. ISBN 978-1-905048-75-5. Archived from the original on 2023-05-14. Retrieved 2023-05-14.
[Table: Biblical: BHS 305500; Non-biblica: Ben Sire 7020, Qumran 38349, Inscr 2528; Total 353396] The foregoing statistics of the size of the various corpora of Hebrew texts have ben derived in the following way. From the totals in the table, Words Beginning with Aleph in Order of Frequency, it can be seen that we have identified 61,883 occurrences of words in the Hebrew Bible (Biblia hebraica stuttgartensia) beginning with Aleph. Knowing that there are some 305,500 words in the Hebrew Bible (the figure comes from Francis I. Andersen and A. Dean Forbes, The Vocabulary of the Old Testament [Rome: Pontifical Biblical Institute, 1989], p. 23), we can assume that, roughly speaking, the 1,422 occurrences of Aleph words in ben Sira imply a text of c. 7,020 words (i.e. 1422, divided by 61833 and multiplied by 305500). Similarly, the total of 7,768 occurrences in the Qumran and related materials implies a corpus of c. 38,300 words (in the non-biblical texts already published, that is).
- ^ 퓨스트는 아람어의 말뭉치가 여러 방언으로 나뉘어져 있다고 쓰고 있습니다.
- 기원전 제1천년기 전반기의 고대 아람어 비문(Kanaanäische and Aramäische Inschriften) 약 4천 개의 단어가 있음
- 주요 아람어 문서들은 이집트에서 온 것이지만 (고대 이집트의 아람어 문서들의 교과서; 처음 세 권은 약 20,000개의 단어를 포함하고 있습니다), 다른 많은 비문과 문서들에도 보존되어 있습니다.제국 아람어는 또한 이집트 데모 문자로 작성된 파피루스 애머스트 63의 아람어 텍스트를 포함하고 있으며, 약 3000개의 단어를 포함해야 합니다.
- 구약성경의 아람어 구절("성경 아람어", 특히 다니엘서 1장 2-7절과 에즈라서 1:2-4, 4:8-16, 4:17-22, 5:7-17, 6:3-5, 6:6-12, 7:12-26)은 5000단어 분량의 아람어와 밀접한 관련이 있습니다.
- 하스모네안은 사해 두루마리의 아포크리파와 타르굼에서 발견되지만, 유대 문헌()Beyer, Klaus (1984). Die aramäischen Texte vom Toten Meer (in German). Vandenhoeck & Ruprecht. pp. 157–318. ISBN 978-3-525-53571-4.에서도 증명됩니다. 총 15,000 단어입니다.
- 나바테아와 팔미레네는 각각 약 1,000개의 무덤과 봉헌 비문에 기록되어 있습니다.
- ^ Gray, Louis H. (1923). "The Punic Passages in the "Poenulus" of Plautus". The American Journal of Semitic Languages and Literatures. University of Chicago Press. 39 (2): 73–88. doi:10.1086/369974. ISSN 1062-0516. JSTOR 528483. S2CID 170454820. Archived from the original on 2023-05-05. Retrieved 2023-05-05.
- ^ Poust는 Punic per Kanaanäische and Aramäische Inschriften (KAI)을 포함한 페니키아인의 말뭉치가 약 10,000 단어에 달하지만, 이것은 전체 말뭉치의 10,000 텍스트에 대한 다른 추정치와 모순된다고 말합니다.KAI는 완전한 말뭉치가 아닌 선택된 텍스트를 포함합니다.
- ^ Doak, Brian R. (2019-08-26). The Oxford Handbook of the Phoenician and Punic Mediterranean. Oxford University Press. p. 223. ISBN 978-0-19-049934-1.
Most estimates place it at around ten thousand texts. Texts that are either formulaic or extremely short constitute the vast majority of the evidence.
- ^ 레만, 라인하르트 G. (2013)."빌헬름 게세니우스와 페니키아 철학의 부상"Biblische Exegese und hebrische Lexikographie. 페이지 209–266. doi:10.1515/9783110267044.209. ISBN 978-3-11-026612-2.인용: "거의 200년 후에 페니키아-푸니키아 금석화의 레퍼토리는 지중해와 그 주변 지역에서 온 약 10,000개의 비문을 집계한다."
- ^ 고대 남아랍어의 코퍼스는 분산된 출판물로 출판되었으며 조사하기가 어렵습니다.코퍼스 인스크립션 세미티카룸(및 RES)의 오래된 편찬물은 50,000개 이상의 단어가 포함된 약 3,000개의 텍스트를 포함하고 있지만, 이러한 텍스트의 (작은) 부분은 서기 300년 이후부터 시작되었습니다.따라서, 이제 100,000개 이상의 단어의 재고가 있다고 가정할 수 있습니다.고대 남아랍어 문헌들은 주로 사바에어로 되어 있지만, 일부 짧은 기념물들의 속성은 불확실하지만, 미나에어로 쓰여진 것, 카타반어, 하드라마틱어와 같은 다른 언어들로도 쓰입니다.P. 스타인은 2007년에 10,500개의 비문이 있다고 말한 반면, 퓨스트는 2000년에 8,000개의 비문이 있다고 말했습니다.스타인에 따르면, 본문은 다음과 같이 나누어져 있습니다: 사바에어: 5,300개의 본문, 카타반어: 2,000개, 미나에어: 1,200개, 하람어: 1,500개, 기타/불확실한 것: 500개.말뭉치는 젓가락에 의해 더 증가될 것이고, 그것은 조금씩 출판될 것입니다.P. 2007년에 스타인은 또한 단어의 수를 112,500개로 추정했는데, 이는 퓨스트의 100,000개의 단어로 추정한 것과 비교됩니다.스타인에 따르면, 그 단어들은 다음과 같이 분류됩니다: 사바어: 85,000 단어, 카타반어: 11,000 단어, 미나에어: 11,000, 하람어: 5,000, 기타: 500.
- ^ Ryckmans, J.; Müller, W.W.; Allāh, Y.M.A. (1994). Textes du Yemen Antique. Inscrits sur bois. Institut Orientaliste Louvain: Publications de l'Institut Orientaliste de Louvain (in French). Université Catholique de Louvain, Institut Orientaliste. ISBN 978-2-87723-104-6. Archived from the original on 2023-05-05. Retrieved 2023-05-05.
Mais les données principales sont fournies par plus de 8000 inscriptions monumentales , au texte soigneusement gravé dans la pierre ou coulé dans le bronze
- ^ 라틴어 다음으로 고대 이탈리아에서 양적으로 가장 잘 입증된 언어는 에트루리아어입니다.헬무트 릭스에 의해 편찬된 말뭉치는 총 25,000개의 단어와 함께 수천 개의 거의 모든 매우 짧은 텍스트를 세었습니다.
- ^ Rix, Helmut (1991). Etruskische Texte : editio minor (in German). Tübingen: G. Narr. ISBN 3-8233-4240-1. OCLC 25336064.
- ^ Rao, Rajesh P. N.; Yadav, Nisha; Vahia, Mayank N.; Joglekar, Hrishikesh; Adhikari, R.; Mahadevan, Iravatham (18 August 2009). "A Markov model of the Indus script". Proceedings of the National Academy of Sciences. 106 (33): 13685–13690. Bibcode:2009PNAS..10613685R. doi:10.1073/pnas.0906237106. ISSN 0027-8424. PMC 2721819. PMID 19666571.
- ^ Die Lexikographie der Gandharī-Sprache는 2023-04-08 웨이백 머신, 아카데미 악투엘 자르강 2013 - 아우스가베 Nr. 44, 44-47: "Seit demerscheinen von Baileys Artikelist die Material gundlage für Ga-andhar-r-r-Lexiko-graphie durchen furchenchenchen, au-handschenchenchu-hands.뮌젠의 베르왈-퉁스도쿠멘 – 우메인 비엘-파체샹가크센:Der von unersstellte ga-rī 텍스트 카탈로그 (http://gandhari.org/ 웨이백 머신 카탈로그에서 2013-12-05 보관) verzeichnet derzeit 77 umfangreich Schriftrolen, 330 핸드슈리프트텐 프래그먼트, 834 inschriften, 792 niya-Dokumente Underchedellegem-Schtexten 120, 120, Von Bestam."
- ^ Kingsbury, P. (2002). The Chronology of the Pali Canon: The Case of the Aorists. University of Pennsylvania. ISBN 978-0-493-92911-8. Retrieved 2023-05-03.
The early Buddhist canon written in Pali comprises some 4 million words of text written across several centuries in early India. As such, it is of interest not only to scholars of Buddhism but also linguists and historians for the insight it gives into the social, linguistic, and religious culture of the time.
- ^ Gignoux, P. (1972). Corpus Inscriptionum Iranicarum: Glossaire des inscriptions pehlevies et parthes (in French). School of Oriental and African Studies. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ 맥켄지, D.N. 그리고 마니.Mani's 'Shabuhragan.' 런던대학교 동양아프리카학대학원 회보 42호, 3호(1979): 500-534.http://www.jstor.org/stable/615572 Wayback Machine에서 2023-05-05를 보관했습니다.그리고 "마니의 '샤부라간'--II." 런던대학 동양아프리카학대학원 회보 43호, 2호(1980): 288-310.http://www.jstor.org/stable/616043 웨이백 머신 앤 허터(Wayback Machine and Hutter, M., 1992)에서 2022-10-08 보관.마니스 코스모고니체 샤부하라간텍트:코멘타어판, 문학작품집 쉬치틀리체 에이노르드눈 데르 마니차이슈미텔페시셴 핸즈크리프텐 M 98/99, M 7980-7984.동양 종교학.오토 해러소비츠.ISBN 978-3-447-03227-8입니다.2023-05-01에 원본에서 보관.2023-05-01을 검색했습니다.
- ^ Pust 2000, 257-258페이지
- ^ Sass, Benjamin (1988). The genesis of the alphabet and its development in the second millen̄ium B.C. Wiesbaden: In Kommission bei O. Harrassowitz. ISBN 3-447-02860-2. OCLC 21033775.
- ^ Pust 2000, 257페이지
- ^ Starke, Frank (1985). Die keilschrift-luwischen Texte in Umschrift (in German). Wiesbaden: O. Harrassowitz. ISBN 3-447-02349-X. OCLC 12170509.
- ^ a b c d e f g Pust 2000, 255페이지
- ^ Carruba, O. (1970). Das Palaische. Studien zu den Bogazkoy-Texten; hrsg. von der Kommission fur den Alten Orient der Akademie der Wissenschaften und der Literatur, Heft 10 (in German). Harrassowitz. ISBN 978-3-447-01283-6. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ 상형문자 루위어 비문의 관련 코퍼스는 푸스트의 기사 이후 H. 캠벨에 의해 출판되었습니다.
- ^ 티툴리 아시아에 미노리스:티툴리 리키아 언어학 징집병.Tituli Asiae Minoris.R.M. 로러, 1901. 그리고 노이만, G. (1979).Neufundely Kischer Inchrift는 1901년에 자주 보았다.Denkschriften (외스터라이히슈 아카데미 데어 비센샤프트텐).철학-역사학 클라세) (독일어).Verlag der Ostereichischen Academier der Wissenschaften. ISBN 978-3-7001-0283-0.2023-05-13년 원본에서 보관.2023-05-01을 검색했습니다.
- ^ Roberto Gusmani (1980–1986). Lydisches Wörterbuch. Mit grammatischer Skizze und Inschriftensammlung (in German). Ergänzungsband 1-3, Heidelberg. 그리고
- ^ Haas, O. (1966). Die phrygischen Sprachdenkmäler. Académie bulgare des sciences linguistiques balkanique (in German). Académie bulgare des sciences. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ Brixhe, C.; Lejeune, M. (1984). Corpus des inscriptions paléo-phrygiennes. Corpus des inscriptions paléo-phrygiennes (in French). Editions Recherche sur les civilisations. ISBN 978-2-86538-089-3. Retrieved 2023-05-01.
- ^ Lajara, I.J.A.; Neumann, G. (1993). Studia carica: investigaciones sobre la escritura y lengua carias (in Spanish). PPU. ISBN 978-84-477-0236-7. Archived from the original on 2023-05-13. Retrieved 2023-05-01.
- ^ Vetter, E. (1953). Handbuch der italischen Dialekte. 1. Reihe: Lehr und Handbücher (in German). C. Winter. ISBN 978-3-8253-5952-2. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ a b c d e f g h i j Pust 2000, 258페이지
- ^ O. 하스, 메사피쉬 스튜디엔, 하이델베르크 1962, C.산토로, 누오비 스튜디 메사피치, 2권, 레체 1982/3 및 보충 1984.
- ^ Lejeune, M. (1974). Manuel de la langue vénète. Indogermanische Bibliothek / Lehr- und Handbücher (in French). Winter. ISBN 978-3-533-02353-1.
- ^ Giacomelli, G. (1963). La lingua falisca. Biblioteca di "Studi etruschi" (in Italian). L.S. Olschki.
- ^ Whatmough, Joshua (1969). Dialects of Ancient Gaul. Cambridge: HUP. ISBN 978-0-674-86413-9. OCLC 935283757.
- ^ a b c d Untermann, J. (1975). Monumenta linguarum Hispanicarum (in German). Ludwig Reichert Verlag. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ Krause, W.; Jankuhn, H. (1966). Die Runeninschriften im älteren Futhark. Abhandlungen der Akademie der Wissenschaften in Göttingen, Philologisch-Historische Klasse (in German). Vandenhoeck u. Ruprecht. Archived from the original on 2023-05-01. Retrieved 2023-05-01. M. Stoklund, Neue Runenfunde in Illerup and Vimose, 게르마니아 64, 1986, 75ff.
- ^ a b c d e f g h Pust 2000, 259페이지
- ^ Bernand, E.; Drewes, A.J.; Schneider, R. (1991). Recueil des inscriptions de l'Ethiopie des périodes pré-axoumite et axoumite. Publication of the De Goeje Fund (in French). Académie des inscriptions et belles-lettres. ISBN 978-3-447-11316-8. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ Chabot, J.B. (1940). Recueil des inscriptions libyques. Gouvernement général de l'Algérie (in French). Imprimerie nationale. 그리고
- ^ Török, L. (1997). The Kingdom of Kush: Handbook of the Napatan-Meroitic Civilization. Handbook of Oriental Studies / 1: Der Nahe und der Mittlere Osten. Brill. p. 64. ISBN 978-90-04-10448-8.
- ^ Godart, L.; Olivier, J.P. (1976–85). Recueil des inscriptions en linéaire A. Recueil des inscriptions en linéaire A (in French). P. Geuthner. ISBN 978-2-86958-470-9. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ Poursat, J.C.; Godart, L.; Olivier, J.P. (1978). Le Quartier Mu: Introduction générale. Ecriture hiéroglyphique crétoise / par Louis Godart et Jean-Pierre Olivier. 1. Fouilles Exécutées à Mallia (in French). P. Geuthner. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ Duhoux, Y. (1982). L'étéocrétois: les textes, la langue (in French). J.C. Gieben. ISBN 978-90-70265-05-2. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
- ^ Masson, O. (1961). Les inscriptions chypriotes syllabiques: recueil critique et commenté. École français d'Athènes: Études chypriotes (in French). E. de Boccard. Archived from the original on 2023-05-01. Retrieved 2023-05-01.
서지학
- Peust, Carsten (2000). "Über ägyptische Lexikographie. 1: Zum Ptolemaic Lexikon von Penelope Wilson; 2: Versuch eines quantitativen Vergleichs der Textkorpora antiker Sprachen". Lingua Aegyptia 7 (PDF). pp. 245–260.
- Streck, Michael P. (2010). "Großes Fach Altorientalistik. Der Umfang des keilschriftlichen Textkorpus". Mitteilungen der Deutschen Orientgesellschaft 142 (PDF). pp. 35–58.