스페인어로 가장 흔한 단어
Most common words in Spanish아래는 현대 스페인어에서 가장 흔한 단어의 두 가지 추정치 입니다. 각각의 추정치는 다른 텍스트 말뭉치의 분석에서 나온다. 텍스트 말뭉치는 언어 분석을 위해 세심하게 준비된 서면 및/또는 구어 표본을 많이 모은 것이다. 어떤 단어가 가장 흔한지 결정하기 위해 연구자들은 말뭉치에서 발견된 모든 단어의 데이터베이스를 만들고, 그것들이 사용되는 맥락에 따라 그것들을 분류한다.
첫 번째 표에는 Real Academy Espaignola(RAE)가 편찬한 텍스트 말뭉치인 CREA(Corpus de Referencecia del Espaignal Actual)에서 가장 많이 쓰이는 100개의 단어 양식이 나열되어 있다. RAE는 스페인어의 문서화, 계획 및 표준화를 위한 스페인의 공식 기관이다. 단어 형태는 단어의 문법적 변형이다.
두 번째 표는 미국 브리검 영 대학의 마크 데이비스와 다른 언어 연구자들이 편집한 텍스트 말뭉치에서 발견된 가장 흔한 레마 100개의 목록이다. 보조정리란 단어의 주요 형태로서 사전에 나오는 것이다. 스페인의 부정사 테너("갖는 것")는 보조정리체이고, 테너의 조합인 티엔("has")은 단어 형태다.
리얼 아카데미 에스파뇰라
아래의 리스트"1000formas más frecuentes"(transl에서 나온다.1000가장 빈번한 어형.)"라고, 목록을 1억 6천만개 단어 형태들이 코퍼스 크리스티 드 Referencia에(력 산업 회의 실제(transl의 분석에서 스페인 왕립 학술원( 우심방 확대)에 의해 출간하였다.원문 Spani에 실린 글 참고 코퍼스 크리스티 해류는 스페인어의 또는 CREA에 기부. CREA에 기부는 컴퓨터화된 대전 집.sh, 그리고 스페인어 회화 녹취록. 그것은 라디오와 텔레비전 방송 및 기타 출처의 구어체 대본뿐만 아니라 매우 다양한 내용을 담고 있는 책, 잡지, 신문 등을 포함한다. 이 컬렉션의 모든 작품들은 1975년부터 2004년까지이다. CREA는 스페인어를 사용하는 모든 국가의 샘플을 포함한다.[1]
"2000개의 가장 빈번한 단어 양식" 목록은 CREA 버전 3.2의 분석에서 비롯된다.[2] 풀, 동사 결합 및 기타 변형은 별도로 순위를 매긴다. 그러나 동음이의어는 서로 구별되지 않는다. CREA 3.2는 2008년 6월에 출판되었다.[1]
순위 | 워드 폼 | 발생 횟수 | 발언의 일부 | 번역 |
---|---|---|---|---|
1 | 드 | 9,999,518 | 전치사 | 에서 |
2 | 라의 | 6,277,560 | 글, 대명사 | 제3인칭 여성 단수 대명사 |
3 | 대오를 짓다 | 4,681,839 | 접속사 | 저것, 저것 |
4 | 엘을 | 4,569,652 | 기사 | 그 |
5 | 에 | 4,234,281 | 전치사 | 에, 에 |
6 | y | 4,180,279 | 접속사 | 그리고 |
7 | a | 3,260,939 | 전치사 | 로, 로. |
8 | 로스엔젤로스의 | 2,618,657 | 글, 대명사 | 제3자 남성적 직접 목적어 |
9 | se | 2,022,514 | 대명사 | -자신,자신(자신) |
10 | 굴을 파다 | 1,857,225 | 전치사 | 처음부터 |
11 | 밧줄로 묶다 | 1,686,741 | 글, 대명사 | 제3자 여성직접 목적어 |
12 | 유엔 | 1,659,827 | 기사 | a, a, a |
13 | 뽀뽀뽀뽀뽀를 하다 | 1,561,904 | 전치사 | 을 통해 |
14 | 속이다 | 1,481,607 | 전치사 | 와 함께 |
15 | 아니요. | 1,465,503 | 부사 | 아니, 아니다 |
16 | una | 1,347,603 | 기사 | a, a, a, one |
17 | su | 1,103,617 | 소유욕이 강한 | 그의/그녀의/네것/네것 |
18 | 파를 치다 | 1,062,152 | 전치사 | 하기 위해서 |
19 | es | 1,019,669 | 동사 | 이다 |
20 | al | 951,054 | 전치사 | 에게 |
21 | lo | 866,955 | 글, 대명사 | 제3자 남성적 직접 목적어 |
22 | 코모 | 773,465 | 접속사 | 로서 |
23 | mahs | 661,696 | 형용사 | 더 많은 |
24 | o | 542,284 | 접속사 | 또는 |
25 | 페로 | 450,512 | 접속사 | 그렇지만 |
26 | 의심하다 | 449,870 | 소유욕이 강한 | 당신의 |
27 | le | 413,241 | 대명사 | 제3인 간접 목적어 |
28 | ha | 380,339 | 동사 | 그/그녀가 [무엇을 해냈다]; 당신 (그)이 [무엇을 해냈다] |
29 | 나 | 374,368 | 대명사 | 나 |
30 | si | 327,480 | 접속사 | 만약, 어떻든 |
31 | 죄를 짓다 | 298,383 | 전치사 | 없이 |
32 | 음울한 | 289,704 | 전치사 | 위, 위, 위, 위, 위, 위, 위, 위. |
33 | 에스테 | 285,461 | 형용사 | 이 |
34 | 야 | 274,177 | 부사 | 가뜩이나 |
35 | 끼우다 | 267,493 | 전치사 | 사이에 |
36 | 쿠안도 | 257,272 | 접속사 | 할 때 |
37 | 하기 위해서 | 247,340 | 형용사 | 모두 |
38 | 에스타 | 238,841 | 형용사 | 이 |
39 | 톱니바퀴의 | 232,924 | 동사 | 되려고 |
40 | 아들 | 232,415 | 동사 | 그들은, 너(플)는 |
41 | 하다 | 228,439 | 번호를 붙이다 | 두 개 |
42 | 탐비엔 | 227,411 | 부사 | 또한, 또한, 또한 |
43 | 푸에 | 223,791 | 동사 | 있었다 |
44 | 하비아 | 223,430 | 동사 | I/그/그/그것이 있었다(혹은 있었다) |
45 | 시대 | 219,933 | 동사 | 있었다 |
46 | 뮤이 | 208,540 | 부사 | 매우 |
47 | 아뇨스 | 203,027 | 명사 (iii) | 몇 해 |
48 | 하스타 | 202,935 | 전치사 | 까지 |
49 | 데스데 | 198,647 | 전치사 | ~부터; 그 이후부터 |
50 | 이스타 | 194,168 | 동사 | 이다 |
51 | mi | 186,360 | 소유욕이 강한 | 나의 |
52 | 포크의 | 185,700 | 접속사 | 때문에 |
53 | 퀘 | 184,956 | 대명사 | 뭐?;어느것?; 얼마나 형용사적인가. |
54 | 실로 | 170,552 | 부사 | 오로지 |
55 | 한 | 169,718 | 동사 | 그들/당신[플]이 뭔가를 했다. |
56 | 이봐. | 167,684 | 대명사 | I |
57 | 건초 | 164,940 | 동사 | 있다/있다 |
58 | 채소를 | 163,538 | 명사 (iii) | 시간, 예 |
59 | 토하다 | 161,219 | 동사 | 통조림 |
60 | 할 일하다 | 158,168 | 형용사 | 모두 |
61 | asi | 155,645 | 부사 | 이런 거죠. |
62 | nos | 154,412 | 대명사 | 우리 |
63 | 니 | 153,451 | 접속사, 부사 | 어느 쪽도 아니다 |
64 | 파트를 치다 | 148,750 | 명사 (여성적/여성적) | 부분; 메시지 |
65 | 티엔느 | 147,274 | 동사 | 가지다 |
66 | 엘 | 139,080 | 대명사 (iii) | 그, 그거 |
67 | uno | 136,020 | 번호를 붙이다 | 하나 |
68 | 돈데 | 132,077 | 전치사 | 어디에 |
69 | 비엔날레의 | 130,957 | 형용사 | 좋아, 좋아, 좋아. |
70 | 티엠포 | 130,896 | 명사 (iii) | 시간; 날씨; 날씨 |
71 | 어울리지 않는 | 130,746 | 형용사 | 같은 |
72 | ese | 127,976 | 대명사 | 저것 |
73 | Ahora. | 125,661 | 부사 | 지금 당장 |
74 | 시체를 파다 | 124,558 | 결정권자 | 각각 |
75 | e | 123,729 | 접속사 | 그리고 |
76 | 비다 | 123,491 | 명사 (iii) | 인생 |
77 | 오트로 | 121,983 | 형용사 | 다른, 또 다른 |
78 | 전제군주 | 121,746 | 전치사 | 다음에 |
79 | te | 120,052 | 대명사 | 그대에게, 그대 자신을 위해 |
80 | 오트로스 | 119,500 | 대명사 | 다른이들 |
81 | 아운케 | 115,556 | 접속사 | 비록, 비록 |
82 | esa | 115,377 | 형용사 | 저것 |
83 | eso | 114,523 | 대명사 | 저것 |
84 | 하스 | 114,507 | 동사 | 그/그녀는/그것은/그냥 그렇다 |
85 | 오트라 | 113,982 | 형용사, 대명사 | 다른; 다른 것 |
86 | 고베로노 | 113,011 | 명사 (iii) | 관청의 |
87 | 햇볕에 그을리다 | 112,471 | 부사 | 그렇게 |
88 | 듀란테 | 112,020 | 전치사 | 하는 동안에 |
89 | 지엠프리 | 111,557 | 부사 | 항상 |
90 | 디아 | 110,921 | 명사 (iii) | 낮의 |
91 | 탄토 | 110,679 | 형용사, 부사 | 너무 많은 |
92 | 엘라 | 110,620 | 대명사 | 그녀, 그녀; 그것 |
93 | 트레스 | 109,542 | 번호를 붙이다 | 3개 |
94 | si | 108,631 | 명사, 대명사 | 예;반사 대명사 |
95 | dijo | 108,471 | 동사 | 말했다; 말했다; 말했다 |
96 | 시도 | 107,352 | 과거 분사 | 줄곧 그랬다 |
97 | 과립의 | 106,991 | 형용사 | 대, 대, 대 |
98 | 페이즈 | 104,568 | 명사 (iii) | 시골 |
99 | 세군 | 104,204 | 전치사 | 에 따르면 |
100 | 메노스 | 103,498 | 형용사 | 적게, 적게 |
마크 데이비스
2006년에 브리검 영 대학의 언어학 부교수인 마크 데이비스는 현대 스페인어에서 가장 흔한 5000개의 단어들에 대한 그의 추정치를 발표했다. 이 목록을 만들기 위해 그는 특히 1970년부터 2000년까지 20세기 출처에서만 샘플을 수집했다. 대부분의 출처는 1990년대 것이다. 말뭉치에 있는 2000만 단어 중 약 3분의 1(약 675만 단어)은 스페인어를 구사하는 대화, 인터뷰, 강연, 설교, 기자회견, 스포츠 방송 등 대화에서 나온다. 쓰여진 출처로는 소설, 연극, 단편 소설, 편지, 에세이, 신문, 그리고 백과사전 엔카르타가 있다. 이 샘플은 스페인, 그리고 적어도 10개의 중남미 국가에서 온 것이다. 표본 대부분은 앞서 13세기부터 20세기까지 작품이 포함된 1억 단어의 말뭉치인 코퍼스 델 에스파뇰(2001)을 위해 편찬된 것이다.[3][4]
데이비스의 목록에 있는 5000개의 단어는 레마이다.[5] 보조정리란 사전에 나올 법한 단어 형태다.[6] 예를 들어, 단수 명사와 플러랄은 부정과 동사 결합과 마찬가지로 같은 단어로 취급된다. 아래 표에는 데이비스의 5000개 목록에서 상위 100개 단어가 포함되어 있다.[7][8] 이 리스트는 lo와 la, 대명사 lo와 la를 구분하며, 모두 개별적으로 순위를 매긴다. ese와 esa라는 형용사는 (에스테와 에스타처럼) 함께 순위 매겨지지만, 대명사 eso는 별개다. 동사의 모든 결합은 함께 순위를 매긴다.
강조 표시된 행은 이 단어가 스페인어 구어의 표본에서 특히 자주 발생하는 것으로 확인되었음을 나타낸다.[9]
순위 | 보조정리 | 발생 횟수 | 발언의 일부 | 번역 |
---|---|---|---|---|
1 | el / la | 2,037,803 | 기사 | 그 |
2 | 드 | 1,319,834 | 전치사 | ~에서 |
3 | 대오를 짓다 | 662,653 | 접속사 | 저것, 저것 |
4 | y | 562,162 | 접속사 | 그리고 |
5 | a | 529,899 | 전치사 | 로, 로. |
6 | 에 | 507,233 | 전치사 | 에, 에 |
7 | 유엔 | 434,022 | 기사 | a, a, a |
8 | 톱니바퀴의 | 374,194 | 동사 | 되려고 |
9 | se | 329,012 | 대명사 | -자신,자신(자신) |
10 | 아니요. | 257,365 | 부사 | 아니요. |
11 | 큰 소리로 말하다 | 196,962 | 동사 | 가지기 위해 |
12 | 뽀뽀뽀뽀뽀를 하다 | 190,975 | 전치사 | 을 통해 |
13 | 속이다 | 184,597 | 전치사 | 와 함께 |
14 | su | 187,810 | 형용사 | 그의, 그녀, 그들의, 당신의 |
15 | 파를 치다 | 126,061 | 전치사 | 하기 위해서 |
16 | 코모 | 106,840 | 접속사 | 로서 |
17 | 층을 이루다 | 106,429 | 동사 | 되려고 |
18 | 테너 | 106,642 | 동사 | 가지기 위해 |
19 | le | 98,211 | 대명사 | 제3인 간접 목적어 |
20 | lo | 91,035 | 기사 | 그 |
21 | lo | 92,519 | 대명사 | 제3인칭 남성직접목적어 |
22 | 하기 위해서 | 88,057 | 형용사 | 모두 |
23 | 페로 | 82,435 | 접속사 | 하지만, 아직, 제외한다. |
24 | mahs | 92,352 | 형용사 | 더 많은 |
25 | 허수아비 | 81,619 | 동사 | 하는 것; 만드는 것; 만드는 것 |
26 | o | 82,444 | 접속사 | 또는 |
27 | 밀갈이하다 | 76,738 | 동사 | 할 수 있다, 할 수 있다 |
28 | 데커스를 바르다 | 79,343 | 동사 | 말하자면 |
29 | 에스테/에스타 | 80,544 | 형용사 | 이 |
30 | ir | 70,352 | 동사 | 포장이요 |
31 | 오트로 | 61,726 | 형용사 | 다른, 또 다른 |
32 | ese/esa | 60,989 | 형용사 | 저것 |
33 | 라의 | 55,523 | 대명사 | 제3인칭 여성직접물체 |
34 | si | 53,608 | 접속사 | 만약, 어떻든 |
35 | 나 | 95,577 | 대명사 | 나 |
36 | 야 | 46,778 | 부사 | 이미, 여전히 |
37 | 진부한 | 45,854 | 동사 | 보기 위해 |
38 | 포크의 | 44,500 | 접속사 | 때문에 |
39 | 똥을 싸다 | 40,233 | 동사 | 주다 |
40 | 쿠안도 | 39,726 | 접속사 | 할 때 |
41 | 엘 | 38,597 | 대명사 | 그 |
42 | 뮤이 | 39,558 | 부사 | 아주, 정말로 |
43 | 죄를 짓다 | 40,432 | 전치사 | 없이 |
44 | 채소를 | 35,286 | 명사 (iii) | 시간, 발생 |
45 | 뫼도 | 36,391 | 형용사 | 많이, 많이, 많이, 많이 |
46 | 사브르 | 37,092 | 동사 | 알다 |
47 | 퀘 | 42,000 | 대명사 | 뭐?;어느것?; 얼마나 형용사적인가. |
48 | 음울한 | 35,038 | 전치사 | 위, 위, 위, 위, 위, 위, 위, 위. |
49 | mi | 45,636 | 형용사 | 나의 |
50 | 알구노 | 30,485 | 형용사/대명사 | 몇몇; 어떤 사람 |
51 | 어울리지 않는 | 29,569 | 형용사 | 같은 |
52 | 이봐. | 54,635 | 대명사 | I |
53 | 탐비엔 | 33,348 | 부사 | 또한 |
54 | 하스타 | 29,506 | 전치사/부사 | 까지 |
55 | 아뇨 | 33,053 | 명사 (iii) | 연도 |
56 | 하다 | 27,733 | 번호를 붙이다 | 두 개 |
57 | 큐러 | 28,696 | 동사 | 원하다, 사랑하다 |
58 | 끼우다 | 30,756 | 전치사 | 사이에 |
59 | asi | 24,832 | 부사 | 이런 거죠. |
60 | 프리메로 | 26,553 | 형용사 | 맨 처음의 |
61 | 데스데 | 25,288 | 전치사 | ~부터, ~부터 |
62 | 거창하게 하다 | 25,963 | 형용사 | 대, 대, 대 |
63 | eso | 31,636 | 대명사 (중성자 성별) | 저것 |
64 | 니 | 24,261 | 접속사 | 조차, 조차도, 조차도 아니다 |
65 | nos | 26,349 | 대명사 | 우리 |
66 | 레가르 | 22,878 | 동사 | 도착하다 |
67 | 파사르 | 22,466 | 동사 | 지나가다; 공교롭게도; 시간을 보내다 |
68 | 티엠포 | 22,432 | 명사 (iii) | 시간, 날씨 |
69 | 엘라 | 24,770 | 대명사 | 그 여자; 그들; (그들 |
70 | si | 33,828 | 부사 | 네 |
71 | 디아 | 24,715 | 명사 (iii) | 낮의 |
72 | uno | 21,407 | 번호를 붙이다 | 하나 |
73 | 비엔날레의 | 21,589 | 부사 | 잘 |
74 | 포코 | 20,986 | 형용사/부사 | 조금, 아주 조금 |
75 | 드버 | 22,232 | 동사 | 마땅히 그래야 한다. 빚을 지어야 한다. |
76 | 결탁하다 | 23,548 | 부사 | 그렇다면 |
77 | 곰곰이 생각하다 | 20,330 | 동사 | [사설]; 을 붙이다 |
78 | 코사 | 23,943 | 명사 (iii) | 것 |
79 | 탄토 | 20,531 | 형용사 | 많이 |
80 | 홈브레어 | 20,292 | 명사 (iii) | 인간, 인류, 남편 |
81 | 파레서 | 19,964 | 동사 | 보이는 것, 보이는 것 |
82 | 뉴에스트로 | 20,666 | 형용사 | 우리의 |
83 | 햇볕에 그을리다 | 19,002 | 부사 | 그까짓, a, 그까짓 것 |
84 | 돈데 | 18,852 | 접속사 | 어디에 |
85 | Ahora. | 21,030 | 부사 | 지금 당장 |
86 | 파트를 치다 | 20,319 | 명사 (iii) | 부분, 부분 |
87 | 전제군주 | 20,229 | 부사 | 다음에 |
88 | 비다 | 18,045 | 명사 (iii) | 인생 |
89 | 퀘다르 | 18,152 | 동사 | 남아서, 남아서 |
90 | 지엠프리 | 17,689 | 부사 | 항상 |
91 | 삐걱거리다 | 21,257 | 동사 | 믿다 |
92 | 아블라르 | 19,006 | 동사 | 말하기, 말하기 |
93 | 릴레바 | 17,062 | 동사 | 가져가기, 가지고 가다 |
94 | 데자르 | 18,185 | 동사 | 내버려두다, 떠나다 |
95 | 나이다 | 19,365 | 대명사 | 아무 것도 없어요. |
96 | 시체를 파다 | 17,155 | 형용사 | 하나하나 |
97 | 세귀르 | 16,104 | 동사 | 따라가다 |
98 | 메노스 | 15,527 | 형용사 | 더 적게, 더 적게 |
99 | 누에보 | 17,381 | 형용사 | 새로운 |
100 | 콘트라라르 | 15,556 | 동사 | 찾기 위해서. |
참고 항목
메모들
- ^ a b "CREA". RAE.es (in Spanish). Real Academia Española. Retrieved 2017-07-13.
- ^ "Corpus de Referencia del Español Actual (CREA) — Listado de frecuencias". RAE.es (in Spanish). Real Academia Española. Retrieved 2017-07-13.
- ^ 데이비스(2006), 페이지 2-3
- ^ "El Corpus del Español". corpusdelespanol.org. Retrieved 2017-07-13.
- ^ 데이비스(2006), 페이지 4-6
- ^ 데이비스(2006), 페이지 4
- ^ 데이비스(2006), 페이지 12-14
- ^ "Top Spanish Vocabulary". Vistawide World Languages & Cultures. Retrieved 2017-07-13.
- ^ 데이비스(2006), 페이지 9
참조
- Davies, Mark (2006). A Frequency Dictionary of Spanish: Core Vocabulary for Learners. Routledge. OCLC 300359892.
외부 링크
- Cardellino, Cristian (March 2016). "Spanish Billion Words Corpus and Embeddings". crscardellino.github.io. Cristian Cardellino.