위키백과:쿼리 요청

Wikipedia:

특정 기준에 대한 일회성 데이터베이스 쿼리를 요청하는 페이지 입니다.프로젝트에 관심이 있고 SQL 질의를 수행할 수 있는 사용자는 Quarry 웹사이트에서 결과를 제공할 수 있다.

다음 사항에도 관심이 있을 수 있다.

  • SQL 쿼리를 작성하거나 여기에서 도움을 받으려면 팁 페이지를 방문하십시오.
  • 특정 기준에 맞는 기사 제목 목록을 얻으려면 PetScan(사용자 설명서) 또는 기본 검색을 사용하십시오.펫은 하위 카테고리의 기사 목록, 일부 템플릿을 초월하는 기사 등을 생성할 수 있다.
  • 특정 질의를 바탕으로 다수의 기사를 변경해야 할 경우, 변경이 필요한 개수에 따라 봇 요청 페이지에 게시할 수 있다.
  • 장기적인 검토와 확인을 위해 데이터베이스 보고서를 이용할 수 있다.

누락된 colo(u)r 리디렉션

다른 철자가 있는 페이지가 없는 리디렉션/해제 상태에 관계없이 "colo(u)r" 단어의 철자 또는 파생어가 포함된 모든 메인 스페이스 및 위키백과 네임스페이스 페이지 목록을 얻을 수 있는가?동물애호가 666 (대화) 09:57, 2022년 2월 13일 (UTC)[응답]

  • 페이지 제목 덤프(여기서; "모든 제목 검색")를 검사하는 것이 더 쉽고 유연할 것이다. 제목과 찾고 있는 문자열 외에 다른 제한이 없기 때문이다.크립틱 10:31, 2022년 2월 13일 (UTC)[응답]
질문은 당신이 필요로 하는 것일지도 모른다.그것은 "유래된 단어"를 Color 또는 Colour를 포함하는 것으로 자유롭게 해석한다; 당신은 Colorado를 원했지만 Colorado는 원하지 않았을 것이다.그 리스트에 있는 모든 것이 방향을 바꿀 가치가 있다고 생각하지 않아.인증서 (대화) 13:23, 2022년 2월 13일 (UTC)[응답]

쿼리를 최적화하는 데 도움이 되십니까?

페이지_랜덤 값과 다음으로 작은 페이지_랜덤 값(again, non-redirect, non-dab) 사이의 간격이 작은 페이지(again, non-direction, non-dab) 페이지를 선택하려고 한다.나는 여기에 질의가 있는데, 이것은 페이지의 작은 부분 집합으로 제한될 때 작동하지만, 페이지_랜덤 값의 범위를 완화할 때 매우 심하게 확장된다.내가 전체 페이지 테이블(또는 적어도 더 큰 페이지 테이블)에서 실행할 수 있는 최적화를 제안할 수 있는 사람이 있다면 나는 매우 감사할 것이다.콜린 M (대화) 18:35, 2022년 3월 4일 (UTC)[응답]

나는 일요일까지 볼 수 있다.트랑가벨람 (대화) 18:41, 2022년 3월 4일 (UTC)[응답]
로운룸에서 복사본을 인덱싱할 수 없기 때문에 작업은 x시간이2 걸린다.여기서 LAG는 유용한가?Certes (talk) 18:55, 2022년 3월 4일 (UTC)[응답]
이게 바로 내가 필요로 했던 거야!이전에 StackOverflow에서 LAG에 대한 몇 가지 언급을 보고 LAG를 사용해 본 적이 있었는데 구문 오류가 발생하여 SQL 사투리/버전 Quarry가 사용하는 어떤 것에서도 기능이 지원되지 않는다고 가정했다.내가 잘못 쓰고 있었던 게 틀림없어.당신이 링크한 문서를 바탕으로 나는 LAG를 사용하여 새로운 질의어를 작성할 수 있었는데, 그 순서는 더 빨랐다.정말 고마워, Certes!콜린 M (토크) 20:33, 2022년 3월 4일 (UTC)[응답]

1인당 GA/FA별 국가 지도

이것은 순전히 호기심(또는 가능한 표지판 기능)을 위한 것이므로 관심이 있는 경우에만 그것을 들어라.그러나 나는 각 나라가 1인당 얼마나 많은 좋은 기사를 가지고 있는지, FA와 비슷한 기사를 가지고 있는지를 보여주는 세계 지도를 만들고 싶다.이에 대한 쿼리는 다음과 같은 카테고리의 기사가 될 것이다.좋은 기사(또는 카테고리:주요 기사) Wikidata 항목에 국가(P17)가 지정된 국가로 설정된 경우.그런 다음 이 맵들은 우가포드의 {{Interactive COVID-19 맵}}과 유사한 인터랙티브 맵을 음영 처리하도록 조정될 것이다.{{u Sdkb}}08:06, 2022년 3월 17일 (UTC)[응답]

대규모 데이터셋을 사용하는 GA의 경우:

우승자는 여전히 그린란드지만 아이슬란드의 예외적인 성적은 요행수가 아닌 것 같다.나는 그것이 왜 (그리고 노르웨이도)가 궁금하다.그리고 난 인도가 형편없을 거라고 기대했지만...지즈.GA가 없는 것으로 보이는 유일한 두 나라는 투르크메니스탄기니비사우뿐인데, 나는 그들에 대한 보상을 하러 갈 것이다.{{u Sdkb}} 19:17, 2022년 3월 17일 (UTC)[응답]

@Sdkb: 나는 위키프로젝트 투르크메니스탄이 1개의 GA(이르기즈 강에서의 전투)를 가지고 있다고 말하는 반면, 위키프로젝트 기니비사우는 2개의(2012년 기니비사우 쿠데타와 기니비사우 여자 축구 국가대표팀)를 가지고 있다고 말하는 것에 주목한다.나는 너의 쿼리에 오류가 있다고 생각한다.크리스 트라우트먼 (대화)20:17, 2022년 3월 17일 (UTC)[응답]
@크리스 송어맨, 찾아줘서 고마워!그건 분명 불완전한 질문이야—어르기즈 강에서의 전투는 위키다타에 대한 어떤 국가 정보도 가지고 있지 않기 때문에 놓친 것이지만, 기니비사우에 대해서는 확실하지 않다.{{u Sdkb}}talk20:21, 2022년 3월 17일 (UTC)[응답]
기니비사우는 나를 위해 두 가지 질문에서 좋은 기사 2개를 들고 나타난다.크립틱 21:13, 2022년 3월 17일 (UTC)[응답]
나는 이 오류를 다시 찾아냈다.{{u Sdkb}}talk 21:43, 2022년 3월 17일 (UTC)[응답]
@Sdkb: 이것은 꽤 매혹적이지만, 위의 스크롤되는 이미지는 내게는 통하지 않는 것 같다.만약 당신이 어떤 종류의 정적인 이미지를 얻는다면, 나는 WP에 추가하는 것이 재미있을 것이라고 생각한다.나라들.CMD (대화) 05:57, 2022년 3월 27일 (UTC)[응답]
@Chipmunkdavis, 아이디어의 다음 반복은 위키백과에 있다.빌리지_펌프_(기술)#푸시핀_map_of_the_worlds_s_s_FA, 궁금하다면.WP:카운트리가 그것을 추가하기에 분명히 좋은 곳이 될 거야!{{u Sdkb}} 06:02, 2022년 3월 27일 (UTC)[응답]

Symbol redirect vote2.svg 커티시 링크(푸시핀): VPT Archive 196매트릭스글롯 (대화) 04:02, 2022년 4월 2일 (UTC)[응답]

위키프로젝트의 고아, 그리고 제대로 연결되지 않은 기사들

안녕, 나는 위키프로젝트의 작업 목록으로 도움이 될 수 있는 고아 목록과 인링크가 거의 없는 기사 목록을 만드는 것에 관심이 있어.우선, 그리고 삽화와 실제의 예로서, 나는 WP에 분류된 고아 기사들의 리스트에 관심이 있다.위키프로젝트 군사 역사("주공간의 다른 페이지에서 인링크가 없는 기사로 정의된 "orphan"; "Wiki Project X"는 관련 토크 페이지에 템플릿 {{Wiki Project X} 또는 리디렉션 중 하나가 포함되어 있음을 의미한다.)나는 전혀 같지 않지만 "1,259" 결과는 실제 고아들의 수에 대한 낮은 한계일 수도 있는 이 진보된 검색을 찾을 수 있었다.

어떤 긴 기사 목록을 작성하기 전에 먼저 문제의 범위에 대한 느낌을 받고 싶다.따라서 첫 번째 db 질의로서 우리는 두 개의 값을 포함하는 11개의 행을 반환하는 요약 질의를 할 수 있다. 여기서 1열('inlinks의 nbr'라고 부르자)은 0부터 10까지의 정수를 포함하고, 2열('기사 수')은 WP의 기사 수(ns=0)이다.위키프로젝트 군사 역사에는 다른 메인 스페이스 기사의 인링크 수가 정확히 포함되어 있다.따라서 예를 들어, 상단 데이터 행에는 왼쪽의 '0'이 포함되며, WP의 고아 수는 다음과 같다.오른쪽의 MILHIST.다음 행, '1' 및 메인 스페이스에서 정확히 한 개(자체 이외의) 링크가 있는 MILHIST 기사 수입니다.등등.

기사 수가 너무 많지 않다면 MILHIST의 고아 기사 목록에도 한 개의 칼럼이 들어 있는 두 번째 질의를 할 수 있을까?리디렉션은 건너뛰고, 다른 것도 잊어버릴 수 있지만, 위키백과 주제의 "ToDo" 아티클 목록에서 유용하지 않은 것도 건너뛰어야 한다.기사 제목을 위키링크로 요청할 수 있다면, 편리할 것이고, WikiData의 Wikilinked Q-item을 포함하는 두 번째 컬럼을 하나 이상의 비영어 위키백과 링크(즉, >=1 link)를 가진 기사(즉, en-wiki와 단순을 제외)에 추가하는 것이 그리 어렵지 않다면 이상적일 것이다. (예:올가 보그다노바고아지만 d:Q26243976이 붙어 있고, 두 개의 비영어 위키백과 기사(ar, ru)를 포함하고 있다. 따라서 이 경우 2번 대령은 d:Q26243976이 될 것이다.고마워!매트릭스글롯 (토크) 02:02, 2022년 4월 2일 (UTC)[응답]

채석장:요약을 위해/63558, 전체 리스트를 위해 채석장:158/63559(행 7만5000개만 부족하므로 적재하는 데 시간이 소요됨).서버가 분할된 후 위키다타 데이터에 가입할 수 있는 방법이 있다면 나도 모르겠다.크립틱 13:05, 2022년 4월 2일 (UTC)[응답]
잘했어; 나는 이것을 어떻게 효율적으로 할 수 있는지 궁금했어.1여단과 같은 일부 연결되지 않은 페이지는 더 이상의 링크가 필요하지 않은 dabs이며, 명백한 고아들은 리디렉션을 통해 연결될 수 있다.인증서 (대화) 13:23, 2022년 4월 2일 (UTC)[응답]
(1971년 전쟁(동음이의)에서 1971년 전쟁까지) 리디렉션에서 직접 들어오는 링크 역시 계산되어서는 안 된다. - 수신 링크가 전혀 없는 모든 기사에 대해, 수신 링크는 레디르에서만 나오는 다른 4개가 있었다.(다른 페이지로 연결되는 리디어가 있을 수 있다. 리디어가 다른 페이지로 연결되는 리디어가 있을 수 있다. 리디어가 제거되기도 하지만 매우 드물고, 그렇게 해서는 안 되며, 링크가 어쨌든 표시되지 않을 것이다.그것들과 다브들을 제거하는 것은 문제가 되지 않는다: 채석장:query/63563 (요약), 채석장:query/63564 (전체 목록)
(hypotheptical) 리디렉션 알파에서 베타로 연결되는 리디렉션을 통해 들어오는 링크를 계산하는 것은 하나의 질의에서 하기 어렵다.대규모 집계 쿼리는 고사하고 단 한 페이지도 효율적으로 작동시킬 수가 없다.크립틱 15:06, 2022년 4월 2일 (UTC)[응답]
정말 고마워.나는 두 버전의 차이점이 무엇인지 좀 헷갈리는데, 각각의 첫 번째 줄의 크기는 1:4로 차이가 난다.dab 페이지는 포함하면 안 되는 부분은 이해하지만, 조회수 63558을 63563으로 수정한 후 카운트를 줄여야 하지 않을까?두 번째 것은 인링크가 거의 없는 dabs를 포함한 것인가, 아니면 제외하는 것인가?첫 번째 행에서 4배 더 큰 카운트를 설명하는 것은?실제적인 문제로서, 우리가 인링크 없이 기사를 수정하고 싶다면, 어떤 것이 더 좋은 질의 결과 목록인가, '1206' 혹은 '4125' 기사를 가리키는 것인가?다른 말로 하자면, 이 두 숫자가 무엇인지 영어로 어떻게 설명해야 프로젝트 멤버들에게 설명할 수 있을까?매트릭글롯 (대화) 21:13, 2022년 4월 2일 (UTC)[응답]
63563은 63559보다 약간 더 많은 기사를 보여준다.추가 기사에는 리디렉션을 포함하여 10개 이상의 수신 링크가 있었지만, 현재 리디렉션을 제외한 10개 이하의 링크가 있다.증가폭은 더 크겠지만, 다브를 제외함으로써 감소한다.Certes (talk) 21:57, 2022년 4월 2일 (UTC)
63558은 1열의 '1206'(inlinks=0)을 나타내고, 63563은 1열의 '4125'를 나타낸다. 이 숫자들이 정확히 무엇을 의미하며, 왜 큰 차이가 나는가?'1206'은 "프로젝트에는 순환 리디렉션을 제외하고 메인스페이스가 0으로 연결된 1206개의 메인스페이스 페이지가 있다"는 뜻일 것 같은데, 맞나?'4125'는 무엇을 의미하는가?매트릭스글롯 (대화) 22:02, 2022년 4월 2일 (UTC)[응답]
두 번째 쿼리 쌍은 dabs를 제거하지만 리디렉션 페이지의 inlink도 계산하지 않는다.1-2 챠서 연대와 같은 기사는 1-2 챠서 연대로 리디렉션되는 1-2 챠서 연대의 링크에도 불구하고 1차 질의에서 하나의 인바운드 링크를 가진 것으로 간주되었다.두 번째 방법은 인바운드 링크가 없는 것으로 정확하게 계산하며, 해당 리디렉션에 대한 링크가 없는 한 리디렉션을 만들어 기사를 실제로 분리하지 않는다.프로젝트에는 1206페이지에 메인 스페이스 페이지가 전혀 연결되어 있지 않으며, 4125페이지에 연결된 페이지 없이 해당 페이지로 리디렉션되는 것 외에는 메인스페이스 페이지가 없다.크립틱 22:12, 2022년 4월 2일 (UTC)[응답]
아하, 이제 알겠어.고마워요.매트릭글롯 (대화) 22:26, 2022년 4월 2일 (UTC)[응답]
나는 채석장:query/63571에 리디렉션 링크를 포함하려고 시도했다.이것은 리디렉션 링크가 포함되면 10 링크 제한을 초과하는 11,000개의 기사를 삭제한다.기본적으로 크립틱의 쿼리, 슬라이스 및 재조립, 그리고 리디렉션된 테이블에 대한 간단한 방문이지만, 나는 체크 표시를 할 수 있다.WITH RECURSIVEI-Spy의 SQL 키워드 책에서.링크수별 분석은 0:1540, 1:5586, 2:8008, 3:9115, 4:8892, 5:7756, 6:6817, 7:6045, 8:5156, 9:4545, 10:4104이다.인증서 (대화) 23:32, 2022년 4월 2일 (UTC)[응답]
훌륭한 정교함, 그리고 처음 두세 줄의 줄은 아마도 시간이 지남에 따라 음모를 꾸밀 가치가 있을 것이다.그래프를 표시할 수 있는 확장자나 템플릿이 있는지, 아니면 X 간격마다 한 번씩 커먼스에 업로드할 수 있는 그래프를 만들 수 있는 도구가 있는지 알아보겠다.그런데 요약 수치는 어디서 구했어, 안 보여?인접한 채석장 번호 몇 개를 확인했지만 여전히 찾을 수 없다.이 값들은 주기적으로 재실행하고 싶은 쿼리에서 나온 값들이니, 그것과의 링크가 좋을 것이다.
흥미로운 패턴이군 안 그래?3에서 정점을 찍은 오목한 곡선.저기 자료 속에 숨겨진 내러티브가 있는지 궁금하시죠?나는 이런 것을 추측한다. " 페이지를 만든 후, 편집자는 그것을 링크하기 위해 3개의 기사를 찾아간다.그들은 '3'이 되면, 그것을 나머지 프로젝트에 통합하는 의무를 다했고, 그들은 끝장났다고 생각한다.어떤 과업자는 더 많이 하고, 게으른 사람은 덜 한다."아니면, 당신의 서술은 무엇인가? (나는 *요청*에 대해 동의하지만, 이 자료들은 생각할 흥미로운 그림을 그린다.)매트릭스글롯 (토크) 00:10, 2022년 4월 3일 (UTC)[응답]
들어오는 링크의 수는 포아송 분포와 유사할 수 있으며, 모든 관련 기사는 거의 고형물과 연결될 가능성이 있다.나는 SQL에서 계산을 하지 않았다: 데이터를 다운로드하고 커투니크를 실행하는 것이 훨씬 빠르다!나는 단일 결과 집합의 시작 부분에 총계를 포함하도록 고약한 해킹을 한 채석장:쿼리/63580을 갈랐다.링크 대상 목록(기사 제목+리디렉션)도 추가했는데, "로 구분되어 있다. Certes (토크) 12:36, 2022년 4월 3일 (UTC)[응답]
두 번 이상의 결과 집합(예: 채석장:query/28650)을 얻기 위해 해킹할 필요는 없지만, 두 번 이상의 값비싼 쿼리를 실행하는 것을 피하려면 여전히 여기서 이 결과를 사용하는 것이 낫다.크립틱 13:12, 2022년 4월 3일 (UTC)[응답]
두 결과 세트에 모두 WIT를 적용할 수 없다는 뜻이었어.임시 테이블이 아닌 테이블은 세미콜론의 어떤 기미에도 사라지는데, 이것은, 당신이 말한 것처럼, 비싼 부분을 반복한다는 것을 의미한다.인증서 (대화) 13:34, 2022년 4월 3일 (UTC)[응답]
오, 정말 좋구나, 고마워!내가 정확하게 이해하면(그 중 일부만) 유니온 위의 부분은 11개의 요약 행을 모으고 그 아래 부분은 긴 기사 목록을 수집하며, 해킹은 어떻게든 사물의 이름을 바꾸거나 다시 붙여서 같은 종류의 물건처럼 보이게 하고, 그것들이 같은 열에 나타날 수 있도록 하고, 그 다음에 d를 하는 식으로 분류되는 것을 포함한다.11개의 요약 행을 먼저 심판하다; 그것이 대략적으로 거기에서 일어나고 있는 일인가?나는 단지 너희 둘 다 이것을 발전시키는 것뿐만 아니라 여러 가지 정밀한 결과를 초래하는 인터플레이를 보는 것을 매우 고맙게 생각하고 즐겼다고 말하고 싶었는데, 너도 그것을 즐겼기를 바란다.여기 승자가 있는 것 같은데, 이건 가끔 재방송하는 "정규적인 질문"이 될 수 있어.너희 둘 다 정말 고마워!매트릭글롯 (대화) 17:31, 2022년 4월 3일 (UTC)[응답]
그래, 그렇게 된 거야.최종 단계는 두 개의 별도 쿼리로서 읽기 쉽고 유지보수가 가능하겠지만, Quarry 프레임워크 내에서 실행하면 서버 부하와 대기 시간을 두 배로 늘리면서 어려운 작업을 두 번 수행할 수 있다.인증서 (대화) 21:09, 2022년 4월 3일 (UTC)[응답]
@Certes:알았어, 고마워.마지막으로 한 가지:내가 이걸 채석장에 가져갔어. 63623을 돌려서 운영할 수 있게.만약 네가 63580으로 장난을 치거나 좀 더 세게 친다면, 나에게 ping을 해서 나에게 알려주면 내가 또 다른 것을 지게 할 수 있겠니?그렇지 않으면 우린 끝인 것 같아.고마워!매트릭글롯 (대화) 20:44, 2022년 4월 5일 (UTC)[응답]
그럴게, 더 이상 손댈 생각은 없지만.(그런데, 채석장:query/63623이다.엽기적으로, 채석장:63623은 그 이름의 사용자를 찾는다.)인증서 (대화) 22:08, 2022년 4월 5일 (UTC)[응답]
또한, 피기백 질문: 일주일에 한 번, 혹은 한 달에 한 번, 혹은 고아들을 줄이는 과정을 관찰하고 싶다면 xtools나 WikiProjet 페이지에서 액세스할 수 있는 어떤 도구로 카운트를 연결하고 간단한 시계열 그래프를 막대 차트나 선 그래프로 생성하여 h를 표시하십시오.시간이 지남에 따라 계산이 달라지는가?그것이 이상적일 것이다.고마워, Mathglot (대화) 21:18, 2022년 4월 2일 (UTC)[응답]
위키백과에서 쿼리를 다시 실행하는 방법에 대한 지침:질의/아카이브 요청 1#신규 창간된 장로교 기사.크립틱 22:12, 2022년 4월 2일 (UTC)[응답]
고마워. Mathglot (토크) 00:10, 2022년 4월 3일 (UTC)[응답]

이것은 단순한 호기심 이상의 것이었고, 나는 그것이 고아들의 밀린 일감축소에 큰 개선으로 이어지기를 바란다.위키프로젝트 군사 역사에 파일럿을 만들었는데, 따라가는 데 관심이 있으시면 위키백과 대화를 참고하십시오.위키프로젝트 군사 역사#기사를 해체하고 데모 페이지 링크를 따라가십시오.매트릭스글롯 (토크) 01:01, 2022년 4월 4일 (UTC)[응답]