랜덤 테스트

무작위 시험은 무작위적이고 독립적인 입력을 생성하여 프로그램을 테스트하는 블랙박스 소프트웨어 시험 기법이다.출력 결과를 소프트웨어 사양과 비교하여 테스트 출력이 합격 또는 불합격인지 확인한다.^[1]사양이 없는 경우 언어의 예외를 사용하며, 이는 시험 실행 중에 예외가 발생하면 프로그램에 결함이 있음을 의미하며, 편향된 시험을 피하기 위한 방법으로도 사용된다.

무작위 시험의 이력

하드웨어에 대한 무작위 시험은 1971년 멜빈 브뢰어에 의해 처음 조사되었고, 그 효과성을 평가하기 위한 초기 노력은 1975년 프라티마와 비슈와니 아그라왈에 의해 수행되었다.^[2]

소프트웨어에서 듀란과 Ntafos는 1984년에 무작위 시험을 검사했다.^[3]

무작위 검사에 대한 이론적 근거로서 가설 검사의 사용은 기능 검사 및 분석에서 Howden에 의해 설명되었다.이 책에는 또한 1/n 이하의 고장률에서 최소한 1-1/n의 신뢰도를 갖기 위해 필요한 시험 n의 수를 추정하기 위한 간단한 공식의 개발도 포함되어 있다.이 공식은 하한선 nlogn으로, 이것은 많은 수의 무고장 시험들이 심지어 약간의 고장률에 대한 약간의 신뢰도를 갖도록 요구되었음을 나타낸다.^[4]

개요

다음 C++ 함수를 고려하십시오.

인트로 myAbs(인트로 x) {     만일 (x > 0) {          돌아오다 x;     }     다른 {         돌아오다 x; // 버그: '-x'여야 함     } }

이제 이 기능에 대한 무작위 테스트는 {123, 36, -35, 48, 0}이(가) 될 수 있다.'-35' 값만 버그를 트리거한다.결과를 확인할 참조 구현이 없다면 버그는 여전히 눈에 띄지 않게 될 수 있다.그러나 다음과 같은 주장을 추가하여 결과를 확인할 수 있다.

공허하게 하다 testAbs(인트로 n) {     을 위해 (인트로 i=0; i<n; i++) {         인트로 x = getRandomInput();         인트로 결과 = myAbs(x);         주장하다(결과 >= 0);     } }

참조 구현은 예를 들어, 성능을 향상시키기 위해 훨씬 더 복잡한 방법으로 간단한 알고리즘을 구현할 때 이용할 수 있다.예를 들어 Shönhage-Strassen 알고리즘의 구현을 테스트하기 위해 정수에 대한 표준 "*" 연산을 사용할 수 있다.

인트로 getRandomInput() {     // … }  공허하게 하다 테스트고속 곱하기(인트로 n) {     을 위해 (인트로 i=0; i<n; i++) {         장기의 x = getRandomInput();         장기의 y = getRandomInput();         장기의 결과 = 빠른 곱하기(x, y);         주장하다(x * y == 결과);     } }

이 예는 단순한 유형(단순 무작위 생성기를 사용할 수 있는 유형)으로 한정되지만, 객체 지향 언어를 대상으로 하는 도구는 일반적으로 프로그램을 탐색하여 생성기(구조자 또는 해당 유형의 객체를 반환하는 방법)를 테스트하고 찾아 무작위 입력(자체도 동일한 방식으로 생성되거나 또는 를 사용하여 생성됨)을 사용하여 호출한다.가능한 경우 의사-유도 생성기 발생기).그런 다음 이러한 접근방식은 무작위로 생성된 개체의 풀을 유지하고 생성된 개체를 재사용하거나 새 개체를 생성할 확률을 사용한다.^[5]

무작위로

D의 무작위 시험에 관한 세미날 논문에 따르면.햄릿

[..] "시험평가"의 기술적, 수학적 의미는 시험 데이터의 선택에서 명시적으로 "시스템"이 부족하여 다른 시험들 사이에 상관관계가 없음을 의미한다.^[1]

장단점

무작위 시험은 다음과 같은 강도에 대해 칭찬한다.

그것은 사용하는 것이 싸다: 그것은 시험 중인 프로그램에 대해 현명할 필요가 없다.
그것은 어떤 편향도 가지고 있지 않다: 수동 테스트와 달리, 일부 코드에서 잘못된 신뢰가 있기 때문에 버그를 간과하지 않는다.
버그 후보를 찾는 것은 빠르다: 일반적으로 테스트 세션을 수행하는 데 몇 분이 걸린다.
소프트웨어가 제대로 지정되면: 실제 버그를 발견한다.

다음과 같은 약점이 설명되었다.

기본 버그(f.ex. null 포인터 비참조)만 찾는다.
그것은 명세서와 명세가 전형적으로 부정확한 것만큼 정확할 뿐이다.
버그를 찾는 다른 기술(예: 정적 프로그램 분석)과 비교가 잘 안 된다.
각 시험 주행에서 서로 다른 입력을 무작위로 선택하는 경우, 동일한 시험이 무작위로 통과하거나 실패하기 때문에 연속 통합에 문제가 발생할 수 있다.^[6]
어떤 이들은 무작위성에 의존하기보다는 수동으로 구성한 테스트로 모든 관련 사례를 화이트박스 방식으로 신중하게 다루는 것이 낫다고 주장한다.^[6]
이 경우, 중간 정도의 고장률에 대한 신뢰도를 얻기 위해 매우 많은 수의 시험이 필요할 수 있다.예를 들어, 고장 확률이 100분의 1 미만이라는 최소 99%의 신뢰도를 가지려면 459개의 무고장 시험이 필요하다.^[4]