트러블 슈팅
Troubleshooting트러블 슈팅은 문제 해결의 한 형태로, 기계 또는 시스템의 고장 제품 또는 프로세스를 수리하기 위해 자주 사용됩니다.문제를 해결하고 제품 또는 프로세스를 다시 작동시키기 위해 문제의 원인을 논리적이고 체계적으로 검색하는 것입니다.증상을 식별하려면 트러블 슈팅이 필요합니다.가장 가능성이 높은 원인을 특정하는 것은 문제의 잠재적 원인을 제거하는 프로세스입니다.마지막으로, 트러블 슈팅을 실시하려면 , 솔루션이 제품 또는 프로세스를 동작 상태로 복원하는 것을 확인할 필요가 있습니다.
일반적으로 트러블 슈팅이란 어떤 종류의 장애로 인해 발생하는 시스템 관리 흐름의 "문제"를 특정 또는 진단하는 것입니다.이 문제는 처음에는 오작동 증상으로 설명되며, 트러블 슈팅은 이러한 증상의 원인을 파악하고 해결하는 프로세스입니다.
시스템은 예상되는 동작, 바람직한 동작 또는 의도된 동작(일반적으로 인공 시스템의 경우 그 목적)의 관점에서 설명할 수 있습니다.시스템에 대한 이벤트 또는 입력은 특정 결과 또는 출력을 생성하도록 요구됩니다(예를 들어, 다양한 컴퓨터 응용 프로그램에서 "인쇄" 옵션을 선택하면 특정 장치에서 하드카피가 생성됩니다).예기치 않은 동작이나 바람직하지 않은 동작은 모두 증상입니다.트러블 슈팅은 증상의 특정 원인을 특정하는 프로세스입니다.대부분의 경우, 이 증상은 제품이나 프로세스가 결과를 내지 못하는 실패입니다.(예를 들어 아무것도 인쇄되지 않았습니다).그런 다음 유사한 종류의 추가 고장을 방지하기 위해 시정 조치를 취할 수 있습니다.
포렌식 엔지니어링 방법은 제품 또는 프로세스의 문제를 추적하는 데 유용하며 특정 장애의 원인 또는 원인을 파악하기 위해 광범위한 분석 기법을 사용할 수 있습니다.그런 다음 유사한 종류의 추가 고장을 방지하기 위해 시정 조치를 취할 수 있습니다.본격적인 생산 전에 고장 모드 및 효과(FMEA) 및 고장 트리 분석(FTA)을 이용하여 예방 조치를 취할 수 있으며, 이러한 방법을 고장 분석에도 사용할 수 있다.
양상
통상, 트러블 슈팅은, 이전의 동작 상태가 계속 동작하는 것에 대한 예상치를 형성하기 때문에, 갑자기 동작을 정지한 것에 적용됩니다.그 때문에, 초기 초점은, 시스템이나 현재의 환경에의 최근의 변경(예를 들면, 「저쪽에서 접속했을 때에 동작하고 있던 프린터」등)에 있습니다.그러나 상관관계가 인과관계를 의미하지 않는다는 잘 알려진 원칙이 있다. (예를 들어 장치가 다른 콘센트에 꽂힌 직후에 고장이 났다고 해서 반드시 사건이 관련이 있는 것은 아니다.)실패는 우연의 일치일 수 있습니다.)따라서 트러블 슈팅은 마법적인 사고보다는 비판적인 사고를 필요로 합니다.
전구에 대한 일반적인 경험을 고려하는 것은 유용하다.전구는 무작위로 "소멸"됩니다. 결국 필라멘트의 반복적인 가열과 냉각과 공급되는 전력의 변동으로 필라멘트가 균열을 일으키거나 증발합니다.대부분의 다른 전자기기에도 동일한 원칙이 적용되며 기계장치에도 유사한 원칙이 적용된다.일부 장애는 시스템 구성 요소의 일반적인 마모의 일부입니다.
트러블 슈팅의 첫 번째 기본 원칙은 원하는 대로 문제를 재현할 수 있도록 하는 것입니다.트러블 슈팅의 두 번째 기본 원칙은 '시스템'을 문제를 나타내는 가장 단순한 형태로 줄이는 것입니다.트러블 슈팅의 세 번째 기본 원칙은 "찾고 있는 것을 아는 것"입니다.즉, 시스템이 동작하는 방법을 완전히 이해하고, 에러가 발생했을 때에 에러를 「검출」할 수 있습니다.
트러블 슈팅에서는 시스템 내의 각 컴포넌트를 1개씩 체크하고 문제가 발생할 가능성이 있는 컴포넌트를 정상적인 컴포넌트로 대체할 수 있습니다.그러나 이러한 "직렬 치환"의 과정은 그 기능 상실이 어떻게 증상을 진단할 수 있는가에 관한 가설에 관계없이 성분이 치환될 때 퇴화된 것으로 간주될 수 있다.
단순 및 중간 시스템은 구성 요소 또는 하위 시스템 간의 종속성 목록 또는 트리로 특징지어집니다.보다 복잡한 시스템에는 순환 의존성 또는 상호 작용(피드백 루프)이 포함됩니다.이러한 시스템은, 「이중」트러블 슈팅 기법의 적용을 받기 어렵습니다.
또, 정상적인 상태로부터 기동할 때도 도움이 됩니다.가장 좋은 예는 컴퓨터를 재부팅하는 것입니다.인지적 워크스루도 시도해 볼 만하다.숙련된 기술 라이터가 작성한 포괄적인 문서는 특히 대상 기기 또는 시스템의 작동 이론을 제공하는 경우 매우 유용합니다.
문제의 일반적인 원인은 부적절한 설계, 예를 들어 적절한 강제 기능(동작 쉐이핑 제약)이 없거나 오류 허용 설계가 부족하기 때문에 장치를 거꾸로 삽입할 수 있는 잘못된 인적 요인 설계 등입니다.이것은, 예를 들면, 2개의 부품이 다른 기능을 가지고 있지만 공통의 케이스를 공유하고 있기 때문에, 어느 부품이 사용되고 있는지, 유저가 잘못된 사용법을 눈치채지 못하는 습관화를 수반하는 경우는, 특히 좋지 않습니다.
트러블 슈팅은 문제가 발생하기 전에 작성된 시스템체크리스트, 트러블 슈팅 순서, 흐름도 또는 표 형식으로 할 수도 있습니다.트러블 슈팅 순서를 미리 작성하면 트러블 슈팅에 필요한 순서를 충분히 생각할 수 있어 트러블 슈팅을 가장 효율적인 트러블 슈팅 프로세스로 정리할 수 있습니다.트러블 슈팅 테이블은 사용자가 보다 효율적으로 사용할 수 있도록 컴퓨터화할 수 있습니다.
일부 컴퓨터 트러블 슈팅 서비스(Primefax, 나중에 MaxServ로 변경)에서는 근본적인 문제를 해결할 가능성이 가장 높은 상위 10개의 솔루션이 즉시 표시됩니다.기술자는 트러블 슈팅 절차를 진행하기 위한 추가 질문에 답할 수 있습니다.각 단계에서 해결 방법을 좁히거나 문제를 해결할 수 있다고 생각되는 솔루션을 즉시 구현할 수 있습니다.이러한 서비스는 기술자가 문제 해결 후 추가 조치를 취할 경우 리베이트를 제공합니다. 문제를 실제로 해결한 솔루션을 보고하십시오.컴퓨터는 이러한 보고서를 사용하여 특정 [1][2]증상을 수정할 가능성이 가장 높은 솔루션을 추정치로 업데이트합니다.
반토막
효율적인 트러블 슈팅은 시스템의 예상되는 동작과 관찰되는 증상을 명확하게 이해하는 것부터 시작됩니다.여기서부터 문제 해결사는 잠재적인 원인에 대한 가설을 세우고 이러한 잠재적 원인을 제거하기 위해 표준화된 테스트 체크리스트를 고안(또는 참조)합니다.이 접근방식은 종종 "분할과 정복"이라고 불립니다.
트러블 슈팅 담당자가 사용하는 일반적인 2가지 방법은, 우선, 자주 발생하는 상태나 테스트하기 쉬운 상태를 확인하는 것입니다(예를 들면, 프린터의 LED가 점등하고 있는지, 케이블의 양끝이 제대로 접속되어 있는지를 확인하는 것).이것은 종종 "전면 [3]패널 밀링"이라고 불립니다.
그런 다음 시스템을 "2등분"합니다(예를 들어 네트워크 인쇄 시스템에서 작업이 서버에 도달했는지 확인하여 서브시스템에 문제가 있는지 여부를 확인하거나 디바이스를 "방향"으로 지정합니다).
이 후자의 기법은 특히 컴포넌트 간의 의존관계 또는 상호작용의 긴 체인을 가진 시스템에서 효율적일 수 있습니다.이는 단순히 종속성 범위에 걸친 바이너리 검색의 적용이며 종종 "반쪽 분할"[4]이라고 합니다.이는 "20가지 질문" 게임과 유사합니다.대안의 집합을 20배로 나누면 누구나 백만 개 중에서 하나의 옵션을 분리할 수 있다(2^10 = 1024 및 2^20 = 1,048,576).
증상의 재현
트러블 슈팅의 핵심 원칙 중 하나는 재현 가능한 문제를 확실하게 분리하여 해결할 수 있다는 것입니다.트러블 슈팅에서는 재현성에 상당한 노력과 중점을 두는 경우가 많습니다.증상이 발생하도록 확실하게 유도할 수 있는 방법을 찾아야 합니다.
간헐적 증상
트러블 슈팅의 가장 어려운 문제의 일부는 간헐적으로 발생하는 증상과 관련되어 있습니다.전자제품에서 이는 종종 열에 민감한 구성 요소의 결과입니다(회로의 저항은 회로 내 도체의 온도에 따라 달라지기 때문입니다).압축공기를 사용하여 회로기판의 특정 부분을 냉각하고 히트건을 사용하여 온도를 높일 수 있습니다.따라서 전자기기 시스템의 트러블 슈팅에서는 이러한 툴을 사용하여 문제를 재현하는 경우가 많습니다.
컴퓨터 프로그래밍에서 레이스 상태는 종종 재현이 매우 어려운 간헐적 증상을 초래합니다. 다양한 기술을 사용하여 특정 기능 또는 모듈을 정상 작동 시보다 더 빠르게 호출할 수 있습니다(하드웨어 회로의 구성 요소를 "가열"하는 것과 유사함). 다른 기술은 다음과 같습니다.sed는 다른 모듈 또는 상호 작용 프로세스에서 더 많은 지연을 발생시키거나 강제로 동기화하기 위해 사용됩니다.
간헐적 문제는 다음과 같이 정의할 수 있습니다.
간헐적 현상은 증상을 지속적으로 재현할 수 있는 알려진 절차가 없는 문제입니다.
--
특히, 그는 발생 빈도와 "일관적으로 문제를 재현하기 위한 알려진 절차" 사이에는 차이가 있다고 주장한다.예를 들어, 간헐적인 문제가 특정 자극이나 사건의 "1시간 이내"에 발생한다는 것을 아는 것은, 비록 자극이 증상의 관찰 가능한 증상의 빈도를 증가시킨다고 해도, "알려진 절차"를 구성하지는 않는다.
다만, 트러블 슈팅 담당자는, 통계적인 방법에 의존할 필요가 있는 경우가 있습니다.또, 증상의 발생을 증가시키는 순서를 찾을 수 있는 것은, 시리얼 치환이나 그 외의 몇개의 테크닉 뿐입니다.이 경우 증상이 상당히 오랫동안 사라졌다고 생각되어도 근본 원인을 찾아내고 진정으로 문제를 해결할 수 있다는 신뢰는 낮다.
또한 특정 컴포넌트에 부하를 가하여 이들 컴포넌트의 고장 여부를 판단하기 위한 테스트를 실행할 수도 있습니다.[6]
여러 가지 문제
재현 가능한 증상을 일으키는 단일 컴포넌트 장애를 분리하는 것은 비교적 간단합니다.
그러나 많은 문제가 발생하는 것은 여러 장애 또는 오류 때문입니다.이는 특히 폴트 톨러런스 시스템 또는 내장 용장성이 있는 시스템에 해당됩니다.시스템에 용장성, 장애 검출 및 페일오버를 추가하는 기능도 장애가 발생할 수 있으며, 모든 시스템에서 컴포넌트 장애가 충분히 발생해도 장애가 발생할 수 있습니다.
단순한 시스템에서도 트러블 슈팅은 항상 장애가 여러 개일 가능성을 고려해야 합니다.(각 컴포넌트를 교체하고 시리얼 치환을 사용하여 새로운 컴포넌트를 이전 컴포넌트로 교체해도 문제가 해결되지 않을 수 있습니다.더 중요한 것은 결함이 있는 컴포넌트를 교체하면 문제를 제거하는 것이 아니라 실제로 문제의 수를 늘릴 수 있다는 것입니다).
'컴포넌트 교체'에 대해 설명하지만 많은 문제의 해결에는 '교체'가 아닌 조정 또는 튜닝이 수반됩니다.예를 들어, 도체의 간헐적 파손 - 또는 "더럽거나 느슨한 접점"은 청소 및/또는 조이기만 하면 될 수 있습니다."교체"에 대한 모든 논의는 "교체, 조정 또는 기타 수정"을 의미해야 한다.
「 」를 참조해 주세요.
레퍼런스
- ^ Nils Conrad Persson의 "손끝으로 문제 해결"1982년 6월, 「Electronics Serviceing and Technology」잡지.
- ^ Ron J. Patton, Paul M의 "다이나믹 시스템의 고장 진단 문제"프랭크, 로버트 N. 클락
- ^ "Hewlett Packard Bench Briefs" (PDF). Hewlett Packard. Retrieved 14 October 2011.
- ^ Sullivan, Mike (Nov 15, 2000). "Secrets of a super geek: Use half splitting to solve difficult problems". TechRepublic. Archived from the original on 8 July 2012. Retrieved 22 October 2010.
- ^ "December 98 Troubleshooting Professional Magazine: Intermittents". www.troubleshooters.com. Retrieved 2020-10-14.
- ^ "How to Troubleshoot a Computer Problem – joyojc.com". www.joyojc.com. Archived from the original on 2013-02-24. Retrieved 9 April 2018.