데모에 의한 프로그래밍
Programming by demonstration컴퓨터 과학에서 데모에 의한 프로그래밍(PbD)은 컴퓨터 또는 로봇에 기계 명령을 통해 프로그래밍하는 대신 직접 전송하는 태스크를 시연함으로써 새로운 동작을 가르치기 위한 최종 사용자 개발 기술입니다.
예를 통한[1] 프로그래밍(PbE)과 시연별 프로그래밍(PbD)이라는 용어는 1980년대 중반 소프트웨어 개발 연구에 등장하여 프로그래밍 언어를 배우지 않고도 일련의 작업을 정의하는 방법을 정의했습니다.이러한 용어의 문헌상의 일반적인 차이점은 PbE에서는 사용자가 쿼리 결과의 행과 같은 컴퓨터 실행의 시제품 제품을 제공하지만 PbD에서는 사용자가 컴퓨터가 반복해야 하는 일련의 작업을 수행하여 다른 데이터 세트에서 사용되는 것을 일반화하는 것입니다.
이 두 용어는 처음에는 구별되지 않았지만 PbE는 소프트웨어 개발 연구자에 의해 주로 채택되는 경향이 있었고 PbD는 로봇 연구자에 의해 채택되는 경향이 있었다.현재 PbE는 시뮬레이터와 유사한 새로운 프로그래밍 언어에 의해 지원되는 완전히 다른 개념입니다.이 프레임워크는 베이지안 프로그램 합성과 대조될 수 있습니다.
시연에 의한 로봇 프로그래밍
PbD 패러다임은 로봇 프로그램의 개발과 유지 보수에 관련된 비용 때문에 로봇 산업에 우선 매력적이다.이 필드에서 작업자는 수행해야 할 작업에 대한 암묵적인 지식(그/그녀는 작업 방법을 알고 있음)은 가지고 있지만 일반적으로 로봇을 재구성하는 데 필요한 프로그래밍 기술(또는 시간)은 가지고 있지 않습니다.예를 들어 과제를 달성하는 방법을 시연하면 각 세부 사항을 명시적으로 프로그래밍하지 않고도 스킬을 배울 수 있습니다.
로봇 공학에서 제안된 첫 번째 PbD 전략은 로봇이 순차적으로 채택해야 하는 일련의 관련 구성(위치, 방향, 그리퍼 상태)을 통해 로봇을 이동하는(전용 인터페이스를 통해 또는 수동으로) 기본적으로 구성된 티치인, 안내 또는 재생 방법을 기반으로 했다.이 방법은 주로 원격 조작 제어에 초점을 맞추고 시각과 같은 다른 인터페이스를 사용함으로써 점진적으로 개선되었다.
그러나 이러한 PbD 방법은 여전히 직접 반복을 사용했으며, 이는 정확히 동일한 제품 구성요소를 사용하는 조립 라인을 구상할 때만 업계에서 유용했습니다.이 개념을 다른 변형을 가진 제품에 적용하거나 새로운 로봇에 프로그램을 적용하는 것이 일반화 문제가 되었다.이 문제를 해결하기 위해 스킬을 일반화하기 위한 첫 번째 시도는 주로 사용자의 의도에 대한 쿼리를 통해 사용자의 도움을 기반으로 했습니다.그런 다음, 일반화 문제를 해결하기 위해 다양한 수준의 추상화가 제안되었으며, 기본적으로 상징적인 수준 또는 궤적 수준에서 학습 방법을 이분화하였다.
휴머노이드 로봇의 개발은 시범을 통해 자연스럽게 로봇 프로그래밍에 대한 관심을 증가시켰다.휴머노이드 로봇은 본래 새로운 환경에 적응해야 하기 때문에 인간의 외모가 중요할 뿐만 아니라 조종에 사용되는 알고리즘도 유연성과 다재다능성을 필요로 한다.지속적으로 변화하는 환경과 로봇이 수행해야 하는 다양한 작업 때문에 로봇은 지속적으로 새로운 기술을 배우고 기존 기술을 새로운 상황에 적응할 수 있는 능력을 필요로 합니다.
PbD의 연구도 순수 공학적 관점에서 점차 벗어나 학문 간 접근 방식을 채택하고 신경과학과 사회과학의 통찰력을 바탕으로 인간과 동물의 모방 과정을 모방했다.로봇 공학에서 이러한 작업에 대한 고려가 증가함에 따라 시연에 의한 로봇 프로그래밍의 개념(RPD 또는 RbD로도 알려져 있음)도 점차 모방에 의한 학습의 생물학적 라벨로 대체되었다.
Neurally Imprinted Stable Vector Field(NiVF)
NiVF(Neurally Imported Stable Vector[2] Fields)는 ESAN 2013년 동안 새로운 학습 체계로 도입되었으며 벡터 필드를 Extreme Learning Machine(ELM)과 같은 신경 네트워크에 안정적으로 각인시키는 방법을 보여준다.게다가, 그 논문은 최우수 학생 논문상을 수상했다.네트워크는 움직임을 나타내며, 여기서 점근 안정성은 랴푸노프 안정성 이론에서 도출된 제약을 통해 통합된다.이 접근법은 인간의 필적 동작에서 학습한 안정적이고 매끄러운 포인트 투 포인트 동작을 성공적으로 수행하는 것으로 나타났다.
동적 [3]시스템의 안정화에 사용되는 랴푸노프 후보를 학습할 수도 있다.이러한 이유로, 2단계 프로세스에 기초한 시연으로부터 안정적인 동적 시스템을 추정하는 신경 학습 계획이 필요하다. 첫째, 데이터 중심 랴푸노프 기능 후보를 추정한다.둘째, 안정성은 신경 학습에서 국소적 제약을 존중하는 새로운 방법을 통해 통합된다.이를 통해 동적 시스템의 정확성을 유지하면서 안정적인 역학을 학습할 수 있으며 복잡한 움직임을 강력하게 생성할 수 있습니다.
미분형 변환
미분형 변환은 로봇 동작을 위한 동적 시스템의 학습 가능성을 크게 증가시키는 데 특히 적합한 것으로 밝혀졌다.동적 시스템의 안정적인 추정기(SEDS)는 로봇 움직임을 제어하기 위해 시간 불변 시스템을 학습하는 흥미로운 접근법이다.단, 이는 2차 Lyapunov 함수만 있는 동적 시스템으로 제한됩니다.새로운 접근법 Tau-SEDS는[4] 수학적 우아한 방법으로 이러한 한계를 극복합니다.
파라미터화된 스킬
작업자가 작업을 시연하면 궤적이 데이터베이스에 저장됩니다.파라미터화된 [5]스킬을 통해 원시 데이터에 쉽게 접근할 수 있습니다.스킬이 데이터베이스를 요구하여 궤적을 생성합니다.예를 들어 처음에 동작 데이터베이스에 스킬 「opengripper(slow)」를 송신하고, 그에 따라 로봇팔의 기억된 움직임을 제공한다.스킬의 파라미터를 사용하면 외부 제약을 충족하도록 정책을 변경할 수 있습니다.
스킬은 자연어로 주어진 태스크 이름과 포인트로 구성된 3D 공간의 기본 시공간 이동 사이의 인터페이스입니다.단일 기술은 높은 수준의 관점에서 긴 모션 시퀀스를 정의하는 작업에 결합될 수 있습니다.실용적인 어플리케이션에서는 다양한 액션이 스킬라이브러리에 저장됩니다.추상화 수준을 더욱 높이기 위해 스킬을 DMP(Dynamic Movement Primitive)로 변환할 수 있습니다.그들은 시연 당시에는 알려지지 않았던 로봇 궤적을 플라이 위에서 생성한다.이는 솔버의 [6]유연성을 높이는 데 도움이 됩니다.
비로봇 사용
최종 사용자의 경우, 복잡한 도구(예: Photoshop)에서 워크플로우를 자동화하기 위해 PbD의 가장 간단한 사례는 매크로 레코더입니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Halbert, Dan (November 1984). "Programming by Example" (PDF). U.C. Berkeley (PhD diss.). Retrieved 2012-07-28.
{{cite journal}}:Cite 저널 요구 사항journal=(도움말) - ^ A. Lemme, K. Neumann, R. F. Reinhart, J. J. Steil (2013). "Neurally Imprinted Stable Vector Fields" (PDF). Proc. Europ. Symp. On Artificial Neural Networks: 327–332.
{{cite journal}}: CS1 maint: 여러 이름: 작성자 목록(링크) - ^ A. Lemme, K. Neumann, and J. J. Steil (2013). "Neural Learning of Stable Dynamical Systems based on Data-Driven Lyapunov Candidates" (PDF). IEEE/RSJ Proc. Of the Int Conf. On Intelligent Robots and Systems: 1216–1222.
{{cite journal}}: CS1 maint: 여러 이름: 작성자 목록(링크) - ^ K. Neumann and J. J. Steil (2015). "Learning Robot Motions with Stable Dynamical Systems under Diffeomorphic Transformations" (PDF). Robotics and Autonomous Systems. 70 (C): 1–15. doi:10.1016/j.robot.2015.04.006.
- ^ Pervez, Affan and Lee, Dongheui (2018). "Learning task-parameterized dynamic movement primitives using mixture of GMMs" (PDF). Intelligent Service Robotics. Springer. 11 (1): 61–78. doi:10.1007/s11370-017-0235-8. S2CID 3398752.
{{cite journal}}: CS1 maint: 여러 이름: 작성자 목록(링크) - ^ Alizadeh, Tohid and Saduanov, Batyrkhan (2017). Robot programming by demonstration of multiple tasks within a common environment. 2017 IEEE International Conference on Multisensor Fusion and Integration for Intelligent Systems (MFI). IEEE. pp. 608–613. doi:10.1109/mfi.2017.8170389.
{{cite conference}}: CS1 maint: 여러 이름: 작성자 목록(링크)
- Cypher, Allen (1993), Watch What I Do: Programming by Demonstration, Daniel C. Halbert, MIT Press, ISBN 978-0-262-03213-1
- Lieberman, Henry (2001), Your Wish is My Command: Programming By Example, Ben Shneiderman, Morgan Kaufmann, ISBN 978-1-55860-688-3
외부 링크
논문의 리뷰
- Billard, Aude (2008), S. Calinon, R. Dillmann and S. Schaal, "Robot Programming by Demonstration" (PDF), Handbook of Robotics, MIT Press: 1371–1394, doi:10.1007/978-3-540-30301-5_60, ISBN 978-3-540-23957-4.
- Schaal, S (2004), Ijspeert, A; Billard, A; Frith, CD, Wolpert, D. (eds.), "Computational approaches to motor learning by imitation" (PDF), The Neuroscience of Social Interaction, Oxford University Press, 358 (1431): 199–218, doi:10.1098/rstb.2002.1258, PMC 1693137, PMID 12689379.
- 인간을 모방한 로봇, Cynthia Breazal과 Brian Scasellati, 인지과학 동향, 2002, 페이지 481–87
- 를 클릭합니다Billard, A, "Imitation", in Arbib, MA (ed.), Handbook of Brain Theory and Neural Networks, MIT Press, pp. 566–69.
- 를 클릭합니다Schaal, S (1999), "Is imitation learning the route to humanoid robots?", Trends in Cognitive Sciences (PDF).
저널 특집호
- 를 클릭합니다IEEE Transactions on Systems, Man, and Cybernetics, April 2007, 37:2.
- 를 클릭합니다RSJ Advanced Robotics, vol. 21, number 13.
- 를 클릭합니다Neural Networks, Elsevier.
- 를 클릭합니다Robotics & Autonomous Systems (PDF), Elsevier, 2006.
주요 연구소 및 인력
- 를 클릭합니다Machine Learning techniques for Robot Programming by Demonstration, Lausanne, VD, CH: EPFL LASA, archived from the original on 2012-05-01.
- 를 클릭합니다Reinforcement Learning and Learning of Motor Primitives, SC, USA: USC CLMC Lab.
- 를 클릭합니다Calinon, Sylvain, Interactive teacher-student (trainer/coach-trainee/client) kinesthetic demonstration, CH.
- 를 클릭합니다Bentivegna, Darrin, Teaching air hockey to a humanoid robot, JP: ATR, archived from the original on 2008-01-27.
- 밀접하게 관련된 토픽에 대한 커뮤니티 활동
- 를 클릭합니다Technical Committee on Human-Robot Interaction & Coordination, IEEE Robotics and Automation, archived from the original on 2011-07-26.
- 를 클릭합니다Technical Committee on Robot Learning, IEEE Robotics and Automation, archived from the original on 2011-07-26.
비디오
오믈렛 요리를 배우는 로봇:
콜라 병을 여는 법을 배우는 로봇:
- 를 클릭합니다"Unscrew Coke Bottle", YouTube, DE.