분산 제약 조건 최적화

Distributed constraint optimization

분산 구속조건 최적화(DCOP 또는 DisCOP)는 분산 아날로그-제약조건 최적화다.DCOP는 에이전트 그룹이 변수 집합에 대한 값을 분산 선택해야만 변수에 대한 제약 조건 집합의 비용을 최소화할 수 있는 문제다.null

분산된 제약조건 만족도는 고유한 참여자(대리점)에 의해 알려지고 시행되는 제약조건의 측면에서 문제를 기술하기 위한 프레임워크다.제약조건은 도메인이 미리 정의된 일부 변수에 설명되며, 서로 다른 에이전트에 의해 동일한 값에 할당되어야 한다.null

이 프레임워크로 정의된 문제들은 그것을 위해 설계된 알고리즘에 의해 해결될 수 있다.null

이 틀은 1980년대에 다른 이름으로 사용되었다.현재 이름으로 처음 알려진 용어는 1990년이다.[citation needed]null

정의들

디코프

DCOP 문제의 주요 성분은 에이전트변수다.중요한 것은 각 변수는 에이전트에 의해 소유된다는 것이다. 이것이 문제를 분산시키는 것이다.정식으로 DCOP는 튜플 A, , D, , ,α , {\ \f,\,\이다 여기서:

  • (는) 집합으로 { 1, 입니다
  • (는) 변수 집합으로 { , ,
  • is the set of variable-domains, , where each is a finite set containing the possible values of variable .
    • math D 에 두 값(예: 0 또는 1)만 포함된 경우 이진 변수라고 한다.
  • 비용 함수다.그것은[1] 함수다.
    모든 가능한 부분 배정을 비용에 매핑할 수 있다.일반적으로 의 값이 0이 아닌 값만 0이 아닌 값으로 할당되는 튜플의 목록으로 표시된다.그러한 각각의 튜플을 제약조건이라고 부른다.이 세트의 C 은(는) : D k 할당 가능한 각 할당에 실제 값을 할당함.몇 가지 특별한 종류의 제약조건은 다음과 같다.
    • 단항 제약 조건 - 단일 변수에 대한 제약 조건, 즉 : → R V 에 대한
    • 이항 제약 조건 - 두 변수의 제약 조건, :j × 2→ R {\ f_ , j V 1},{j_{in V D_{2}}\.
  • (는) 소유함수다.각 변수를 연결된 에이전트에 매핑하는 함수 : 이다. j \ \(은(는) j {\을(를) 의미한다이는 변수 의 값을 할당하는 것이 에이전트 i {\ a_의 책임임을 한다. α {\displaystyle 은(는) 주입 아니므로, 즉, 한 에이전트가 둘 이상의 변수를 소유할 수 있다.그것은 또한 반드시 추론인 것은 아니다. 즉, 일부 대리인은 변수를 소유하지 않을 수도 있다.
  • (가) 목표 함수다.가능한 모든 변수 할당에 대해 개별 비용을 모두 집계하는 운영자다.이는 보통 합계를 통해 이루어진다.

DCOP의 목적은 주어진 변수 할당에 대해 ( ) (를) 최소화하거나 최대화하기 위해 각 에이전트가 관련 변수에 값을 할당하도록 하는 것이다.null

과제들

값 할당은 쌍 j, d ) 이며, d 는 도메인 의 요소다

부분 할당은 각 가 최대 한 번에 나타나는 값 할당 집합이다.문맥이라고도 한다.이는 DCOP의 함수 매핑 변수와 현재 값이라고 생각할 수 있다.

컨텍스트는 본질적으로 부분적인 해결책이며 문제의 모든 대한 값을 포함할 필요는 없으므로 t v ) 은(는) 에이전트i ){\가 아직 에 값을 할당하지 않았음을 암시한다. 이 표현에 따라 함수의 "도메인"(즉, 입력 값 집합)이 표시된다.fDCOP에 대해 가능한 모든 컨텍스트의 집합으로 생각할 수 있다.따라서 이 글의 나머지 부분에서는 컨텍스트(, t 함수) 개념을 함수에 대한 입력으로 사용할 수 있다.null

전체 할당은 각 가 정확히 한 번 나타나는 할당, 즉 모든 변수가 할당되는 할당이다.그것은 DCOP에 대한 해결책이라고도 불린다.null

최적 솔루션은 목표 함수 () 이(가) 최적화(즉, 문제 유형에 따라 최대화 또는 최소화)되는 완전 할당이다.null

예시 문제

서로 다른 도메인의 다양한 문제들은 DCOP로 제시될 수 있다.null

분산 그래프 컬러링

The graph coloring problem is as follows: given a graph and a set of colors , assign each vertex, , a color, , such that the number of adjacent vertices with the same color is minimized.null

DCOP로서, 관련 색상을 결정하기 위해 할당된 정점당 하나의 에이전트가 있다.각 에이전트는 연결된 도메인이 C C}인 단일 변수를 가지고 있다(가능한 각 색상에 대해 하나의 도메인 값이 있음).For each vertex , there is a variable with domain . For each pair of adjacent vertices , there is a constraint of cost 1 if both관련 변수 중 동일한 색상이 할당됨:

그러면 목표는 () 을(를) 최소화하는 것이다

여러 개의 배낭 문제 분산

배낭 문제분산된 복수 변종은 다음과 같다: 다양한 부피의 항목 집합과 다양한 용량의 배낭 집합이 주어진다면, 오버플로의 양이 최소화되도록 각 항목을 배낭에 할당한다. 을(를) 항목 집합으로 하고, (를) 배낭 으로 하며, s: → N 는) 해당 볼륨에 대한 함수 매핑 항목이며, : → N 는) 용량에 대한 함수 매핑 배낭입니다.null

이 문제를 DCOP로 인코딩하려면 I 에 대해 연관된 도메인 = 함께 V에 변수 하나를 생성하십시오 그런 다음 가능한 컨텍스트 t {\displaystytytesticate t:

여기서 ( , ) 은(는) 컨텍스트 에서 배낭 k k 할당한 총 중량을 나타낸다

분산 항목 할당 문제

품목 할당 문제는 다음과 같다.여러 대리점 사이에서 나눠야 할 항목이 몇 가지 있다.각 대리점마다 항목에 대한 평가가 다르다.공공요금의 합을 극대화하거나 부러움을 최소화하는 등 일부 글로벌 목표를 최적화하는 것이 목표다.품목 할당 문제는 다음과 같이 DCOP로 공식화할 수 있다.[2]null

  • 각 에이전트 i 및 항목 j에 대해 이진 변수 vij 추가하십시오.에이전트가 항목을 가져오면 변수 값은 "1"이고, 그렇지 않으면 "0"이다.변수는 에이전트 i가 소유하고 있다.
  • 각 항목이 최대 하나의 에이전트에 부여되는 제약조건을 표현하려면 동일한 항목과 관련된 서로 다른 두 변수 각각에 대해 2진수 제약조건을 추가하고, 두 변수가 동시에 "1"이면 무한비용, 그렇지 않으면 0원가를 추가한다.
  • 모든 항목을 할당해야 하는 제약 조건을 표현하려면 각 항목(여기서 n은 에이전트 수)에 대해 n-arry 제약 조건을 추가하십시오(이 항목과 관련된 변수가 "1"이 아닐 경우 무한 비용).

기타 응용 프로그램

DCOP는 다음과 같은 다른 문제에 적용되었다.

  • 모바일 센서 조정.
  • 미팅 및 태스크 스케줄링.

알고리즘

DCOP 알고리즘은 다음과 같은 여러 가지 방법으로 분류할 수 있다.[3]

  • 완전성 - 최적의 솔루션을 찾는 완전한 검색 알고리즘과 로컬 검색 알고리즘의 로컬 최적 검색 알고리즘 비교.
  • 검색 전략 - 최상의 첫 번째 검색 또는 깊이 우선 분기 및 바인딩된 검색
  • 에이전트 간 동기화 - 동기식 또는 비동기식;
  • 에이전트 간 통신 - 제약 조건 그래프 또는 브로드캐스트에서 이웃과 점 대 점
  • 통신 토폴로지 - 체인 또는 트리.

예를 들어, INTICE는 가장 먼저 검색, 비동기 동기화, 제약 조건 그래프에 있는 인접 에이전트와 제약 조건 트리 사이의 포인트 투 포인트 통신을 주 통신 토폴로지로 사용한다.null

알고리즘 이름 소개된 해 메모리 복잡성 메시지 수 정확성(컴퓨터 과학)/
완전성(로직)
구현
ABT[필요하다]
비동기식 역추적
1992 [필요하다] [필요하다] 참고: 정적 순서, 완료 [필요하다]
AWC[필요하다]
비동기 취약 커밋
1994 [필요하다] [필요하다] 참고: 순서 변경, 빠름, 완료(지수 공간만 포함) [필요하다]
DBA
분산 브레이크아웃 알고리즘
1995 [필요하다] [필요하다] 참고: 불완전하지만 빠름 FRODO 버전 1[영구적 데드링크]
SyncBB[4]

동기 분기 및 바운드

1997 [필요하다] [필요하다] 완전하지만 느림
IDB

반복 분산 브레이크아웃

1997 [필요하다] [필요하다] 참고: 불완전하지만 빠름
AAS[필요하다]
비동기 집계 검색
2000 [필요하다] [필요하다] ABT의 값 집합 [필요하다]
DFC[필요하다]
분산 포워드 체인
2000 [필요하다] [필요하다] 참고: 낮음, ABT와 유사함 [필요하다]
ABTR[필요하다]
재주문을 통한 비동기식 역추적
2001 [필요하다] [필요하다] 참고: ABT에서 한정된 재화 없음으로 전자 주문 [필요하다]
DMAC[필요하다]
비동기식 구성성 유지
2001 [필요하다] [필요하다] 참고: 가장 빠른 알고리즘 [필요하다]
반신뢰 서버를 통한 안전한 계산[필요하다] 2002 [필요하다] [필요하다] 참고: 신뢰할 수 있는 서버의 수에 따라 보안이 향상됨 [필요하다]
DISCSP 해결을 위한 시큐어 멀티파티 계산
(MPC-DisCSP1-MPC-DisCSP4)[citation needed]
2003 [필요하다] [필요하다] 참고: 참가자의 1/2이 신뢰할 수 있는 경우 안전하게 보호 [필요하다]
채택하다
비동기식 역추적[5]
2003 다항식(또는 모든 공간[6]) 지수적 검증된 참조 구현: 채택하다

디코폴리스(GNU LGPL)
FRODO(GNU 아페로 GPL)

옵타포
비동기 부분 오버레이[7]
2004 다항식 지수적 입증되었지만 완벽함을 증명하는 데 어려움이[8] 있음 참조 구현: "OptAPO". Artificial Intelligence Center. SRI International. Archived from the original on 2007-07-15.

DCOPLis(GNU LGPL); 개발 중

DPOP
분산 유사 트리 최적화 절차[9]
2005 지수적 선형 검증된 참조 구현:FRODO(GNU 아페로 GPL)

디코폴리스(GNU LGPL)

NCBB
커밋되지 않은 분기 및 바인딩[10]
2006 다항식(또는 모든 공간[11]) 지수적 검증된 참조 구현: 공개되지 않음

디코폴리스(GNU LGPL)

CFL
커뮤니케이션 없는 학습[12]
2013 선형 없음: 메시지가 전송되지 않지만 로컬 제약 조건의 만족도에 대한 지식을 가정함 불완전

이러한 DCOP 알고리즘의 하이브리드도 존재한다.예를 들어 BnB-Adopt는 Attract의 검색 전략을 Best-first search에서 deep-first branch-and-bound search로 변경한다.[3]null

비대칭 DCOP

비대칭 DCOP는 각 제약조건의 비용이 서로 다른 작용제에 대해 다를 수 있는 DCOP의 확장이다.응용 프로그램의 예는 다음과 같다.[13]

  • 이벤트 스케줄링: 동일한 이벤트에 참석하는 에이전트는 이벤트로부터 다른 값을 도출할 수 있다.
  • 스마트 그리드: 적재 시간 내 전기 가격 상승은 서로 다른 요인이 될 수 있다.

ADCOP를 나타내는 한 가지 방법은 제약조건을 함수로 표현하는 것이다.

여기서, 각각의 제약조건에 대해 하나의 비용이 아니라, 제약조건에 관련된 각 대리점마다 하나의 비용 벡터가 있다.비용 벡터는 각 변수가 다른 에이전트에 속할 경우 k 길이의 길이다. 두 개 이상의 변수가 동일한 에이전트에 속할 경우, 비용의 벡터는 더 짧아진다. 각 변수에 대해가 아니라 관련된 각 에이전트에 대해 단일 비용이 발생한다.null

ADCOP를 해결하기 위한 접근 방식

ADCOP를 해결하기 위한 간단한 방법은 각 제약조건 : × k → 를 교체하는 것이다. 조건 : × × × × D k 이 있는}}}} \mathb {R} ^{에 대한 제약 조건:to {에 대한 \cdotstimes D_ {의 함수 와 같으나에게 비용 함수를 공개하도록 요구한다종종 프라이버시 고려사항 때문에 이것은 원하지 않는다.[14][15][16]null

또 다른 접근방식은 변수로서의 개인 사건(PEAV)이라고 불린다.[17]이 접근법에서, 각 변수는 자신의 변수 외에도 제약망에서 그의 이웃이 소유한 모든 변수의 "거울 변수"를 소유한다.거울 변수가 원래의 변수와 동일하다는 것을 보장하는 추가적인 제약 조건(무한도 비용)이 있다.이 방법의 단점은 변수와 제약조건이 원래보다 훨씬 많아 런타임이 높다는 것이다.null

세 번째 접근방식은 DCOP용으로 개발된 기존 알고리즘을 ADCOP 프레임워크에 적응시키는 것이다.이는 전체 검색 알고리즘과 로컬 검색 알고리즘 모두에 대해 수행되었다.[13]null

전략 게임과 비교

ADCOP 문제의 구조는 동시 게임의 게임 이론적 개념과 유사하다.두 경우 모두 변수를 제어하는 에이전트가 있다(게임 이론에서 변수는 에이전트의 가능한 행동이나 전략이다).두 경우 모두 서로 다른 에이전트에 의한 변수의 각 선택은 각 에이전트에 대한 다른 보상으로 귀결된다.그러나 근본적인 차이점은 다음과 같다.[13]

  • 동시 게임에서 에이전트는 이기적이다. 즉, 각 에이전트는 자신의 효용성을 최대화(또는 자신의 비용을 최소화)하기를 원한다.따라서 이러한 상황에서 추구할 수 있는 최선의 결과는 균형이다. 즉 어떤 대리인도 일방적으로 자신의 이익을 늘릴 수 없는 상황이다.
  • ADCOP에서 대리인은 협조적인 것으로 간주된다. 대리인은 자신의 효용성을 감소시키더라도 프로토콜에 따라 행동한다.따라서, 목표는 더 어려운 것이다: 우리는 유틸리티의 합계를 최대화하기를 원한다(또는 비용 합계를 최소화한다).내시 균형은 대략 이 문제의 국소 최적화와 일치하지만, 우리는 전지구적 최적화를 찾고 있다.

부분협력

에이전트들이 부분적으로 협력하는 몇몇 중간 모델들이 있다: 그들은 글로벌 목표를 돕기 위해 그들의 효용을 기꺼이 줄이려고 하지만, 그들 자신의 비용이 너무 높지 않을 때만 그렇다.부분적인 협력 요원의 한 예는 회사의 직원들이다.한편으로, 각각의 직원들은 그들 자신의 효용을 극대화하기를 원하고, 다른 한편으로, 그들은 또한 회사의 성공에 기여하기를 원한다.따라서, 그들은 다른 사람들을 돕거나, 기업에게 너무 부담이 되지 않는 한, 기업에게 도움이 되는 몇 가지 다른 시간 소모적인 일을 기꺼이 할 것이다.부분 협력 에이전트의 일부 모델은 다음과 같다.[18]

  • 보장된 개인적 이익: 대리인은 자신의 효용이 최소한 비협조적 환경(즉, 최종 결과는 원래 상태의 파레토 개선이어야 한다)에서만큼 높은 경우 글로벌 선을 위해 행동하기로 동의한다.
  • 람다-협력: 매개 변수[ 0 이(가) 있다 에이전트는 자신의 효용이 적어도비협조 효용의 ( -만큼 높을 경우 글로벌 선을 위해 행동하기로 동의한다.

이러한 부분적 준비 ADCOP를 해결하려면 ADCOP 알고리즘의 조정이 필요하다.[18]null

참고 항목

참고 및 참조

  1. ^ " 또는 "×"는 데카르트 제품을 의미한다.
  2. ^ Netzer, Arnon; Meisels, Amnon; Zivan, Roie (2016-03-01). "Distributed envy minimization for resource allocation". Autonomous Agents and Multi-Agent Systems. 30 (2): 364–402. doi:10.1007/s10458-015-9291-7. ISSN 1387-2532. S2CID 13834856.
  3. ^ a b Yeoh, William; Felner, Ariel; Koenig, Sven (2008), "BnB-ADOPT: An Asynchronous Branch-and-Bound DCOP Algorithm", Proceedings of the Seventh International Joint Conference on Autonomous Agents and Multiagent Systems, vol. 2, pp. 591–8, ISBN 9780981738116
  4. ^ Hirayama, Katsutoshi; Yokoo, Makoto (1997). Smolka, Gert (ed.). "Distributed partial constraint satisfaction problem". Principles and Practice of Constraint Programming-CP97. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer. 1330: 222–236. doi:10.1007/BFb0017442. ISBN 978-3-540-69642-1.
  5. ^ 입양의 원래 출판된 버전은 정보가 없었다. 참조하라.Adopt의 원래 버전이 나중에 알려 주기를, 그것은, 더 빨리 달리구글의 검색 집중하기 위하여 해결책 비용의 추정 사용할, 알리, 솃;코엔 크는 스벤;Tambe, Milind(2005년),"그 DCOP 알고리즘 ADOPT의 가속 팽창을 Preprocessing 기술"(PDF), 자율적 나이를 4국제 공동 회의 회보를 참조하십시오. 확대되었다.Nts과multiagent 시스템, ACM출판부를 대신하여 서명함. 1041–8, doi:10.1145/1082473.1082631, 아이 에스비엔 1595930930, S2CID 10882572.이 채택의 확장은 일반적으로 채택의 기준 구현으로 사용된다.
  6. ^ Matsui, Toshihiro; Matsuo, Hiroshi; Iwata, Akira (February 2005), "Efficient Method for Asynchronous Distributed Constraint Optimization Algorithm" (PDF), Proceedings of Artificial Intelligence and Applications, pp. 727–732, CiteSeerX 10.1.1.408.7230
  7. ^ Mailler, Roger; Lesser, Victor (2004), "Solving Distributed Constraint Optimization Problems Using Cooperative Mediation" (PDF), Proceedings of the Third International Joint Conference on Autonomous Agents and Multiagent Systems, IEEE Computer Society, pp. 438–445, ISBN 1581138644
  8. ^ Grinshpoun, Tal; Zazon, Moshe; Binshtok, Maxim; Meisels, Amnon (2007), "Termination Problem of the APO Algorithm" (PDF), Proceedings of the Eighth International Workshop on Distributed Constraint Reasoning, pp. 117–124
  9. ^ Petcu, Adrian; Faltings, Boi (August 2005), "DPOP: A Scalable Method for Multiagent Constraint Optimization", Proceedings of the 19th International Joint Conference on Artificial Intelligence, IJCAI 2005, Edinburgh, Scotland, pp. 266-271
  10. ^ Chechetka, Anton; Sycara, Katia (May 2006), "No-Commitment Branch and Bound Search for Distributed Constraint Optimization" (PDF), Proceedings of the Fifth International Joint Conference on Autonomous Agents and Multiagent Systems, pp. 1427–9, doi:10.1145/1160633.1160900, ISBN 1595933034, S2CID 43918609
  11. ^ Chechetka, Anton; Sycara, Katia (March 2006), "An Any-space Algorithm for Distributed Constraint Optimization" (PDF), Proceedings of the AAAI Spring Symposium on Distributed Plan and Schedule Management
  12. ^ Duffy, K.R.; Leith, D.J. (August 2013), "Decentralized Constraint Satisfaction", IEEE/ACM Transactions on Networking, 21 (4): 1298–1308, arXiv:1103.3240, doi:10.1109/TNET.2012.2222923, S2CID 11504393
  13. ^ a b c Grinshpoun, T.; Grubshtein, A.; Zivan, R.; Netzer, A.; Meisels, A. (2013-07-30). "Asymmetric Distributed Constraint Optimization Problems". Journal of Artificial Intelligence Research. 47: 613–647. doi:10.1613/jair.3945. ISSN 1076-9757.
  14. ^ Greenstadt, Rachel; Pearce, Jonathan P.; Tambe, Milind (2006-07-16). "Analysis of privacy loss in distributed constraint optimization". Proceedings of the 21st National Conference on Artificial Intelligence - Volume 1. AAAI'06. Boston, Massachusetts: AAAI Press: 647–653. ISBN 978-1-57735-281-5.
  15. ^ Maheswaran, Rajiv T.; Pearce, Jonathan P.; Bowring, Emma; Varakantham, Pradeep; Tambe, Milind (2006-07-01). "Privacy Loss in Distributed Constraint Reasoning: A Quantitative Framework for Analysis and its Applications". Autonomous Agents and Multi-Agent Systems. 13 (1): 27–60. doi:10.1007/s10458-006-5951-y. ISSN 1573-7454. S2CID 16962945.
  16. ^ Yokoo, Makoto; Suzuki, Koutarou; Hirayama, Katsutoshi (2002). Van Hentenryck, Pascal (ed.). "Secure Distributed Constraint Satisfaction: Reaching Agreement without Revealing Private Information". Principles and Practice of Constraint Programming - CP 2002. Lecture Notes in Computer Science. Berlin, Heidelberg: Springer. 2470: 387–401. doi:10.1007/3-540-46135-3_26. ISBN 978-3-540-46135-7.
  17. ^ Rajiv T. Maheswaran, Milind Tambe, Emma Bowring, Jonathan P. Pearce, Pradeep Varakantham (2004). "Taking DCOP to the Real World: Efficient Complete Solutions for Distributed Multi-Event Scheduling". www.computer.org. Retrieved 2021-04-12.{{cite web}}: CS1 maint : 복수이름 : 작성자 목록(링크)
  18. ^ a b Zivan, Roie; Grubshtein, Alon; Friedman, Michal; Meisels, Amnon (2012-06-04). "Partial cooperation in multi-agent search". Proceedings of the 11th International Conference on Autonomous Agents and Multiagent Systems - Volume 3. AAMAS '12. Valencia, Spain: International Foundation for Autonomous Agents and Multiagent Systems: 1267–1268. ISBN 978-0-9817381-3-0.

서적 및 설문 조사