오픈AI 코덱스
OpenAI Codex오픈AI 코덱스(OpenAI Codex)는 오픈사가 개발한 인공지능 모델이다.AI. 자연어를 파싱하고 대응하여 코드를 생성한다.Visual Studio Code용으로 개발된 프로그래밍 자동 완성 도구인 GitHub Copilot에 전원을 공급하기 위해 사용된다.[1]코덱스는 오픈의 후손이다.프로그래밍 애플리케이션에 사용하도록 미세 조정된 AI GPT-3 모델.
오픈AI는 코덱스용 API를 클로즈드 베타 형태로 출시했다.[1]
역량
코덱스는 텍스트로 훈련된 신경망인 GPT-3를 기반으로 5400만 기트허브 저장소에서 159기가바이트의 파이썬 코드를 추가 훈련했다.[2][3]코덱스의 대표적인 사용 사례는 다음과 같은 코멘트를 타이핑하는 것이다.//compute the moving average of an array for a given window size
", 그런 다음 AI를 사용하여 해당 프롬프트를 충족하는 코드 블록을 제안하십시오.[4]OpenAI는 Codex가 약 37%의 요청을 완료할 수 있으며, 이를 대체하기 보다는 인간 프로그래밍을 더 빠르게 하기 위한 것이라고 밝혔다.AI의 블로그인 코덱스는 "프로그램에서 가장 재미없는 부분"이라고 묘사하는 "기존 코드에 [...] 간단한 문제를 매핑하는 것"에서 가장 뛰어나다.[5][6]제러미 하워드 아마존 공동창업자(Fast.ai)는 "[코덱스]는 코드를 많이 쓰지 않고도 코드를 쓸 수 있는 방법"이라며 "항상 옳은 것은 아니지만, 충분히 가까운 것"이라고 말했다.[7]오픈이 쓴 논문에 따르면AI 연구진, 각각의 테스트 케이스를 100번씩 시도할 때, 70.2%의 프롬프트가 효과가 있는 해결책을 가지고 있었다.[8]
오픈AI는 코덱스가 파이썬에서 가장 효과적이지만 바둑, 자바스크립트, 펄, PHP, 루비, 쉘, 스위프트, 타이프스크립트 등 12개 이상의 프로그래밍 언어로 기능할 수 있다고 주장한다.[1]VentureBeat에 따르면 Open에서 업로드한 데모AI가 인상적인 핵심 요소 해결 능력을 보였다.시위대는 자바스크립트에서 브라우저 게임을 만들고 매트릭리브(matplotlib)를 이용해 데이터 과학 차트를 만들 수 있었다.[6]
오픈AI는 코덱스가 메일침프, 마이크로소프트 워드, 스포티파이, 구글 캘린더 등 서비스 및 앱과 인터페이스가 가능한 것으로 나타났다.[6][9]마이크로소프트는 코덱스의 역량을 탐색하는 데 관심이 있는 것으로 알려졌다.[9]
문제들
OpenAI 시연에서는 코드 샘플에서 비효율적인 코드와 일회성 퀴크 등의 결함이 나타났다.[6]더 버지와의 인터뷰에서그렉 브록맨 AI 최고기술책임자는 "때로는 [코덱스]가 정확히 무엇을 묻고 있는지 잘 알지 못하는 경우가 있다"면서 "일부 시행착오가 필요할 수 있다"고 말했다.[9]OpenAI 연구원들은 Codex가 종종 직관에 반하는 행동을 실패하거나 양보하는 다단계 및 더 높은 수준의 프롬프트와 싸운다는 것을 발견했다.또한 초보 프로그래머의 과잉 의존, 교육 데이터에 기반한 편향, 취약한 코드로 인한 보안 영향 등 몇 가지 안전 문제를 제기했다.[8]
벤처비트는 코덱스가 공공데이터에 대한 교육을 받기 때문에 고의적인 악성코드 업로드를 통한 '데이터 중독'에 취약할 수 있다고 밝힌 바 있다.[6]뉴욕 대학교의 연구원들에 의한 연구에 따르면, GitHub Copilot (Codex를 사용하는)에 의해 생성된 코드의 약 40%는 결함이나 다른 착취 가능한 설계 결함을 포함했다.[10]
자유소프트웨어재단은 코필로트와 코덱스가 생성한 코드스니펫이 파생작품을 동등한 조건으로 허가하도록 하는 GPL과 같은 무료 소프트웨어 라이선스 조건을 자신도 모르게 위반할 수 있다는 우려를 표명해 왔다.[11]들은 자신들이 기른 문제 여부 공공 저장소의 교육 훈련 공정한 사용 또는 않는다에 빠지면, 어떻게 개발자들인지 훈련된 기계 학습 모델 변경할 수 있는 소스 코드나 훈련 데이터 편집한 것으로 여겨질 수 있침해, 생성된 소스 코드고, 기계 학습 모델들은 스스로를 그리고 누구에 의해 저작권이 있을 수 있을 것을 발견하기 등이 있다.[11][12]내부 GitHub 연구는 생성된 코드의 약 0.1%가 교육 데이터의 직접 복사본을 포함하고 있다는 것을 발견했다.모델이 코멘트와 부정확한 저작권 고지를 포함하여 빠른 역제곱근 알고리즘의 원래 코드를 출력한 구체적인 예가 한 가지 제기되었다.[4]
응답, 열기AI는 "AI 시스템 훈련의 저작권 영향력에 대한 법적 불확실성은 AI 개발자에게 상당한 비용을 부담하므로 권위 있게 해결해야 한다"[4]고 밝혔다.코덱스와의 저작권 문제는 판사들이 구글북스가 수백만 권의 스캔한 책으로부터 텍스트 캡슐을 사용한 것이 공정한 사용을 구성했다고 판결한 저자들 길드 대 구글의 소송과 비교되어 왔다.[4][13]
참조
- ^ a b c Zaremba, Wojciech (August 10, 2021). "OpenAI Codex". OpenAI. Retrieved 2021-09-03.
{{cite web}}
: CS1 maint : url-status (링크) - ^ Wiggers, Kyle (July 8, 2021). "OpenAI warns AI behind GitHub's Copilot may be susceptible to bias". VentureBeat. Retrieved 2021-09-03.
- ^ Alford, Anthony (August 31, 2021). "OpenAI Announces 12 Billion Parameter Code-Generation AI Codex". InfoQ. Retrieved 2021-09-03.
- ^ a b c d Anderson, Tim; Quach, Katyanna (July 6, 2021). "GitHub Copilot auto-coder snags emerge, from seemingly spilled secrets to bad code, but some love it". The Register. Retrieved 2021-09-04.
- ^ Dorrier, Jason (August 15, 2021). "OpenAI's Codex Translates Everyday Language Into Computer Code". SingularityHub. Retrieved 2021-09-03.
- ^ a b c d e Dickson, Ben (August 16, 2021). "What to expect from OpenAI's Codex API". VentureBeat. Retrieved 2021-09-03.
- ^ Metz, Cade (September 9, 2021). "A.I. Can Now Write Its Own Computer Code. That's Good News for Humans". The New York Times. Retrieved 2021-09-16.
- ^ a b Chen, Mark; Tworek, Jerry; Jun, Heewoo; Yuan, Qiming; Pinto, Henrique Ponde de Oliveira; Kaplan, Jared; Edwards, Harri; Burda, Yuri; Joseph, Nicholas; Brockman, Greg; Ray, Alex (2021-07-14). "Evaluating Large Language Models Trained on Code". arXiv:2107.03374 [cs].
- ^ a b c Vincent, James (August 10, 2021). "OpenAI can translate English into code with its new machine learning software Codex". The Verge. Retrieved 2021-09-03.
- ^ Claburn, Thomas (August 25, 2021). "GitHub's Copilot may steer you into dangerous waters about 40% of the time – study". The Register. Retrieved 2021-09-03.
- ^ a b Krill, Paul (August 2, 2021). "GitHub Copilot is 'unacceptable and unjust,' says Free Software Foundation". InfoWorld. Retrieved 2021-09-03.
- ^ Robertson, Donald (2021-07-28). "FSF-funded call for white papers on philosophical and legal questions around Copilot: Submit before Monday, August 23, 2021". Free Software Foundation. Retrieved 2021-09-04.
- ^ Barber, Gregory (July 12, 2021). "GitHub's Commercial AI Tool Was Built From Open Source Code". WIRED. Retrieved 2021-09-04.