ImageNet(이미지넷)

ImageNet

ImageNet 프로젝트는 시각 객체 인식 소프트웨어 연구에 사용하도록 설계된 대규모 시각 데이터베이스입니다.1400만개[1][2] 이상의 화상이 프로젝트에 의해 수기로 주석되어 어떤 화상이 그려지는지를 나타내며, 적어도 100만개의 화상에 바운딩 박스가 [3]제공되고 있다.ImageNet에는 20,000개 이상의 [2]카테고리가 있으며, 일반적인 카테고리(풍선이나 딸기 등)는 수백 개의 [4]이미지로 구성됩니다.타사 이미지 URL 주석 데이터베이스는 ImageNet에서 직접 사용할 수 있지만 실제 이미지는 ImageNet이 [5]소유하지 않습니다.2010년부터 ImageNet 프로젝트는 매년 소프트웨어 콘테스트인 ImageNet Large Scale Visual Recognition Challenge(ILSVRC)를 개최하고 있습니다.이 콘테스트에서는 소프트웨어 프로그램이 객체 및 장면을 올바르게 분류 및 검출하기 위해 경쟁합니다.이 과제에서는 겹치지 않는 1,000개의 [6]클래스로 구성된 "트리밍된" 목록을 사용합니다.

딥러닝의 중요성

2012년 9월 30일, AlexNet이라고 불리는[7] 컨볼루션 뉴럴 네트워크(CNN)는 ImageNet 2012 Challenge에서 상위 5개 오류 15.3%를 달성했습니다.이는 2위보다 10.8%포인트 이상 낮은 수치입니다.는 딥 러닝 혁명의 필수 요소인 훈련 [7]그래픽 처리 장치(GPU)를 사용했기 때문에 실현되었습니다.이코노미스트는 "갑자기 AI 사회뿐만 아니라 기술 산업 [4][8][9]전반에 걸쳐 사람들이 관심을 갖기 시작했다"고 전했다.

2015년에 AlexNet은 ImageNet 2015 [10]콘테스트에서 우승한 100개 이상의 레이어로 마이크로소프트의 매우 깊은 CNN에 의해 능가되었습니다.

데이터베이스 이력

AI 연구원 Fei-Fei Li는 2006년에 ImageNet을 위한 아이디어를 연구하기 시작했다.대부분의 AI 연구가 모델과 알고리즘에 집중되었던 시기에, Li는 AI 알고리즘을 [11]훈련시키기 위해 사용할 수 있는 데이터를 확장하고 개선하기를 원했다.2007년, Li는 이 프로젝트에 대해 논의하기 위해 WordNet의 창시자 중 한 명인 Princeton의 교수인 Christiane Fellbaum을 만났다.이 회의의 결과, Li씨는 WordNet의 워드 데이타베이스로부터 시작해,[12] 많은 기능을 사용해 ImageNet을 구축했습니다.

Princeton의 조교수로서 Li는 ImageNet 프로젝트에 임하기 위해 연구팀을 구성했습니다.그들은 이미지 [12]분류를 돕기 위해 Amazon Mechanical Turk를 사용했다.

이들은 플로리다에서 [12][13][14]열린 2009년 컴퓨터 비전 및 패턴 인식 콘퍼런스(CVPR)에서 처음으로 포스터로 데이터베이스를 발표했다.

데이터 세트

ImageNet은 주석 프로세스를 크라우드소싱합니다.이미지 수준 주석은 "이 이미지에 호랑이가 있습니다" 또는 "이 이미지에 호랑이가 없습니다"와 같은 이미지에 개체 클래스가 있는지 여부를 나타냅니다.개체 수준 주석은 표시된 개체(표시된 부분) 주위에 경계 상자를 제공합니다.ImageNet은 광범위한 WordNet 스키마의 변형을 사용하여 오브젝트를 분류하고 120개 카테고리의 개 품종으로 증강하여 세분화된 [6]분류를 보여줍니다.WordNet 사용의 한 가지 단점은 카테고리가 ImageNet에 최적인 것보다 더 "향상된" 것일 수 있다는 것입니다. "대부분의 사람들은 이 희귀한 [clarification needed]종류의 디플로도쿠스보다 레이디 가가나 아이팟 미니에 더 관심이 있습니다."2012년 ImageNet은 세계 최대 규모의 기계 터크 학술 사용자였습니다.평균 작업자는 [2]분당 50개의 이미지를 식별했습니다.

ImageNet 과제 이력

ImageNet에서의 에러율 이력(팀당 최고의 결과 및 연간 최대 10개의 엔트리 표시)

ILSVRC는 2005년에 설립된 소규모 PASCAL VOC 챌린지의 전철을 밟는 것을 목표로 하고 있습니다.이 챌린지는 약 20,000개의 이미지와 20개의 오브젝트 [6]클래스만을 포함하고 있습니다.ImageNet을 "민주화"하기 위해 Fei-Fei Li는 2010년부터 PASCAL VOC 팀에 연구팀이 주어진 데이터 세트에 대한 알고리즘을 평가하고 여러 시각적 인식 작업에서 [12]더 높은 정확도를 달성하기 위해 경쟁하는 협업을 제안했습니다.

그 결과 매년 개최되는 이 대회는 ImageNet Large Scale Visual Recognition Challenge(ILSVRC)로 알려져 있습니다.ILSVRC는 완전한 ImageNet [6]스키마에 의해 분류된 120개의 견종 중 90개를 포함하여 1000개의 이미지 카테고리 또는 "클래스"로만 구성된 "트리밍된" 목록을 사용합니다.2010년대는 이미지 처리에 있어서 극적인 진보를 보였다.2011년경, 양호한 ILSVRC 분류 상위 5개 오류율은 25%였다.2012년에는 AlexNet이라는 심층 컨볼루션 뉴럴넷이 16%를 달성했습니다.그 후 몇 년 동안 상위 5개 오류율은 몇 %[15]로 떨어졌습니다.2012년의 획기적인 성과는 "이전까지 있던 모든 것을 조합한 것"이었지만, 이 극적인 양적 개선은 산업 전반에 걸친 인공지능 [4]붐의 시작을 알렸다.2015년까지 마이크로소프트의 연구원들은 그들의 CNN이 좁은 ILSVRC [10][16]작업에서 인간의 능력을 초과했다고 보고했다.그러나, 2015년에 챌린지 주최자 중 한 명인 Olga Russakovsky가 지적했듯이, 프로그램은 이미지를 수천 개의 카테고리 중 하나에 속하는 것으로 식별하기만 하면 된다. 사람은 더 많은 카테고리를 인식할 수 있고, 또한 (프로그램과 달리)[17] 이미지의 맥락을 판단할 수 있다.

2014년까지 50개 이상의 기관이 [6]ILSVRC에 참여했다.2017년에는 38개 경쟁팀 중 29개 팀이 95% 이상의 [18]정확도를 보였다.2017년 ImageNet은 자연 언어를 사용하여 3D 객체를 분류하는 새로운 도전 과제를 2018년에 출시할 것이라고 발표했습니다.3D 데이터 생성은 기존 2D 이미지에 주석을 다는 것보다 비용이 더 많이 들기 때문에 데이터 집합이 더 작을 것으로 예상됩니다.이 분야에서의 진보의 응용은 로봇 내비게이션에서 [1]증강현실까지 다양할 것이다.

ImageNet의 바이어스

2019년 ImageNet과 WordNet의 다중 계층(택소노믹, 객체 클래스 및 라벨링)의 이력에 대한 연구는 모든 종류의 [19][20][21][22]이미지에 대한 대부분의 분류 접근법에 편견이 어떻게 깊이 내재되어 있는지를 설명했다.ImageNet은 다양한 [23]편견의 원천에 대처하기 위해 노력하고 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b "New computer vision challenge wants to teach robots to see in 3D". New Scientist. 7 April 2017. Retrieved 3 February 2018.
  2. ^ a b c Markoff, John (19 November 2012). "For Web Images, Creating New Technology to Seek and Find". The New York Times. Retrieved 3 February 2018.
  3. ^ "ImageNet Summary and Statistics". ImageNet. Retrieved 22 June 2016.
  4. ^ a b c "From not working to neural networking". The Economist. 25 June 2016. Retrieved 3 February 2018.
  5. ^ "ImageNet Overview". ImageNet. Retrieved 22 June 2016.
  6. ^ a b c d e Olga Russakovsky*, Jia Deng*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Adita Khosla, Michael Ber Burnstein, Alexander C.Berg 및 Li Fei-Fei. (* = 동등 기여) ImageNet 대규모 시각적 인식 챌린지.IJCV, 2015.
  7. ^ a b Krizhevsky, Alex; Sutskever, Ilya; Hinton, Geoffrey E. (June 2017). "ImageNet classification with deep convolutional neural networks" (PDF). Communications of the ACM. 60 (6): 84–90. doi:10.1145/3065386. ISSN 0001-0782. S2CID 195908774. Retrieved 24 May 2017.
  8. ^ "Machines 'beat humans' for a growing number of tasks". Financial Times. 30 November 2017. Retrieved 3 February 2018.
  9. ^ Gershgorn, Dave (18 June 2018). "The inside story of how AI got good enough to dominate Silicon Valley". Quartz. Retrieved 10 December 2018.
  10. ^ a b He, Kaiming; Zhang, Xiangyu; Ren, Shaoqing; Sun, Jian (2016). "Deep Residual Learning for Image Recognition". 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR): 770–778. arXiv:1512.03385. doi:10.1109/CVPR.2016.90. ISBN 978-1-4673-8851-1. S2CID 206594692.
  11. ^ Hempel, Jesse (13 November 2018). "Fei-Fei Li's Quest to Make AI Better for Humanity". Wired. Retrieved 5 May 2019. When Li, who had moved back to Princeton to take a job as an assistant professor in 2007, talked up her idea for ImageNet, she had a hard time getting faculty members to help out. Finally, a professor who specialized in computer architecture agreed to join her as a collaborator.
  12. ^ a b c d Gershgorn, Dave (26 July 2017). "The data that transformed AI research—and possibly the world". Quartz. Atlantic Media Co. Retrieved 26 July 2017. Having read about WordNet's approach, Li met with professor Christiane Fellbaum, a researcher influential in the continued work on WordNet, during a 2006 visit to Princeton.
  13. ^ Deng, Jia; Dong, Wei; Socher, Richard; Li, Li-Jia; Li, Kai; Fei-Fei, Li (2009), "ImageNet: A Large-Scale Hierarchical Image Database" (PDF), 2009 conference on Computer Vision and Pattern Recognition
  14. ^ Li, Fei-Fei, How we're teaching computers to understand pictures, retrieved 16 December 2018
  15. ^ Robbins, Martin (6 May 2016). "Does an AI need to make love to Rembrandt's girlfriend to make art?". The Guardian. Retrieved 22 June 2016.
  16. ^ Markoff, John (10 December 2015). "A Learning Advance in Artificial Intelligence Rivals Human Abilities". The New York Times. Retrieved 22 June 2016.
  17. ^ Aron, Jacob (21 September 2015). "Forget the Turing test – there are better ways of judging AI". New Scientist. Retrieved 22 June 2016.
  18. ^ Gershgorn, Dave (10 September 2017). "The Quartz guide to artificial intelligence: What is it, why is it important, and should we be afraid?". Quartz. Retrieved 3 February 2018.
  19. ^ "The Viral App That Labels You Isn't Quite What You Think". Wired. ISSN 1059-1028. Retrieved 22 September 2019.
  20. ^ Wong, Julia Carrie (18 September 2019). "The viral selfie app ImageNet Roulette seemed fun – until it called me a racist slur". The Guardian. ISSN 0261-3077. Retrieved 22 September 2019.
  21. ^ Crawford, Kate; Paglen, Trevor (19 September 2019). "Excavating AI: The Politics of Training Sets for Machine Learning". -. Retrieved 22 September 2019.
  22. ^ Lyons, Michael (4 September 2020). "Excavating "Excavating AI": The Elephant in the Gallery". arXiv:2009.01215. doi:10.5281/zenodo.4037538. S2CID 221447952. {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  23. ^ "Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy". image-net.org. 17 September 2019. Retrieved 22 September 2019.

외부 링크