오디오 비디오 표준
Audio Video Standard![]() |
AVS(Audio Video Coding Standard)는 중국의 Audio and Video Coding 표준 워크그룹에 의해 제정된 디지털 오디오 및 디지털 비디오 시리즈 압축 표준입니다.2002년에 작업이 시작되어 3세대의 표준이 [1]발표되었습니다.
제1세대 AVS 규격에는 「정보 테크놀로지, 어드밴스드 오디오 비디오 부호화, 파트 2: 비디오」(AVS1)와 「정보 테크놀로지, 어드밴스드 오디오 비디오 부호화 Part 16: 라디오 텔레비전 비디오」(AVS+)가 포함됩니다.AVS2라고 불리는 2세대에서는 초고해상도(4K 해상도 이상), 고다이나믹 레인지 비디오의 효율적인 압축을 지원하는 Ultra-HD TV 비디오가 주요 애플리케이션 타깃이었고 IEEE 국제 표준 IEEE 1857.4로 공개되었습니다.AVS [2]표준을 개발하고 촉진하기 위해 업계 연합이 설립되었습니다.특허 풀은 콘텐츠 공급자와 [3]운영자를 제외한 단말기 제품(TV 등)에 대해 적은 로열티를 부과합니다.
단체들
워크그룹
AVS 워크그룹은 2002년 6월 디지털 오디오 및 디지털 비디오의 압축, 압축 해제, 처리 및 표시와 같은 공통 기술 표준을 제정(개정)하기 위해 중국 기업 및 과학 연구 기관과 협력하여 디지털 비디오에 효율적이고 경제적인 부호화/복호화 기술을 제공하기 위해 설립되었습니다.고해상도 디지털 방송, 고밀도 디지털 레이저 스토리지 미디어, 무선 광대역 멀티미디어 통신, 인터넷 광대역 스트리밍 미디어 및 기타 애플리케이션을 지원하는 udio 및 디지털 비디오 디바이스 및 시스템.워크그룹은 중국공학원 학자인 가오원(高文) 베이징대 교수 겸 박사과정 감독관, 국가자연과학기금위원회 부국장 등이 이끌고 있으며 요구 그룹, 시스템 그룹, 비디오 그룹, 오디오 그룹, 테스트 그룹, 지적재산권 그룹 등으로 구성돼 있다.s.[4] 첫 번째 차질은 2003년 중국이 자체 디지털 텔레비전 방송 시스템에 AVS를 사용하지 않았을 때였다.
특허 풀
특허를 관리하고 승인하는 특허 풀은 2004년 9월 20일에 설립되었습니다.이 위원회는 중국 최초의 특허 풀 관리 기관이었다.독립법인 베이징하이뎬구 디지털음성영상표준추진센터는 베이징시 [5]하이뎬구 민정국에 등록돼 있으며, 이 표준안에 포함된 특허기술에 대해 진흥센터의 전문위원회 및 주요 비즈니스 의사결정기관으로 등록돼 있다.1세대 AVS 규격의 로열티는 단말기 1대당 1위안밖에 되지 않았다.인터넷상의 [6]소프트웨어 서비스뿐만 아니라 콘텐츠를 제외한 단말기에 대해서만 소액의 로열티를 부과할 계획이었다.
얼라이언스
![]() |
AVS 산업 동맹은 중관춘 오디오 비주얼 산업 기술 혁신 동맹의 약자입니다.2005년 5월, TCL 그룹 주식회사, 스카이워스 그룹 연구소, 화웨이 테크놀로지 주식회사, 하이센스 그룹 주식회사, 하이얼 그룹 주식회사, 베이징 하이얼 광커 주식회사, 인스퍼 그룹의 12개 기업(단위).n, 쓰촨 창홍, 상하이 SVA(그룹) 중앙 연구소, Zte Communications, Ltd., 중관춘 하이테크 산업 협회 등이 베이징에서 AVS 산업 연합을 설립했습니다.이 조직의 영문 명칭은 "AVS Industry Alliance"(AVSA)로, "AVS Workgroup" 및 "AVS 특허 풀 관리 위원회"와 "Three Carries"를 구성합니다.
제1세대
1세대 AVS 표준에는 중국 국가 표준인 "정보 기술, 고급 오디오 비디오 코딩, Part 2: 비디오"(AVS1)가 포함되어 있습니다.GB/T 200902-2006) 및 "정보 기술, 고급 오디오 비디오 코딩 Part 16: 라디오 텔레비전 비디오"(AVS+ 줄여서 GB 라벨: 2009.16-2016)입니다.국가무선영화텔레비전국(SARFT, National Radio and Television Administration)의 Radio and Television Planning Institute가 주최하는 테스트에서는 AVS1 비트레이트가 MPEG-2 표준의 절반 또는 고화질 비트레이트의 경우 부호화 품질이 표준 화질 또는 고화질 양쪽에 도달합니다.e는 1/3 미만이며, 양호한 수준에도 도달합니다.AVS1 표준 비디오 부분은 2006년 2월에 중국 국가 표준으로 공표되었습니다.이 시기에 AVS는 향상된 다용도 디스크 [7]포맷으로 사용될 것으로 고려되었지만, 제품이 시장에 출시된 적은 없었습니다.
2007년 5월 7일부터 11일까지 ITU-T(ITU Telecommunication Standardization Sector) 회의에서 AVS1은 MPEG-2, H.264 및 VC-1과 함께 Internet Protocol Television(IPTV)에서 사용 가능한 표준 중 하나였습니다.2013년 6월 4일, AVS1 비디오 파트는 IEEE에 의해 표준 IEEE 1857-2013으로 발행되었으며, AVS+는 라디오, 영화 및 텔레비전 업계 표준 GY/T 257.1-2012 "비디오용 고급 오디오 비디오 코딩 파트 1"뿐만 아니라,AVS1의 [8]ed 버전.
제2세대
제2세대 AVS 규격에는 일련의 중국 국가 표준 "정보기술, 효율적인 멀티미디어 부호화"(AVS2)가 포함되어 있다.AVS2는 주로 엑스트라 HD TV 프로그램의 전송에 직면하고 있으며, SARFT는 2016년 5월에 AVS2 비디오를 업계 표준으로, 2016년 12월 30일에 중국 국가 표준으로 발행했다.AVS2는 IEEE(Institute of Electrical and Electronics Engineers)에 의해 2019년 [9]8월에 표준 1857.4-2018로 발행되었습니다.
테스트 결과, AVS2의 부호화 효율은 AVS+의 2배 이상이며, 압축률은 국제 표준 HEVC(H.265)를 웃돌았다.제1세대 AVS 규격과 비교하여 제2세대 AVS 규격은 전송 대역폭을 절반 절약할 수 있습니다.
특징들
AVS2는 하이브리드 코딩 프레임워크를 채택하고 있으며, 전체 코딩 프로세스는 프레임 내 예측, 프레임 간 예측, 변환, 양자화, 역양자화 및 역변환, 루프 필터 및 엔트로피 코딩 등의 모듈을 포함한다.다음과 [10]같은 기술적 기능을 보유하고 있습니다.
- 유연한 코딩 구조 파티션
- AVS2는 압축 효율에 대한 HD 및 Ultra HD 해상도 비디오의 요건을 충족하기 위해 CU(코드 유닛), PU(예측 유닛), TU(트랜스폼 유닛)를 포함한 쿼드 트리를 기반으로 한 블록 파티션 구조를 채택하고 있습니다.이미지는 고정 크기의 LCU(가장 큰 CU)로 분할되며, 이 CU는 반복되고 쿼드트리 형태로 일련의 CU로 분할됩니다.각 CU는 휘도 부호화 블록과 대응하는 2개의 크로미넌스 부호화 블록을 포함한다(아래 블록 유닛의 사이즈는 휘도 부호화 블록을 참조한다).기존 매크로 블록에 비해 쿼드 트리에 기반한 파티션 구조가 더 유연하며, CU 크기가 8×8에서 64×64로 확장됩니다.
- PU는 CU의 모든 예측 모드를 규정하고 있으며, 프레임 내 예측과 프레임 간 예측을 포함한 예측의 기본 단위이다.PU의 최대 크기는 PU가 속한 현재 CU의 최대 크기를 초과할 수 없습니다.AVS1 사각 프레임내 예측 블록에 근거해, 사각 프레임내 예측 블록 파티션을 부가한다.한편, 대칭 예측 블록 분할에 근거해, 프레임간 예측도 4개의 비대칭 분할 방법을 추가한다.
- AVS2는 CU 및 PU 외에 잔류 변환 및 양자화 예측을 위한 변환 유닛 TU를 정의한다.TU는 변환 및 양자화의 기본 단위로, PU와 같이 CU로 정의되며, 크기 선택은 해당 PU 형상과 관련이 있습니다.현재 CU가 정사각형이 아닌 PU로 분할되어 있는 경우, 정사각형이 아닌 파티션이 대응하는 TU에 적용됩니다.그렇지 않은 경우 정사각형이 적용됩니다.TU의 크기는 PU의 크기보다 클 수 있지만, TU가 속한 CU의 크기보다 클 수는 없습니다.
- 내부 예측 코드화
- AVS1 및 H.264/AVC와 비교하여 AVS2는 DC 예측 모드, 평면 예측 모드, 쌍선형 예측 모드, 30개의 엔젤 예측 모드를 포함한 휘도 블록의 프레임 내 예측 부호화를 위한 33개의 모드를 설계한다.크로미넌스 블록에는 DC 모드, 수평 예측 모드, 수직 예측 모드, 쌍선형 보간 모드 및 새로 추가된 휘도 파생 모드(DM)의 5가지 모드가 있습니다.
- Inter Prediction Coding(예측간 부호화)
- AVS1에 비해 AVS2는 후보 기준 프레임의 최대량을 4로 증가시켜 다단계 기준 프레임 관리에 적응하고 버퍼의 용장 공간도 최대한 활용한다.
- 복수의 기준 프레임 관리의 요건을 만족시키기 위해서, AVS2는, 일종의 다레벨 기준 프레임 관리 모드를 채용한다.이 모드에서는, 각 GOP(Group of Pictures)의 프레임은, 프레임간의 참조 관계에 따라서 복수의 레벨로 분할됩니다.
- Inter Prediction Mode(Inter Prediction Mode)
- AVS1의 3종류의 화상 타입 I, P, B에 근거해, 애플리케이션의 요건에 따라, AVS2는 순다중 히포헤시스 예측 화상 F를 부가한다.AVS2는 비디오 감시, 씬 플레이 및 기타 특정 애플리케이션을 대상으로 씬 프레임(이미지 G 및 이미지 GB)과 레퍼런스 씬 프레임 S를 설계합니다.
- 프레임 B의 경우 기존의 정방향, 역방향, 양방향 모드 및 스킵/다이렉트 모드 외에 새로운 대칭 모드가 추가됩니다.대칭 모드에서는 순방향 움직임 벡터만 인코딩해야 하며, 그 후 역방향 움직임 벡터는 순방향 움직임 벡터로부터 파생됩니다.
- 프레임 B의 스킵/다이렉트 모드의 퍼포먼스를 최대한 발휘하기 위해서, AVS2는 프레임 B의 원래의 스킵/다이렉트 모드(양방향 스킵/다이렉트 모드, 대칭 스킵/다이렉트 모드, 역방향 스킵/다이렉트 모드, 및 순방향 스킵/다이렉트 모드)를 유지하는 것을 전제로 하고 있습니다.4개의 특정 모드에 대해서는 전류 블록의 예측 모드에 따라 인접 블록 간의 동일한 예측 모드 블록을 검출하고, 우선 동일한 예측 모드를 가진 인접 블록의 움직임 벡터를 전류 블록의 움직임 벡터로 간주한다.
- 프레임 F의 경우 부호화 블록은 프레임 P의 이중 가설 예측과 동일한2개의 순방향 참조 블록을 참조할 수 있습니다.
- AVS2는 다중 히포테시스 예측을 시간적 및 공간적 다히포테시스 모드라는 두 가지 범주로 나눕니다.
- 시간 영역 이중 가설의 현재 인코딩 블록은 예측 블록의 가중 평균을 현재 예측 값으로 적용하지만, MVD(운동 벡터 차이)와 기준 영상 지수 모두에 대해 하나만 있는 반면, 또 다른 MVD와 기준 영상 지수는 t의 거리에 기초한 선형 스케일링에서 파생됩니다.ime 도메인
- 공간 영역 이중 예측은 DMH(Directional Multi-Hypothesis)라고도 불리며, 초기 점은 두 예측 지점 주변의 두 예측 지점을 융합하여 얻습니다.초기 예측점 외에도 총 8개의 예측점이 있으며, 초기 예측점과 동일한 직선에 위치한 두 예측점과만 융합됩니다.4개의 다른 방향 외에 거리에 따른 조정도 실시해, 각각 1/2 화소 거리, 1/4 화소 거리의 4개의 모드와 초기 예측 포인트를 산출해, 합계 9개의 모드를 비교함으로써 최적의 예측 모드를 선택한다.
- 장면 프레임은 배경 모델링의 감시 비디오 코딩 방법에 기반하여 AVS2에 의해 제안됩니다.감시 도구가 열려 있지 않은 경우 프레임I는 다음 랜덤액세스 포인트 이전의 이미지에 대해서만 참조할 수 있습니다.감시 도구가 열리면 AVS2는 비디오의 특정 프레임을 장면 이미지 프레임 G로 적용합니다. 이 프레임은 후속 영상의 장기 참조로 간주할 수 있습니다.
- AVS2는, 비디오중의 몇개의 프레임과 함께 씬 화상 프레임 GB를 생성할 수 있고, 프레임 GB도 장기 참조로서 적용할 수 있다.
- 움직임 보상을 단순화하기 위해 AVS2는 DCT 변환에 기초한 8탭 보간 필터를 채택하여 1개의 필터링만 필요로 하며 1/4픽셀보다 높은 움직임 벡터 정밀도의 생성을 지원한다.
- 변혁
- AVS2의 변환 부호화는 주로 4×4, 8×8, 16×16, 32x32 크기의 변환 블록에서 직접 수행되는 정수 DCT 변환을 적용한다.
- 64보다 큰 치수의 1개의 변환 블록에 대해서 논리 변환 LOT를 채용해 웨이브 렛 변환을 실시한 후 정수 DCT 변환을 실시한다.
- DCT 변환이 달성된 후 AVS2는 저주파수 계수의 4x4 블록에 대해 두 번째 4x4 변환을 실시하여 계수 간의 상관관계를 더욱 줄이고 에너지를 보다 집중시킬 수 있습니다.
- 엔트로피 부호화
- AVS2 엔트로피 부호화는 변환 계수를 먼저 4×4 사이즈의 CG(계수 그룹)로 나눈 후 CG에 따라 부호화와 지그재그 스캔을 실시한다.
- 계수 부호화에 의해, 제로가 아닌 마지막 계수를 포함한 CG위치를 우선 부호화한 후, 모든 CG계수가 완료될 때까지 각 CG를 부호화해, 부호화 처리중에 제로계수를 보다 집중시킬 수 있다.
- AVS2에서는, 콘텍스트에 근거하는 바이너리 산술 부호화 및 2 차원 가변 길이 부호화가 여전히 적용되고 있다.
- 루프 필터
- AVS2의 루프 필터 모듈에는 디블로킹 필터, 어댑티브 샘플 포인트 오프셋 및 샘플 보정 필터의 3가지 부분이 있습니다.
- 디블로킹 필터의 필터링 블록은 8×8 크기로, 먼저 수직 에지에서 필터링을 수행한 후 수평 에지에서 필터링을 수행합니다.또, 다른 필터링 강도에 따라, 엣지 마다 다양한 필터링 방법을 선택한다.
- 디블로킹 필터 후 적응 샘플 오프셋 보정을 채택하여 왜곡을 더욱 저감한다.
- AVS2는 디블로킹 필터와 샘플 오프셋 보정 후에 적응형 필터를 추가합니다.이것은 7×7 크로스 플러스 3×3 사각 중심대칭 구조를 가진 Wiener 필터입니다.이것은 원래의 왜곡되지 않은 이미지와 부호화된 이미지를 적용하여 최소 사각 필터 계수를 구하고, 따라서 재구성된 디코딩 이미지에 대해 필터링을 수행합니다.o 디코딩 이미지의 압축 왜곡을 줄이고 참조 이미지의 품질을 향상시킵니다.
실행
uAVS2
uAVS2라고 불리는 인코더는 베이징 대학 선전 대학원의 디지털 미디어 연구 센터에 의해 개발되었다.그 후, AVS2 Ultra HD 실시간 비디오 인코더와 모바일 HD 인코더가 [11][12]발표되었습니다.
오픈 AVS2
OpenAVS2는 AVS2 [13]표준에 근거한 오디오 및 비디오 코딩, 트랜스코딩 및 디코딩 소프트웨어 세트입니다.
xAVS2 및 dAVS2
xAVS2 및 dAVS2는, AVS2-P2/IEE 1857.4 비디오 코딩 표준에 근거해 북경 대학 비디오 코딩 연구소(PKU-VCL)에 의해서 공개되는 오픈 소스 인코더 및 디코더입니다.이 규격은 GNU General Public Lic License(GPL; 일반 공중 라이센스) 버전2 또는 상용 라이센스 중 하나에 근거하고 있습니다.
레퍼런스
- ^ "Youwei Vision launches AVS3 8K video real-time decoder (in Chinese)". Tencent. May 29, 2019.
- ^ "Introduction to AVSA". Official website of AVSA. Archived from the original on March 24, 2019. Retrieved September 29, 2017.
- ^ "Who will lead the new video coding standard: a performance comparison report of HEVC、AVS2 and AV1". Archived from the original on July 28, 2018. Retrieved September 29, 2017.
- ^ Elspeth Thomson, Jon Sigurdson, ed. (2008). China's Science and Technology Sector and the Forces of Globalisation. World Scientific Publishing. pp. 93–95. ISBN 9789812771018. Retrieved June 15, 2022.
- ^ "AVS memorabilia(2002-2017)".
- ^ Board on Science, Technology, and Economic Policy, Committee on Intellectual Property Management in Standard-Setting Processes (October 7, 2013). Patent Challenges for Standard-Setting in the Global Economy: Lessons from Information and Communications Technology. National Academies Press. ASIN B00H200A56. ISBN 9780309293150. Retrieved June 15, 2022.
{{cite book}}
: CS1 maint: 작성자 파라미터 사용(링크) - ^ Liu Baijia (March 6, 2006). "Standard Issue". China Business Weekly. Retrieved June 14, 2022.
- ^ Xinhua (August 27, 2012). "China to promote its own audio-video coding standard". The Manilla Times. Retrieved June 15, 2022.
- ^ IEEE Standard for Second-Generation IEEE 1857 Video Coding. Institute of Electrical and Electronics Engineers. August 30, 2019. doi:10.1109/IEEESTD.2019.8821610. ISBN 978-1-5044-5461-2. Retrieved June 13, 2022.
- ^ "AVS2 special column".
- ^ "High definition real-time encoder of AVS2 came out with better performance than x265 the encoder of HEVC/H.265".
- ^ "AVS2 Real-time codec——uAVS2". Archived from the original on April 27, 2018. Retrieved September 29, 2017.
- ^ "Official website of OpenAVS2". Archived from the original on December 31, 2019.