스펙트로그램으로 샘플레이트간 낮은 주파수 대역의 정보량 차이 확인 가능할까? - 와싸다닷컴

시작페이지로

시작페이지로

즐겨찾기추가

즐겨찾기추가

로그인

|

아이디찾기

|

비밀번호찾기

|

모바일모드

네이버톡톡닫기

네이버톡톡

스펙트로그램으로 샘플레이트간 낮은 주파수 대역의 정보량 차이 확인 가능할까? - 와싸다닷컴

추천키워드

DENON , AUDIOLAB , Project , 720AE , JBL

OFF

홈으로

와싸다닷컴

상세보기

운영자에게

와싸다설치기

음반리뷰추천

카시오페아

자유게시판

자유자료실

이벤트게시판

경매게시판

시사종교분쟁

무료법률상담

오디오판매장터

벼룩장터프로

중고음반장터

스펙트로그램으로 샘플레이트간 낮은 주파수 대역의 정보량 차이 확인 가능할까?

HIFI게시판 > 상세보기

|

2018-06-17 00:57:59

추천수

조회수 2,534

제목

스펙트로그램으로 샘플레이트간 낮은 주파수 대역의 정보량 차이 확인 가능할까?

글쓴이

조영호 [가입일자 : 2004-12-02]

내용

오늘 시간이 좀 나서 스펙트로 그램으로 몇 가지 실험을 해 보았습니다.

이게 무슨 의미가 있을까? 관심 가지는 분들이 있기나 할까 싶기도 하지만,
그래도 혹, 흥미를 느끼시는 분이 있을 것 같기도 하여 실험결과를 올려 봅니다.

실험의 목적

48kHz 샘플링된 음원과 96kHz 샘플링된 음원의 낮은 주파수 대역(20kHz 이하 대역)에서 정보량의 차이를 확인하기 위함.

실험1)

실험방법

1. 24/96kHz 샘플링 음원 준비(1번음원)

https://drive.google.com/open?id=1XCAPxKgGebumZR9MxvR_cJ04mDw4pg5y

링크를 클릭하면 실험에 사용한 음원을 다운 받으실 수 있습니다.

2. 24/96k 음원을 24/48kHz 샘플링 레이트로 다운(2번음원)

다운 방법은 어도비 오디션에서 24bit 48kHz 샘플레이트로 다운샘플링(No Dithering)

https://drive.google.com/open?id=1yPNMFhulWnUZ7H2S-_jV9A5VOv-vQ0xX

3. 24/48kHz로 다운샘플링된 음원을 다시 24/96kHz로 업샘플링(3번음원)

원본과 동일한 스케일로 스펙트로그램을 확인하기 위함.

https://drive.google.com/open?id=1g2ewgvgYEKnNX28n6l9dL98Hy7pT4GKm

1번에서 2번을 수행하는 과정에서 24kHz 이상의 대역 정보는 모두 사라지지만

24kHz 대역 근처의 경계에서는 다운샘플러 필터의 특성에 따라서 차이가 있을 수 있으나 대부분의 정보는 유지 되고, 다시 업샘플링 하다고 하여 낮은 대역내의 정보량이 증가하지는 않을 것이므로 96kHz 샘플과 48KHz 샘플의 대역내 정보를 비교할 수 있게 됩니다.

4. 오디션에서 1번 음원과 3번 음원의 스펙트로그램을 비교 확인

1번음원(96kHz 샘플링)의 스펙트로그램

https://drive.google.com/open?id=1mfxF0S2Z5OyjtsWkodphRngGlhMHXGTD

3번음원(48kHz 다운샘플링 후 96kHz로 업샘플링)의 스펙트로그램

https://drive.google.com/open?id=1M44FwRFsSYddtzH6fjk7svZgASyBPFC0

비교결과 24kHz 이상 대역에 정보가 있고 없음의 차이 이외에는 그래프를 육안으로 유의미한 차이 발견 하지 못하였습니다.

실험2)

위의 실험에서 오디션 프로그램 내부에서 어떤 파라미터를 가지고 계산되는지를 알 수 없고,
또한, 48 -> 96 업샘플링 과정에서 대역내(24KHz 이하) 정보량이 증가 했다는 혹 있을 억측을 해소하고,

좀 더 세밀한 비교를 위해 MATLAB 으로 직접 파라미터를 설정하면서 spectrogram을 플로팅 해 보았습니다.

Matlab 에서는 Y-축(주파수 축)의 스팬을 임의로 조절 할 수 있기 때문에 3번샘플(96k -> 48k -> 96k 변환된 샘플)을 사용하지 않고 원본인 96k 샘플과 다운샘플링된 2번 샘플로 비교해 보았습니다.

아래 두 그림에서 차이점을 한번 찾아 보시기 바랍니다.

그리고 어느 그림이 96k 샘플이고 어느 그림이 48k 샘플인지 한번 추측해 보시기 바랍니다. 그리고 왜 그렇다고 생각 하시는지 이유를 함게 말씀해 주시면 감사하겠습니다.
세밀한 비교 확인을 해 보실 분을 위해 bmp 파일을 함께 첨부 합니다.

Sample A

https://drive.google.com/open?id=1lFm8klmcr2CmEObInwvzWpZiG7XuvGn4

Sample B
drive.google.com/open

계산에 사용된 matlab 코드와 주석은 아래와 같습니다.

[y96,Fs] = audioread('Adagio_24_96K.wav'); %96k 음원 로드

[y48,Fs48] = audioread('Adagio_24_48K.wav'); %48k 음원 로드

y96L = y96(:,1); %96k 스테레오 음원에서 Left 음원만 추출

y48L = y48(:,1); %48k 스테레오 음원에서 Left 음원만 추출

[s48,w48,t48,p48] = spectrogram(y48L(1:50000),5000,4900,[],Fs48,'yaxis');

% 48k 샘플 주파수축 배열을 얻기 위한 계산 수행

spectrogram(y48L(100000:200000),5000,4900,w48,Fs48,'MinThreshold',-120,'yaxis');

% 48k 샘플을 10만번째 샘플부터 20만번째 샘플까지에 대해서

% 5000 샘플크기의 윈도를 취해서 fft를 수행하고 다음 윈도에서 이전 윈도와

% 4900 샘플을 중첩시킴

% -120dB 이하는 컷 하여 버림.

spectrogram(y96L(200000:400000),10000,9800,w48,Fs,'MinThreshold',-120,'yaxis');

% 96k 샘플을 20만번째 샘플부터 40만번째 샘플까지에 대해서

% 1만 샘플크기의 윈도를 취해서 fft를 수행하고 다음 윈도에서

% 이전 윈도와 9800 샘플을 중첩시킴

% -120dB 이하는 컷 하여 버림.

% 96k 샘플과 48k 샘플을 동일한 시간축에 놓고 비교 하기 위해서

% 계산에 사용된 샘플의 수를 2배수로 맞추고, fft 윈도크기도 2배수로 맞춤

matlab을 사용하실 줄 아시는 분들은 한번 해 보시고 혹 실험과정의 문제나 해석을 달리 하는 부분이 있으면 조언 주시면 감사히 수용하겠습니다.

스크랩

소스보기

홍지성

2018-06-17 03:52:00

풉~

┗ 조영호

2018-06-17 17:56:16

답글로 올려 주신 블로그 잘 보았습니다.
근데, 비교 실험의 통제 조건이 전혀 언급이 되지 않아서 제대로된 비교라 하기 어렵더군요.

시간이 될 때 왜 저런 다른것 처럼 보이는 스팩토그램이 나올 수 밖에 없는지 알려 드리죠..

미리 잠깐 말씀 드리면 일단 답글의 실험은 16bit 심도와 24bit 심도를 비교 한 것입니다.
44.1k와 고 샘플링레이트간의 샘플링레이트의 차이에 의한 비교가 아닌 두가지 이상의 비교 인자들을 비교한 것입니다.

우선 제가 올려 드린 Sample A와 Sample B 의 spectrogram 에서 어느것이 고 샘플링레이트의 음원인지 부터 찾아 보세요.
그동안 스펙토그램을 눈이 빠져라 쳐다 보셨을 테니 금방 찾으실 것 같은데요.

더 긴 설명은 그것 부터 찾아낸 다음에 말씀 드리죠.

다음 댓글은 11시쯤에 달 수 있을 것 같습니다.

┗ 조영호

2018-06-18 09:17:59

뭐라고 말씀좀 해 주셔야죠.

스펙트로 그램은 색의 농도만 가지고 단순히 정보량이 많네 적네 식으로 해석 해서는 안되는 겁니다.
하나의 스펙트로그램내에서 상대적인 비교는 의미가 있겠으나, 통제되지 않은 많은 변수들을 한꺼번에 뒤섞고 어떤 파라미터가 어떻게 결과에 영향을 미쳤는지 알 수도 없고 해석 할 수도 없는 결과를 아전인수격 해석을 해서는 안되는 겁니다.

기본적인 디지털신호처리에 대한 이해가 없이 그림만 보고 모든것을 알 수 있다는 식의 해석은 곤란 합니다.

이상욱

2018-06-17 13:08:09

고해상도 포맷의 장점을 광고하는 글들을 보면,
서로 다른 마스터링과정을 거친 것으로 보이는 CD포맷과 고해상도 포맷을 비교하는 오류를 저지르고 있습니다.

비교를 하려면 위에 조영호 님이 하신 것처럼
고해상도 음원을 기본으로 해서 다운샘플링 하는 방법이 적절할 것입니다.

그런데
다운샘플링전 안티알리아싱필터를 사용하셨나요?

24/96에서 24/44로 바꿀때 원화일에서 22Khz이상 부분을 잘라내지 않으면
24/44 파일에 가청영역에서의 아티팩트가 생기니까요.

┗ 조영호

2018-06-17 17:50:24

다운샘플링은 Matlab에서 하지 않고 Audition 에서 했으므로 오디션 내부의 최적화된 안티앨리어싱 필터와 알고리즘으로 되었을 것입니다.
Matlab에서는 여러 시행착오를 거쳐 최적의 파라미터를 찾아 가는 과정이 필요 하므로 완성된 툴을 사용 한 것입니다.

이상욱

2018-06-17 18:52:33

제가 쓰는 쿨에디트 2.1 pro에서 그냥 다운샘플링하면 자동으로 안티알리아싱필터 적용하지 않습니다. 오디션이 쿨에디트 후속 프로그램이니 아티팩트가 생길 가능성이 높습니다. 확인이 필요합니다.

┗ 조영호

2018-06-18 00:44:39

매뉴얼을 확인 해 보니 안티앨리어싱 필터를 선택 가능하게 되어 있네요.
기본값이 선택 상태이므로 제가 사용한 다운샘플된 음원은 안티앨리어싱 필터를 사용했다고 보시면 되겠습니다.
컷오프 특성을 어느정도 조절이 가능하긴 한데, 파라미터 값을 숫자로 선택하거나 볼 수는 없고 단지 품질 팩터로만 0~100%로 조절 할 수 있게 되어 있고, 기본값은 50%로 되어 있네요.

이에 비해 iZotope RX 에서는 필터 차수나, 컷오프 주파수를 조절 할 수 있게 좀더 세밀한 조정을 할 수 있도록 되어 있네요.

쿨에디트2.1이면 적어도 7~8년전에 나온것인데요. 오디션으로 갈아타시죠.

김영옥

2018-06-19 10:36:32

이거 전에도 논쟁이 되었던 내용인것 같은데, 지금도 진행 중인가 보네요.

논쟁에 선정된 주제가 이곳 사이트에서 건드리기 너무 어려운 주제인데다 깊게까지 들어가신것도 같아요.
이 논쟁을 하려거든 다뤄야할 이론은 물론 실무 지식을 매우 매우 많이 필요로 한다고 보여지는데요?

이런쪽을 잘 모르는 제가 봐도, 참여자 모든 분들의 주장에는 붙여야할 살이 많다라는게 명확히 보여지기도 하고요.

김영옥

2018-06-19 10:37:48

개인적으로 스펙트로그램을 전면으로 내세우는 주장측은 참 이해가 안됩니다.
샘플링레이트가 높으면 스펙트로그램에서 가청 주파수내에서 정보량이 많은것을 확인할 수 있다고 하는 것부터가 코메디 입니다. 당연하잖아요!!

48kHz 샘플링에서 가진 정보량과 96kHz 샘플링에서 가진 정보량에 있어서, 똑 같이 어떤 한 오디오 신호 20kHz 가 존재한다고 했을 때 데이터량이 다르니 당연히 정보량이 다르죠. 한 싸인파가 있는데 그 곡선의 오르 내리고 하는 정보까지 있는 것과 아닌 것은 분명 정보량이 다르죠. 이에 따라 스펙트로그램에서 계산에 사용된 모수 관계 때문에 육안으로 보기에도 달라지죠. 하지만 그렇다고 20kHz 가 샘플링레이트마다 다르냐? 라고 한다라면 전혀 다르지 않은 엄연히 그냥 20kHz 입니다.

스펙트로그램이 아무리 날고 기어봐야 오늘날 대부분 푸리에 변환을 수행하게 됩니다.
이말인 즉슨 현 세대 고성능 D/A 기준 '정보량이 많다 = 가청주파수내에서도 더욱 고음질이다.' 라고 주장하는 측의 말이 틀렸다는 근거가 됩니다. 이는 샘플링레이트가 높아 세밀한 정보를 담아 낼 수록 푸리에 변환에서 가청주파수 이상의 신호로 잡히기 때문입니다. (고 샘플링은 뭔가 있을 것이라고 주장하는 부류를 위해 설명하는 중임.)

그러니까 말하자면 스펙트로그램의 결과와 무관하게, 샘플링레이트가 높은 것이 데이터로써 좋은것은 맞지만 가청 주파수 이상의 신호까지 포함하기 때문에 좋다라는 것입니다.

논리적으로 세밀한 정보 자체가 들쭉 날쭉한 경우 주파수 기준으로 고주파에 해당하는데, 가청 주파수라고 표현하는 것 자체가 넌센스입니다.

댓글수정

패스워드

패스워드를 입력하세요.(답글 삭제시 사용됩니다.)

┗ 조영호

2018-06-19 13:45:15

고수의 향기가 묻어 납니다.

이 게시글은 여러가지 논점 중에서 딱 한가지만 꼬집어낸 것입니다.
여러가지 논점을 동시에 다룰 역량이 안되기 때문에 한가지 중요한 사실에 집중하려고 했는데, 결과적으로 많은 기초 지식을 필요로 하다보니 재미없는 주제가 되고 말았습니다.

스펙트로그램의 색의 농도를 보고 정보량이 더 있다 없다라고 판단 할 수 있다라고 하는 자체가 넌센스라는 것을 설명하려고 하는데 쉽게 이해 시키는게 힘드네요. 그러다 보니 16/44.1k 포맷과 24/96k 포맷 음원간의 스펙크로그램의 육안으로 보이는 차이가 무엇 때문이고 왜 그것을 정보량의 차이라고 받아 들이면 안되는가를 설명 하는 과정 이었습니다.

오디오에서 정보량의 정의가 무엇일까요?

김영옥

2018-06-19 10:39:17

이론으로 설명할 것은 제가 작성한 글의 몇 배는 더 많지만 너무 길기 때문에 이만 여기서 줄이고, 실무 오디오 이야기도 몇 자 할애해봅니다.
제가 예전 부터 항상 하던 이야기가 있습니다.
"샘플링레이트는 사람들이 알고 있는 것 처럼, 주파수로 쪼개는 것이 아니라 주어진 대역폭에서 샘플링할 뿐이다."
이것이 A/D 입니다. 심지어 이번 논쟁 참여자인 홍 모 회원님께도 설명 드렸던 것으로 기억합니다.

그럼 D/A 는 A/D 의 결과를 역으로 돌려놔야 할텐데, 주파수가 아니라 파형기준으로는 다양한 모양이 있을 수 있겠습니다만, Digital 신호와는 달리 연결 자체가 매끄러워야 할 것입니다. D/A 뒷단에서 이러한 매끄러운 부분까지 얼마나 정밀하게 잡아내느냐 마느냐가 대역폭입니다. 그래서 오디오 제조사중에서 고성능에 왜율을 줄이고자 가청 영역인 20kHz 를 넘어 200kHz 혹은 1500kHz. 더 나아가 2000kHz 내지는 미친성능의 3000kHz 의 프리앰프까지도 탄생하게 된 것입니다. 이런 프리들은 엔트리급만 되어도 성능이 확실히 달라요.

몇 해 전이었나요? 해외에서 44.1kHz 이상은 필요 없다는 아주 방대하면서도 상세하며 잘 작성된 글이 있었고, 우리 나라에서도 이슈가 되었고 비교적 그리 오래되지 않은 얼마전 이곳 와싸다에서도 그 내용이 이슈가되었었죠.

그 글을 보고 제 소견으로써 공개적으로 언급 하기를 '매우 좋은 글인데 몇 가지가 아쉽다.' 라고 한 부분이 바로 이번에 제가 설명한 내용과 직간접적으로 관계된 여러 내용들 때문이었습니다.

제가 틀렸거나, 아는 것이 많은 분이라면 무슨 말이든 환영합니다.

댓글수정

패스워드

패스워드를 입력하세요.(답글 삭제시 사용됩니다.)

김영옥

2018-06-19 17:09:22

(조영호 회원님의 댓글에 답변글.)

제가 회원님과 뜻이 같지는 않겠지만, 본문을 통해 말씀하고싶으셨던 내용에 대해서는 정확하게 이해하고 있답니다.

글을 남기게 된 계기는, 반대측 주장을 갖고 계시는 분들께서 이론에 대해 정립도 안되어 부족한 티가 나는 상황에서, 제 3자들에게 스펙트로그램만 내세워 이론을 언급하시고, 또 그것으로 인해 여러 사람들이 호응하는 분위기가 불편해서 입니다.

말씀하신 오디오에서 정보량... 이것에 대해 제가 언급한 것은 디지털 신호였기 때문에 그 기준에서 이야기를 나눠 봐요.

오디오의 파형(시그널, 신호)은 반드시 시간 개념이 있어야 주파수를 포함하게 되니까요.
제가 언급한 바가 있는 48kHz, 96kHz 의 샘플링 레이트에서 각기 똑 같은 20kHz 의 파형의 음원이 있다고 가정해볼께요.

그러면, 주파수라는 것은 시간 개념을 포함하므로 결과적으로 48kHz 든. 96kHz 든. 결국 반드시 똑 같은 시간 동안의 파형이 존재할 수 밖에 없겠죠. 즉, 파형의 모양은 오디오 신호로써 동일합니다. 다만 차이라면, 똑 같은 파형에 대하여 모양을 위한 레벨링 정보성 샘플 데이터가 두 배의 차이가 되는 것이겠지요.

예를 들어.. 하지만 가정한 경우를 예를 들어, 파형의 반쪽에 해당하는 볼록한 부분만을 '1.시작, 2.가장 볼록한 부분, 3.끝' 이렇게 3등분 한 것이 48kHz 샘플링이라고 한다라면, 96kHz 에서는 이를 3개가 아니라 6개로 쪼갠 것이죠.

그러니까 사실상 결국은 96kHz 샘플링레이트이라 할 지라도 담아낸 주파수 기준으로 48kHz 와 차이가 전혀 없게 됩니다. 20kHz 를 표현하는데 있어서 불필요한 정밀도로 인해 정보량만 배로 뛰었을 뿐입니다.

이를 정보량이 많다라고 해석할 수 있다라고 서로 호흡을 맞추면 될 것 같습니다.
지금 까지 설명한 모든 내용은 모두가 익히 알고 있는 내용일 것입니다.

댓글수정

(조영호 회원님의 댓글에 답변글.)<br />
<br />
제가 회원님과 뜻이 같지는 않겠지만, 본문을 통해 말씀하고싶으셨던 내용에 대해서는 정확하게 이해하고 있답니다.<br />
<br />
글을 남기게 된 계기는, 반대측 주장을 갖고 계시는 분들께서 이론에 대해 정립도 안되어 부족한 티가 나는 상황에서, 제 3자들에게 스펙트로그램만 내세워 이론을 언급하시고, 또 그것으로 인해 여러 사람들이 호응하는 분위기가 불편해서 입니다.<br />
<br />
<br />
말씀하신 오디오에서 정보량... 이것에 대해 제가 언급한 것은 디지털 신호였기 때문에 그 기준에서 이야기를 나눠 봐요.<br />
<br />
오디오의 파형(시그널, 신호)은 반드시 시간 개념이 있어야 주파수를 포함하게 되니까요.<br />
제가 언급한 바가 있는 48kHz, 96kHz 의 샘플링 레이트에서 각기 똑 같은 20kHz 의 파형의 음원이 있다고 가정해볼께요.<br />
<br />
그러면, 주파수라는 것은 시간 개념을 포함하므로 결과적으로 48kHz 든. 96kHz 든. 결국 반드시 똑 같은 시간 동안의 파형이 존재할 수 밖에 없겠죠. 즉, 파형의 모양은 오디오 신호로써 동일합니다. 다만 차이라면, 똑 같은 파형에 대하여 모양을 위한 레벨링 정보성 샘플 데이터가 두 배의 차이가 되는 것이겠지요.<br />
<br />
예를 들어.. 하지만 가정한 경우를 예를 들어, 파형의 반쪽에 해당하는 볼록한 부분만을 '1.시작, 2.가장 볼록한 부분, 3.끝' 이렇게 3등분 한 것이 48kHz 샘플링이라고 한다라면, 96kHz 에서는 이를 3개가 아니라 6개로 쪼갠 것이죠.<br />
<br />
그러니까 사실상 결국은 96kHz 샘플링레이트이라 할 지라도 담아낸 주파수 기준으로 48kHz 와 차이가 전혀 없게 됩니다. 20kHz 를 표현하는데 있어서 불필요한 정밀도로 인해 정보량만 배로 뛰었을 뿐입니다.<br />
<br />
이를 정보량이 많다라고 해석할 수 있다라고 서로 호흡을 맞추면 될 것 같습니다.<br />
지금 까지 설명한 모든 내용은 모두가 익히 알고 있는 내용일 것입니다.

패스워드

패스워드를 입력하세요.(답글 삭제시 사용됩니다.)

김영옥

2018-06-19 17:09:38

(여러분께)

이제 부터가 이번 논쟁에서 모두가 궁굼해하시는 내용인데요.
그렇다면 이러한 불필요해 보이는 정보까지도 스펙트로그램이 계산을 해내는가? 하는 것입니다.
정답은 '그렇다.' 입니다.

해답은 간단합니다.
자, 피아노 연주를 녹음한 음원이 있다고 했을 때. 해당 음원은 주어진 시간 동안 다양한 주파수를 내포하고 있을 것입니다. 그러면 이러한 음원이 어떤 주파수를 내포하고 있는지를 어떻게 알아낼까요?
어떤 주파수들을 내포하고 있는지를 알아야 스펙트로그램을 보여주겠죠.
그 처리가 바로 제가 언급한 푸리에 변환입니다.
즉, 푸리에 변환을 수행할 때 담겨진 주파수 알아내기 위해 정보를 다 넣는 겁니다. 이렇게 정보를 다 넣어 보면 "음원에 어떤 주파수들이 있네?" 하고는 알게 되는 것입니다.

그렇다면 여기서 흥미로운 점이 생기겠죠?
48kHz 샘플링이든 96kHz 샘플링이든 똑 같은 20kHz 파형이 있는데 정보량이 다르니까, 계산 후 결과도 다르게 된다는 것이죠. 사실은 오디오로 출력되는 음성 신호로써는 완전히 동일한데도 말이죠.

어? 그런데 이상한 의문이 생기지 않으신가요?
그렇다면 단순한 20kHz 파형 하나가 아니라, 여러 주파수가 섞여 있는 경우라면 보다 파악이 쉽지 않을까 하는 의문 말입니다.

증명까지 해드리겠습니다.
각각 10kHz, 8kHz 싸인파 두 개씩을 48kHz 와 96kHz 의 샘플링레이트에서 각기 만들어 봅니다.
그리고 각각의 샘플링레이트에서 두 개씩 섞어 봅니다. 소리가 다르게 들리네 마네 하는 논쟁도 불필요 한 것일 정도로 고작 두 개의 주파수의 혼합이라 매우 단순한 것 같습니다.

그리고 48kHz, 96kHz 각각의 결과물을 스펙트로그램에서 띄워 봅니다.
네, 다른 것이 눈에 띄게 보여집니다. (S/W 에 따라 결과가 조금씩 다름.)
하지만, 이 둘 모두 실제 담고 있는 소리가 동일합니다.
이 모든 일이 연산을 위한 해상력에 해당하는 모수의 수량와 계측 사이즈(윈도우 사이즈라 칭함)와 관계가 있다 할 수 있겠습니다.
따라서, 이 둘이 스펙트로그램에서 조차 유사하게 보이는 방법도 있습니다.
바로, 고-샘플링레이트의 음원에 한정하여 스펙트로그램의 계측 사이즈(윈도우 사이즈) 옵션을 증가시키는 방법입니다.
처리할 데이터량이 증가한 만큼, 계산을 위한 해상력도 증가해야 하는 것이 사실상 당연한 것입니다.

결국 96kHz 샘플링레이트 음원이 스펙트로그램에서 보다 더 밀도 있게 보여지는 이유는, 연산에 사용된 모수와, 계측 사이즈 (윈도우 사이즈)에 의해 그렇게 보여지는 것입니다.

본문에서 하고자 하시는 증명은 이대로 할 수 있게 되는 겁니다.

이것 말고도, 보다 임펙트 있는 이야기가 있기야 있습니다.

어쨌거나 그렇다라면,
"실제 음원에 있어서 48kHz 와 96kHz 샘플링레이트 사이에서 귀로 듣는 음질 차이가 발생하는가?"
라는 것에 있어서는 또 다른 이야기 이므로, 이쪽 의견은 더더욱 방대해서 도망가기로 합니다. ㅠ_ㅠ

댓글수정

(여러분께)<br />
<br />
이제 부터가 이번 논쟁에서 모두가 궁굼해하시는 내용인데요.<br />
그렇다면 이러한 불필요해 보이는 정보까지도 스펙트로그램이 계산을 해내는가? 하는 것입니다.<br />
정답은 '그렇다.' 입니다.<br />
<br />
<br />
해답은 간단합니다.<br />
자, 피아노 연주를 녹음한 음원이 있다고 했을 때. 해당 음원은 주어진 시간 동안 다양한 주파수를 내포하고 있을 것입니다. 그러면 이러한 음원이 어떤 주파수를 내포하고 있는지를 어떻게 알아낼까요?<br />
어떤 주파수들을 내포하고 있는지를 알아야 스펙트로그램을 보여주겠죠.<br />
그 처리가 바로 제가 언급한 푸리에 변환입니다.<br />
즉, 푸리에 변환을 수행할 때 담겨진 주파수 알아내기 위해 정보를 다 넣는 겁니다. 이렇게 정보를 다 넣어 보면 "음원에 어떤 주파수들이 있네?" 하고는 알게 되는 것입니다.<br />
<br />
그렇다면 여기서 흥미로운 점이 생기겠죠?<br />
48kHz 샘플링이든 96kHz 샘플링이든 똑 같은 20kHz 파형이 있는데 정보량이 다르니까, 계산 후 결과도 다르게 된다는 것이죠. 사실은 오디오로 출력되는 음성 신호로써는 완전히 동일한데도 말이죠.<br />
<br />
어? 그런데 이상한 의문이 생기지 않으신가요?<br />
그렇다면 단순한 20kHz 파형 하나가 아니라, 여러 주파수가 섞여 있는 경우라면 보다 파악이 쉽지 않을까 하는 의문 말입니다.<br />
<br />
<br />
증명까지 해드리겠습니다.<br />
각각 10kHz, 8kHz 싸인파 두 개씩을 48kHz 와 96kHz 의 샘플링레이트에서 각기 만들어 봅니다.<br />
그리고 각각의 샘플링레이트에서 두 개씩 섞어 봅니다. 소리가 다르게 들리네 마네 하는 논쟁도 불필요 한 것일 정도로 고작 두 개의 주파수의 혼합이라 매우 단순한 것 같습니다.<br />
<br />
그리고 48kHz, 96kHz 각각의 결과물을 스펙트로그램에서 띄워 봅니다.<br />
네, 다른 것이 눈에 띄게 보여집니다. (S/W 에 따라 결과가 조금씩 다름.)<br />
하지만, 이 둘 모두 실제 담고 있는 소리가 동일합니다.<br />
이 모든 일이 연산을 위한 해상력에 해당하는 모수의 수량와 계측 사이즈(윈도우 사이즈라 칭함)와 관계가 있다 할 수 있겠습니다.<br />
따라서, 이 둘이 스펙트로그램에서 조차 유사하게 보이는 방법도 있습니다.<br />
바로, 고-샘플링레이트의 음원에 한정하여 스펙트로그램의 계측 사이즈(윈도우 사이즈) 옵션을 증가시키는 방법입니다.<br />
처리할 데이터량이 증가한 만큼, 계산을 위한 해상력도 증가해야 하는 것이 사실상 당연한 것입니다.<br />
<br />
결국 96kHz 샘플링레이트 음원이 스펙트로그램에서 보다 더 밀도 있게 보여지는 이유는, 연산에 사용된 모수와, 계측 사이즈 (윈도우 사이즈)에 의해 그렇게 보여지는 것입니다.<br />
<br />
본문에서 하고자 하시는 증명은 이대로 할 수 있게 되는 겁니다.<br />
<br />
이것 말고도, 보다 임펙트 있는 이야기가 있기야 있습니다.<br />
<br />
<br />
어쨌거나 그렇다라면,<br />
"실제 음원에 있어서 48kHz 와 96kHz 샘플링레이트 사이에서 귀로 듣는 음질 차이가 발생하는가?"<br />
라는 것에 있어서는 또 다른 이야기 이므로, 이쪽 의견은 더더욱 방대해서 도망가기로 합니다. ㅠ_ㅠ

패스워드

패스워드를 입력하세요.(답글 삭제시 사용됩니다.)

┗ 조영호

2018-06-19 17:59:56

상세한 설명 감사합니다.
저의 생각과 기본적 이해의 문제는 일치합니다.
다만 정보량의 정의에 관한 문제와 스펙트로그램에서 밀도의 차이를 설명하는 방법은 다른 접근도 가능할 것으로 보입니다.
윈도사이즈의 차이로인한 주파수축의 해상력증가 부분과 시간축의 해상력차이로 인해 샘플링레이트가 다른 두 신호는 동일한 스펙트럼을 절대 가질수 없다는것.
그렇다고 해서 원신호가 가진 정보가 다르지 않다는것.
이것이 불확정성의 원리와 관련되어 있다는것 등등..
저녁 약속이 있어 밤늦게나 다음댓글을 쓸 수 있겠습니다.

┗ 김영옥

2018-06-19 19:22:19

1. 제 기준에 있어서 정보량의 정의에 관한 문제는 애당초 다른 방도가 없는 것이...
댓글에서 언급했지만 정보량에 있어서 달리 해석하게 되면 푸리에 변환에 의해 그것이 고주파 형태로 띄게 됩니다.
즉, 가능한 모든 생각을 동원해서 다각도로 접근해보아도 방도가 전혀 없게 됩니다.

2. 윈도사이즈로 인한 차이로 동일한 스펙트럼을 가진다고 언급한 바가 없답니다. '유사한' 이라고 언급하였습니다. 실제로 동일한 스펙트럼을 갖는 것은 데이터로 인해 불가능한 일입니다. 당장에 샘플링 변환했다 원래로 재변환을 몇 번을 해도 Bit Perfect 를 측정해보면 동일하지도 않기에 데이터 자체가 다름까지도 증명 가능한 터라 '동일' 하다라는 것 부터가 모순이죠.

3. 나머지에 대해서는 별로 나눌 이야기가 없는 것 같아요. 저는 사실 논쟁에 참여하려는게 아니고 양측의 살을 덧 붙여주기 위한 목적도 있고해서 장문의 글을 남겼을 뿐이라서요.

전반적으로 제 관심사가 아니라 저는 이만 물러갑니다. ^^
즐거운 오디오 생활 되세요.

조영호

2018-06-19 19:37:46

예. 압니다. 저도 논쟁을 하고자 하는게 아님을 먼저 말씀드립니다.

2번의 말씀은 제가 견해를 달리한다는것이 아니라 이해로의 접근 방법이 다른 방법을 취할 수도 있겠다 정도로 생각해 주시면 되겠습니다.
같은맥락에서 샘플링레이트가 다른 데이터를 동일한 사이즈의 윈도를 취하는것은 시간축 기준이 다르게 되어유사한 결과를 얻을 수 없게 되고, 시간축을 일치시키면 윈도사이즈의 차이로 해상도에 차이를 가져올 수 밖에 없으므로 동일한 신호를 다른 샘플링레이트간 스펙트로그램을 비교하는것은 다르게 보일 수 밖에 없음을 설명하는 방법의 차이를 말씀드린겁니다.

정보량에 관해서는 데이터 자체를 정보로 본다면 정보량이 다른것은 맞습니다.
다만 우리가 관심있어하는, 데이터열이 담고있고 재현해 내는 아나로그신호의 관점에서 본다면 데이티량과 정보량에는 선형적인 대응 관계가 아닐수도 있겠습니다.
예를들어 BPSK 모둘레이션된 신호를 전달 한다고 보았을 때, 전달매체는 BPSK신호의 모든 샘플들이 정보이겠으나 BPSK신호에 코딩된 소스륵 정보라 할 때는 연속된 상태를 나열한 데이터는 정보가 아니거나 정보의 가치가 떨어질 수도 있기 때문입니다.
우리가 듣는 소리의 관점에서 정보의 가치가 있는가 하는 관점을 말씀드리는것입니다.
억지스런 이해일까요?

댓글수정

패스워드

패스워드를 입력하세요.(답글 삭제시 사용됩니다.)

┗ 김영옥

2018-06-19 23:36:13

회원님께서 댓글로 남겨주신 모든 것에 대해, 제가 지금까지 남겨놓은 모든 댓글에 적확하게 표현되어 있는 내용인것 같아요.
(요 내용은 아래 댓글에서 모든 분들을 향하여 따로 언급하겠습니다.)

시간축과 윈도 사이즈에 대해 언급하신 말씀도 잘 보았습니다.

제가 윈도우 사이즈를 언급하게 된 계기가, 비교의 정확성은 회원님께서 하신 실험에서 처럼 (본문 그림1, 그림2), 저도 '비교'라면 당장에 동일한 생각이 떠오를 만큼 서로 동일한 시각입니다.

다만, 반대측 주장에 계신 분은 44.1kHz 와 96kHz 를 갖고 직접 비교하시니, 그에 대한 이해를 돕기위해 모수와 윈도우 사이즈 옵션에 대해 언급하게 되었습니다.

이렇든 저렇든 본문의 스크린샷에서도 보여지지만 시간축은 어차피 음원의 시간이 정해져 있으므로 샘플링레이트와 관계 없이 동일하니까요. 스펙트로그램에서 윈도우사이즈라는 개념은 얼마나 정밀도 있게 바라보느냐로써 옵션을 바꿔도 시간축은 동일하죠 ^^

상황이야 어떻든 논쟁에서 마음 고생이 가장 심하셨을 것이라는 것이 보여집니다.
힘내세요! 그리고, 편안한 밤 되세요!

김영옥

2018-06-19 23:39:12

(아래는 여러분 모두에게 말씀 올립니다.)
말하자면, 논쟁에 참여했던 양측 모든 분들이 혼돈하시는 내용이, 주파수가 먼저라고 이해하고 계신듯 하다는 것인데요, 많은 댓글들에서 그러한 내용이 잘 표현되어 있습니다.

즉, 처음 부터 다시 배운다는 가정하에, 가장 선행되어야 하는 것은, 주파수가 아니라 시간 개념인 Time-Domain 이거든요. 그러니까 사실상, 이 모든것을 이해하기 위해서는 '시간 개념'위에 다른 내용을 쌓아야합니다. 주파수 위에 다른 개념을 쌓으니 어느 누구도 이 논쟁의 문제를 풀지 못 하는 겁니다.

예로,
"오디오 신호에 어떤 주파수가 어느 부분에 담겨 있다고 이해"하면 아니되고,

"주어진 시간 동안 오디오 신호를 샘플링레이트에 따라 샘플링을 했고, 그 샘플링 내용을 푸리에 변환을 통해 확인해보니까 이러저러한 주파수들이 담겨있더라."
라고 이해를 해야 정확합니다.

아무것도 아닌 이 문장안에 정말 핵심적인 모든것을 내포하고 있습니다.

즉, 만약 양측이 생각하는 것처럼 정보량이란게 데이터개념과 오디오의 신호에서의 무엇(?) 인가 다르다고 생각들거나, 신호의 가청 주파수 이하에서 보다 많은 어떤(?) 정보가 담겨있다라고 상상하는 순간, Time-Domain 개념이 절대적(진리임)이므로, 이론이 문제가 아니라 이론과 실무 모두에서 논리에 맞지 않게 됩니다.

예로 20kHz 라는 음성 신호가 있는데, 96kHz 샘플링레이트라고 해서 가청 주파수 이내에 더 많은 어떤 신호가 담겨 있다고 상상하는 순간 20kHz 가 운동하는 시간속인 0.00005초 이내에 어떤 신호가 또 있는 상황이 연출되므로 '고-샘플링레이트'에서의 '보다 많은 어떤 오디오 신호는 '그 자체가 가청 주파수를 초월하게 되어 버립니다.

100Hz 와 같은 저주파의 경우에 다른 어떤 정보가 섞인다라고 가정을 하면, 그것은 48kHz 샘플링에서도 충분히 커버하니까요.

그러니까 제가 바라보는 관점에서 한 말씀드린다면,
이 논쟁의 모든 해프닝은 주장하는 양측 어느 누구도 이러한 개념을 이해하지 못 한데에서 출발한것이죠. 스펙트로그램은 사실상 "고 샘플링이 가청영역에서도 고음질이다." 라는 논쟁에서 증명 가능한 수단과는 전혀 관계가 없는 내용인 것입니다. 언급한 대로 시간 개념에 갇혀서 가청주파수 이내의 정보량에 대해 다른 어떤것이 더 있을 것이라는 생각 자체를 할 수 없게 되거든요.

이만 줄이고 떠납니다.
모두 수고하셨습니다.

댓글수정

(아래는 여러분 모두에게 말씀 올립니다.)<br />
말하자면, 논쟁에 참여했던 양측 모든 분들이 혼돈하시는 내용이, 주파수가 먼저라고 이해하고 계신듯 하다는 것인데요, 많은 댓글들에서 그러한 내용이 잘 표현되어 있습니다.<br />
<br />
즉, 처음 부터 다시 배운다는 가정하에, 가장 선행되어야 하는 것은, 주파수가 아니라 시간 개념인 Time-Domain 이거든요. 그러니까 사실상, 이 모든것을 이해하기 위해서는 '시간 개념'위에 다른 내용을 쌓아야합니다. 주파수 위에 다른 개념을 쌓으니 어느 누구도 이 논쟁의 문제를 풀지 못 하는 겁니다.<br />
<br />
예로,<br />
"오디오 신호에 어떤 주파수가 어느 부분에 담겨 있다고 이해"하면 아니되고,<br />
<br />
"주어진 시간 동안 오디오 신호를 샘플링레이트에 따라 샘플링을 했고, 그 샘플링 내용을 푸리에 변환을 통해 확인해보니까 이러저러한 주파수들이 담겨있더라."<br />
라고 이해를 해야 정확합니다.<br />
<br />
아무것도 아닌 이 문장안에 정말 핵심적인 모든것을 내포하고 있습니다.<br />
<br />
즉, 만약 양측이 생각하는 것처럼 정보량이란게 데이터개념과 오디오의 신호에서의 무엇(?) 인가 다르다고 생각들거나, 신호의 가청 주파수 이하에서 보다 많은 어떤(?) 정보가 담겨있다라고 상상하는 순간, Time-Domain 개념이 절대적(진리임)이므로, 이론이 문제가 아니라 이론과 실무 모두에서 논리에 맞지 않게 됩니다.<br />
<br />
예로 20kHz 라는 음성 신호가 있는데, 96kHz 샘플링레이트라고 해서 가청 주파수 이내에 더 많은 어떤 신호가 담겨 있다고 상상하는 순간 20kHz 가 운동하는 시간속인 0.00005초 이내에 어떤 신호가 또 있는 상황이 연출되므로 '고-샘플링레이트'에서의 '보다 많은 어떤 오디오 신호는 '그 자체가 가청 주파수를 초월하게 되어 버립니다.<br />
<br />
100Hz 와 같은 저주파의 경우에 다른 어떤 정보가 섞인다라고 가정을 하면, 그것은 48kHz 샘플링에서도 충분히 커버하니까요.<br />
<br />
그러니까 제가 바라보는 관점에서 한 말씀드린다면,<br />
이 논쟁의 모든 해프닝은 주장하는 양측 어느 누구도 이러한 개념을 이해하지 못 한데에서 출발한것이죠. 스펙트로그램은 사실상 "고 샘플링이 가청영역에서도 고음질이다." 라는 논쟁에서 증명 가능한 수단과는 전혀 관계가 없는 내용인 것입니다. 언급한 대로 시간 개념에 갇혀서 가청주파수 이내의 정보량에 대해 다른 어떤것이 더 있을 것이라는 생각 자체를 할 수 없게 되거든요.<br />
<br />
<br />
이만 줄이고 떠납니다.<br />
모두 수고하셨습니다.

패스워드

패스워드를 입력하세요.(답글 삭제시 사용됩니다.)

김대열

2018-06-21 09:41:53

44/16 인간의 청력을 감안하면 충분히 좋은스펙임에도 음질이 만족스럽지 못하면 무엇인가에 책임을 전가해야하는 심리가 작용하지 싶습니다. hdtracks 가면 96/24 스튜디오 마스터급 음원 많으니까 심리적 안정을 얻기가 조금 나아졌습니다(?)
책임은 녹음상태나 마스터링에...스펙은 죄 없어요 ^^

광고문의

결제관련문의