音量にもいろいろあって、
例えば音圧レベル(騒音レベル[dBA])だと、
スピーカー、マイクの位置や、感じ方を考慮して
キャリブレーションを行わないといけません。
簡易的に調べる場合はRMSがよく利用されます。
1. 音量を調べたい波形区間を切り取る
2. 区間内の各サンプルの音量の2乗した値を調べる
3. 2で調べた値の平均値を求める
4. 3で求めた平均値のルートを求める
5. 4で求めた値をxとして、20 * log10( x ) [dB]がRMSです。
音量を調べたい波形区間というところは
例えば、30msなどの区間を設定します。
また、よくプログラムで音声のRMSを調べる場合は、
振幅が正規化済みとして計算します。(最小値を-1、最大値を1)
10秒間など、長い区間にわたってRMSの推移を調べたい場合は、
フレーム分析という手法をとります。
http://recognition.web.fc2.com/tips/frame.html