我目前正在尝试使用Android实现一些代码,以检测何时通过手机的麦克风播放了多个特定音频频率范围。我已经使用AudioRecord该类设置了该类:
int channel_config = AudioFormat.CHANNEL_CONFIGURATION_MONO; int format = AudioFormat.ENCODING_PCM_16BIT; int sampleSize = 8000; int bufferSize = AudioRecord.getMinBufferSize(sampleSize, channel_config, format); AudioRecord audioInput = new AudioRecord(AudioSource.MIC, sampleSize, channel_config, format, bufferSize);
然后读取音频:
short[] audioBuffer = new short[bufferSize]; audioInput.startRecording(); audioInput.read(audioBuffer, 0, bufferSize);
执行FFT是我遇到的困难,因为我在这方面的经验很少。我一直在尝试使用此类:
Java和Complex类中的FFT一起使用
然后,我发送以下值:
Complex[] fftTempArray = new Complex[bufferSize]; for (int i=0; i<bufferSize; i++) { fftTempArray[i] = new Complex(audio[i], 0); } Complex[] fftArray = fft(fftTempArray);
这很容易让我误解了此类的工作原理,但是返回的值到处都是跳跃的,即使在沉默中也不能代表一致的频率。有谁知道执行此任务的方法,或者我是否在使事情变得过于复杂以尝试仅获取少量频率范围而不是将其绘制为图形表示形式?
首先,您需要确保将获得的结果正确转换为浮点数/双精度数。我不确定short []版本的工作方式,但是byte []版本仅返回原始字节版本。然后需要将此字节数组正确转换为浮点数。转换代码应如下所示:
double[] micBufferData = new double[<insert-proper-size>]; final int bytesPerSample = 2; // As it is 16bit PCM final double amplification = 100.0; // choose a number as you like for (int index = 0, floatIndex = 0; index < bytesRecorded - bytesPerSample + 1; index += bytesPerSample, floatIndex++) { double sample = 0; for (int b = 0; b < bytesPerSample; b++) { int v = bufferData[index + b]; if (b < bytesPerSample - 1 || bytesPerSample == 1) { v &= 0xFF; } sample += v << (b * 8); } double sample32 = amplification * (sample / 32768.0); micBufferData[floatIndex] = sample32; }
然后,使用micBufferData []创建输入复杂数组。
获得结果后,请在结果中使用复数的大小。除具有实际值的频率外,大多数量值应接近零。
您需要采样频率才能将数组索引转换为这样的幅度到频率:
private double ComputeFrequency(int arrayIndex) { return ((1.0 * sampleRate) / (1.0 * fftOutWindowSize)) * arrayIndex; }