Python features 模块，mfcc() 实例源码

我们从Python开源项目中，提取了以下13个代码示例，用于说明如何使用features.mfcc()。

项目：KGP-ASR 作者：KGPML | 项目源码 | 文件源码

def wav_to_input( wav_file_name ):
    input_data, f_s = sf.read(wav_file_name)
    # mfcc_feat = MFCC_input(mfcc(input_data,f_s))
    mfcc_feat = mfcc(input_data,f_s)
    #Delta features
    delta_feat = mfcc_feat[:-1]-mfcc_feat[1:]
    #Delta-Delta features
    deltadelta_feat = delta_feat[:-1]-delta_feat[1:]

    #Removing the first two frames
    mfcc_feat = mfcc_feat[2:]
    delta_feat = delta_feat[1:]

    #Concatenating mfcc, delta and delta-delta features
    full_input = np.concatenate((mfcc_feat,delta_feat,deltadelta_feat), axis=1)

    return full_input

项目：e2e_ASR_Lasagne_CTC 作者：Santara | 项目源码 | 文件源码

def get_data(rootdir = TIMIT_main_dir): 
    inputs = []
    targets = []
    for dir_path, sub_dirs, files in os.walk(rootdir):
        for file in files:          
            if (os.path.join(dir_path, file)).endswith('.wav'):
                wav_file_name = os.path.join(dir_path, file)
                input_data, f_s = sf.read(wav_file_name)
                # mfcc_feat = MFCC_input(mfcc(input_data,f_s))
                mfcc_feat = mfcc(input_data,f_s)
                inputs.append(mfcc_feat)#Rakeshvar wants one frame along each column but i am using Lasagne

                text_file_name = wav_file_name[:-4] + '.txt'
                target_data_file = open(text_file_name)
                target_data = str(target_data_file.read()).lower().translate(None, '!:,".;?')
                # target_data = str(target_data_file.read()).lower().translate(str.maketrans('','', '!:,".;?'))
                target_data = target_data[8:-1]#No '.' in lexfree dictionary
                targets.append(target_data)
    return inputs, targets

项目：KGP-ASR 作者：KGPML | 项目源码 | 文件源码

def get_data(rootdir = TIMIT_main_dir): 
    inputs = []
    targets = []
    for dir_path, sub_dirs, files in os.walk(rootdir):
        for file in files:          
            if (os.path.join(dir_path, file)).endswith('.wav'):
                wav_file_name = os.path.join(dir_path, file)
                input_data, f_s = sf.read(wav_file_name)
                # mfcc_feat = MFCC_input(mfcc(input_data,f_s))
                mfcc_feat = mfcc(input_data,f_s)
                #Delta features
                delta_feat = mfcc_feat[:-1]-mfcc_feat[1:]
                #Delta-Delta features
                deltadelta_feat = delta_feat[:-1]-delta_feat[1:]

                #Removing the first two frames
                mfcc_feat = mfcc_feat[2:]
                delta_feat = delta_feat[1:]

                #Concatenating mfcc, delta and delta-delta features
                full_input = np.concatenate((mfcc_feat,delta_feat,deltadelta_feat), axis=1)

                inputs.append(np.asarray(full_input, dtype=theano.config.floatX))#Rakeshvar wants one frame along each column but i am using Lasagne

                text_file_name = wav_file_name[:-4] + '.txt'
                target_data_file = open(text_file_name)
                target_data = str(target_data_file.read()).lower().translate(None, '!:,".;?')
                # target_data = str(target_data_file.read()).lower().translate(str.maketrans('','', '!:,".;?'))
                target_data = target_data[8:-1]#No '.' in lexfree dictionary
                targets.append(target_data)
    return inputs, targets

项目：openEMO 作者：adit-39 | 项目源码 | 文件源码

def read_wavs_trng(emotions, trng_path, pickle_path, use_pickle=False):
    """
        Utility function to read wav files, convert them into MFCC vectors and store in a pickle file
        (Pickle file is useful in case you re-train on the same data changing hyperparameters)
    """
    trng_data = {}
    if use_pickle and os.path.isfile(pickle_path):
        write_pickle = False
        trng_data = pickle.load(open(pickle_path, "rb"))
    else:
        write_pickle = True
        for emo in emotions:
            mfccs = []
            for wavfile in glob.glob(trng_path + '/' + emo + '/*.wav'):
                rate, sig = wvf.read(wavfile)
                mfcc_feat = mfcc(sig, rate)
                mfccs.append(mfcc_feat)
            trng_data[emo] = mfccs
    if write_pickle:
        pickle.dump(trng_data, open(pickle_path, "wb"))
    return trng_data

项目：openEMO 作者：adit-39 | 项目源码 | 文件源码

def test_emo(test_file, gmms):
    """
        NOTE: Use only after training.
        Test a given file and predict an emotion for it.
    """
    rate, sig = wvf.read(test_file)
    mfcc_feat = mfcc(sig, rate)
    pred = {}
    for emo in gmms:
        pred[emo] = gmms[emo].score(mfcc_feat)
    return emotions_nbest(pred, 2), pred

项目：Artificial-Intelligence-with-Python 作者：PacktPublishing | 项目源码 | 文件源码

def run_tests(test_files):
    # Classify input data
    for test_file in test_files:
        # Read input file
        sampling_freq, signal = wavfile.read(test_file)

        # Extract MFCC features
        with warnings.catch_warnings():
            warnings.simplefilter('ignore')
            features_mfcc = mfcc(signal, sampling_freq)

        # Define variables
        max_score = -float('inf') 
        output_label = None 

        # Run the current feature vector through all the HMM
        # models and pick the one with the highest score
        for item in speech_models:
            model, label = item
            score = model.compute_score(features_mfcc)
            if score > max_score:
                max_score = score
                predicted_label = label

        # Print the predicted output 
        start_index = test_file.find('/') + 1
        end_index = test_file.rfind('/')
        original_label = test_file[start_index:end_index]
        print('\nOriginal: ', original_label) 
        print('Predicted:', predicted_label)