python 音頻處理_技术 _ 頭條網

音頻預處理

這一講主要介紹些音頻基本處理方式，為接下來的語音識別打基礎。

三種播放音頻的方式

使用 python 播放音頻有以下幾種方式：

os.system()

os.system(file) 調用系統應用來打開文件，file 可為圖片或者音頻文件。

缺點：要打開具體的應用，不能在後臺播放音頻。

pyaudio

安裝：pip install pyaudio

官方提供了播放音頻與錄音的 api ，使用十分方便，只要把Filename更改為你的音頻文件的文字，就可以播放音頻了。

# Python高效編程

"""PyAudio Example: Play a WAVE file."""

import pyaudio

import wave

CHUNK = 1024

FILENAME = '你的音頻文件'

def play(filename = FILENAME):

wf = wave.open(filename, 'rb')

p = pyaudio.PyAudio()

stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),

channels=wf.getnchannels(),

rate=wf.getframerate(),

output=True)

data = wf.readframes(CHUNK)

while data != b'':

stream.write(data)

data = wf.readframes(CHUNK)

stream.stop_stream()

stream.close()

p.terminate()

jupyter notebook

在 jupyer notebook 中播放音頻可以使用以下函數：

import IPython.display as ipd

ipd.Audio(文件名)

幾種讀取音頻的方式

python 有很多讀取音頻文件的方法，內置的庫 wave ，科學計算庫 scipy, 和方便易用的語音處理庫 librosa。

下面將介紹分別使用這幾種庫讀取音頻文件：

安裝：

wave 是內置庫直接導入即可。

scipy: pip install scipy

librosa: pip install librosa

使用：

wave.open:

參數 path 為文件名，mode 為打開方式

以'rb'方式打開文件返回一個 Wave_read 對象，而以'wb'方式打開文件返回一個 Wave_write 對象。

scipy.io.wavfile:

參數 path 為文件名

返回 rate : 採樣率（每秒採樣點的個數），data : 音頻數據

librosa.load:

參數 path 為文件名

返回 y 為音頻數據，sr 為採樣率

# Python高效編程

# read wav file from path

from scipy.io import wavfile

import librosa

import pyaudio

# wave

file = wave.open(path,'rb')

# wavfile

rate, data = wavfile.read(path)

# librosa

y, sr = librosa.load(path)

下面演示一個使用 wavfile 讀取音頻文件並且畫出波形的例子：

首先要計算音頻到底持續了多長時間，wave 的 shape 就是總的採樣點個數，除以採樣頻率可以得到持續的總時間（秒），乘1000得到總持續時間（毫秒）。接著通過 np.linsapce 產生時間的序列，最後使用 matplotlib 畫出圖像。

from scipy.io import wavfile

import matplotlib.pyplot as plt

import numpy as np

%matplotlib inline

# 一秒採樣數

sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')

sample_number = wave.shape[0]

total_time = int(sample_number / sr * 1000)

time_series = np.linspace(0,total_time,sample_number)

fig, ax = plt.subplots(1, 1)

ax.plot(time_series, wave)

ax.set_title('Time*Amplitude')

ax.set_xlabel('Time/ms')

ax.set_ylabel('Amplitude/dB')

Python高效編程

最後再借用 pyaudio 的 api 我們可以實現連續錄音功能：

python 實現錄音功能

其中，函數 multi_record每結束一次錄音會詢問 “是否進行下一次錄音？”，按回車就可以進行下一次錄音了。

import wave

import pyaudio

import matplotlib.pyplot as plt

import time

CHUNK = 1024

FORMAT = pyaudio.paInt16

CHANNELS = 2

RATE = 44100

RECORD_SECONDS = 5

def record(filename='output.wav'):

"""官方錄音教程

"""

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,

channels=CHANNELS,

rate=RATE,

input=True,

frames_per_buffer=CHUNK)

print("* recording")

frames = []

for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):

data = stream.read(CHUNK)

frames.append(data)

print("* done recording")

stream.stop_stream()

stream.close()

p.terminate()

wf = wave.open(filename, 'wb')

wf.setnchannels(CHANNELS)

wf.setsampwidth(p.get_sample_size(FORMAT))

wf.setframerate(RATE)

wf.writeframes(b''.join(frames))

wf.close()

def multi_record(num=3):

"""implement 多次錄音"""

for i in range(1,num+1):

print('第{}次錄音準備'.format(i))

filename = 'record_{}.wav'.format(i)

record(filename)

time.sleep(second)

_ = input('進行下一次錄音？')

def main():

multi_record()

if __name__ == '__main__':

main()

更好的閱讀體驗，請點擊下面的 CSDN 博客地址，或者關注公眾號：Python高效編程。

音頻預處理

相關文章:

Spring源碼分析(一)超級詳細看完秒懂

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪