譜建模合成

譜建模合成（Spectral modeling synthesis，SMS）是用於語音和其他信號的一種聲學建模方法。 SMS將聲波視作諧波部分和噪聲部分的組合。諧波部分根據信號頻譜中的峰值確定，通常由短時距傅里葉變換發現。去除頻譜成分後剩下的信號（有時稱為殘餘信號，residual）可模擬為通過了時變濾波器的加性高斯白噪聲。則模型的輸出是測得諧波成分的頻率和電平，以及時變濾波器的係數。

直觀地說，該模型可用於多種類型的音頻信號。例如，語音信號包括由聲帶振動引起的緩慢變化的諧波，以及由聲道引起的寬頻、類似噪音的聲音。樂器在敲擊或改變音高時也會產生包含諧波成分的聲音和類似噪音的打擊聲。

SMS analysis & synthesis block diagrams (based on Bonada et al. 2001, Fig.1 & Fig.2)

另見[編輯]

參考文獻[編輯]

Serra, Xavier. Spectral Modeling Synthesis: Past and Present (PDF): 20. 2003 [May 11, 2010]. （原始內容 (PDF)存檔於2010-06-17）.
Serra, Xavier. Spectral Modeling Synthesis Tools. [May 11, 2010]. （原始內容存檔於2021-05-10）.
Smith III, Julius O. Spectral Modeling. 28 December 2005 [April 19, 2008]. （原始內容存檔於2007-07-07）.
Roads, Curtis. Figure 4.23: Overview of spectrum modeling synthesis. .... The Computer Music Tutorial. MIT Press. 1996: 153. ISBN 978-0-262-68082-0.
Bonada, J.; Loscos, A.; Cano, P.; Serra, X.; Kenmochi, H. Spectral Approach to the Modeling of the Singing Voice. In Proc. of the 111th AES Convention. 2001. CiteSeerX 10.1.1.75.2357 .